آمار و احتمال قابلیت اطمینان – آکادمی مهندسی قابلیت اطمینان

آمار و احتمالات مهندسی قابلیت اطمینان

مقدمه

احتمال با پیش‌بینی احتمال رویدادهای آینده سروکار دارد، در حالی که آمار شامل تحلیل فراوانی رویدادهای گذشته است. احتمال در درجه اول یک شاخه نظری از ریاضیات است که پیامدهای تعاریف ریاضی را مطالعه می کند. آمار یک شاخه کاربردی از ریاضیات است که سعی می کند مشاهدات را در دنیای واقعی معنا کند.

جامعه آماری: یک جامعه آماری را می‌توان با شاخص‌های مرکزی میانگین و واریانس (انحراف معیار) توصیف کرد.

نمونه آماری: به دلایل متعدد (هزینه، زمان و تغییر ویژگی جامعه در طول زمان) جامعه آماری را نمی توان به سادگی اندازه گیری و توصیف کرد. بنابراین باید به سراغ نمونه آماری رفت.

قضیه احتمال کل
زمانی که از قبل وقوع یک پیشامد تصادفی را بدانیم، به کمک فرمول‌های احتمال شرطی می‌توانیم مقدار احتمال برای هر پیشامد دیگر را محاسبه کنیم. طبق فرمول احتمال شرطی با در نظر گرفتن اینکه P(B)>0 (یعنی پیشامد B یک پیشامد محال نباشد)، داریم:
P(A|B)=(P(A∩B))/(P(B))
حال اگر فضای نمونه براساس رخداد یا عدم رخداد پیشامد B تفکیک شود، برای بدست آوردن احتمال A ‌ می‌توانیم دو حالت در نظر بگیریم: یا پیشامد B رخداده، یا رخ نداده است. با این کار فضای نمونه را به B و B′ افراز کرده‌ایم (منظور از B′ مکمل پیشامد B است).

محاسبه احتمال براساس افراز

منظور از افراز یک پیشامد مثل B، ایجاد زیرمجموعه‌های مثل B1، B2 و … Bn است به طوری که این پیشامدها دو به دو ناسازگار باشند و اجتماع آن‌ها مجموعه B را بسازد. این موضوع را به زبان ریاضی به صورت زیر می‌نویسیم:
Bi∩Bj=∅,i≠j
B=∪_(i=1)^n B_i
و در این حالت می‌گوییم، Biها یک افراز روی B ایجاد می‌کنند.
با توجه به این تعریف فرض کنید که B و B′ یک افراز رویS باشند. در این صورت احتمال پیشامد A را می‌توانیم به صورت زیر بنویسیم:
P(A)=P(A∩S)=P(A∩(B∪B’)=P(A∩B)+P(A∩B’)
با توجه به قانون ضرب احتمال خواهیم داشت:
P(A)=P(A|B)P(B)+P(A|B’)P(B’)
و در حالت کلی‌تر اگر افراز را ظریف‌تر کنیم،‌ به صورتی که B1,B2,…,Bn یک افراز روی S باشند، آنگاه احتمال پیشامد A به صورت زیر محاسبه می‌شود:

P(A)=∑〖P(A|Bi)P(Bi)〗
که به این رابطه، قضیه یا فرمول احتمال کل گفته می‌شود.

مثال

قطعاتی از 3 تامین‌کننده S₂, S₁ و S₃ به ترتیب به تعداد 1000، 600 و 400 قطعه خریداری می‎شوند. احتمال معیوب بودن یک قطعه عبارت است از 006/0 برای S₁ ، 02/0 برای S₂ و 03/0 برای S₃ . قطعات، بدون در نظر گرفتن منبع‌آن‌ها، در یک کانتینر معمولی نگهداری می‌شوند. احتمال این که یک قطعه که به طور تصادفی از موجودی انتخاب شده، معیوب باشد، چقدر است؟ (منبع: کتاب بیرولینی)

احتمال شرطی(Conditional Probability)

مثال

2 قطعه از یک محموله حاوی 95 قطعه سالم و 5 قطعه معیوب انتخاب می شوند. احتمال این که:
1) هیچ قطعه خرابی بین این دو نباشد و 2) دقیقا یکی از آنها معیوب باشد، چقدر است؟ (بیرولینی،499)
جواب1-A اولین قطعه سالم، B دومین قطعه سالم

قضیه ضرب برای دو رخداد مستقل

رخدادهای A و B مستقل هستند اگر اطلاعات در مورد وقوع (یا عدم وقوع) یک رخداد هیچ تاثیری بر احتمال وقوع خرابی رخداد دیگر نداشته باشد. در این صورت:
P(A∩B)=P(A).P(B)
مثال
سیستمی شامل دو عنصر E1 و E2 است که برای انجام وظیفه الزامی ضروری هستند. وقوع خرابی یک عنصر تاثیری بر عنصر دیگر ندارد. اگر R1=0.8 قابلیت اطمینان E1 و R2=0.9 قابلیت اطمینان E2 باشد، قابلیت اطمینان سیستم RS چقدر است؟

مثال
محموله ای حاوی 100 دیود شامل 3 دیود دارای اتصالی (خرابی به دلیل اتصال کوتاه شدن) و 2 دیود مدار باز است. اگر یک دیود به طور تصادفی از محموله انتخاب شود، احتمال معیوب بودن آن چقدر است؟

قضایای مربوط به احتمال کلاسیک:

اگر (1A∁B→P(A)≤P(B)
اگر (2A=B→ P(A)=P(B)
اگر (3 P(∅)=0⤏P(S)=1
اگر (4A∁S→P(A)=(n(A))/(n(S))
5) اگر A و B دو پیشامد دلخواه باشند آنگاه:
P(A∪B)=P(A)+P(B)-P(A∩B)
مثال
از نمونه‌های شامل ۲۰۰ لامپ سفید که 8 تای آنها معیوب است و ۱۵۰ لامپ سبز که 9 تای آنها معیوب می باشد 1 لامپ را به تصادف انتخاب می¬کنیم. مطلوب است احتمال آنکه این لامپ سفید یا معیوب باشد.

1) توزیع برنولی:

فرض کنید در یک آزمایش پیشامد A امکان وقوع داشته باشد به طوری که P(A)=p و امکان عدم وقوع آن یعنی P(Á)=q واضح است که A و Á دو پیشامد متمم هستند یعنیP(A)+P(Á)=p+q=1 چنین آزمایشی را ، آزمایش برنولی گویند.

اگر متغیر تصادفی X را طوری تعریف کنیم که اعداد 1 و0 را به ترتیب برای پیروزی و شکست قبول کند یعنی پیروزی X=1 و شکست X=0 باشد، متغیر تصادفی X نشان دهنده تعداد پیروزیها در یک آزمایش باشد آنگاه تابع احتمال X عبارت است از:

f(1)=P(X=1)=P

f(0)=P(X=0)=1-P

که در آن0≤p≤1، احتمال پیروزی می باشد پس:

2) توزیع دوجمله ای Binomial Distribution

متغیر تصادفی دو جمله‌ای از حاصل جمع n متغیر تصادفی برنولی ساخته می‌شود،‌ پس مجموع n متغیر تصادفی برنولی مستقل با پارامتر یکسان، دارای توزیع دو جمله‌ای است و اگر X چنین متغیر تصادفی باشد می‌توان نوشت کهX دارای توزیع دو جمله‌ای با پارامترهای n و p است. پس مجموعه مقادیر متغیر تصادفی به صورت {0,1,2,…,n} خواهد بود. فرم تابع احتمال برای متغیر تصادفی دو جمله‌ای با پارامترهای n و p به صورت زیر است:

P(X=x)= (n¦x) p^x 〖(1-p)〗^((n-x))=(n¦x) p^x q^((n-x)) ,x=0,1,2,…,n

که منظور از (n¦x)ترکیب x از n است که به فرم زیر محاسبه می‌شود:

(n¦x)=n!/(x!(n-x)!)

در تابع احتمال بالا مشخص است که تعداد x موفقیت با احتمال p برای هر کدام و تعداد n-x‌ شکست با احتمال رخداد1−p وجود دارد. به نظر می‌رسد تنها ترکیب قرارگیری این موفقیت‌ها و شکست‌ها که همان ضرایب دو جمله‌ای است، برای کامل کردن تابع احتمال لازم است.

P-Value چیست؟

P-value به زبان ساده نشان می‌دهد که اگر فرض صفر ( $H_{0}$ ) درست باشد، احتمال مشاهده داده‌هایی که مساوی یا بیشتر از داده‌های فعلی، غیرعادی هستند، چقدر است.

به بیان دیگر:

اگر $P$ -value کوچک باشد (مثلاً کمتر از 0.05)، به این معناست که مشاهده داده‌ها تحت فرض صفر خیلی غیرعادی است.
اگر $P$ -value بزرگ باشد (مثلاً بیشتر از 0.05)، به این معناست که داده‌ها تحت فرض صفر منطقی و عادی هستند.

ارتباط P-value با آلفا ()

آلفا سطح معناداری (Significance Level) است که شما از پیش تعیین می‌کنید (مثلاً 0.05 یا 5%). این مقدار مشخص می‌کند که چقدر آماده‌اید تا یک خطای نوع اول (رد کردن اشتباه فرض صفر) را بپذیرید.

ارتباط:

اگر $P$ -value کمتر از آلفا باشد ( $P$ -value < ): فرض صفر را رد می‌کنیم (داده‌ها نشان می‌دهند که فرض صفر نادرست است).
اگر $P$ -value بزرگتر یا مساوی آلفا باشد ( $P$ -value ≥ ): فرض صفر را رد نمی‌کنیم (داده‌ها به اندازه کافی شواهد برای رد فرض صفر ندارند).

محاسبه P-value

برای محاسبه P-value، ابتدا باید یک آزمون آماری مناسب انتخاب کنید و سپس مراحل زیر را طی کنید:

1. تعریف فرضیات آماری

فرض صفر ( $H_{0}$ ): بیانگر وضعیتی است که می‌خواهیم آن را تست کنیم (معمولاً فرض بر عدم وجود تفاوت یا تأثیر).
فرض جایگزین ( $H_{a}$ ): بیانگر حالتی است که اگر داده‌ها فرض صفر را رد کنند، پذیرفته می‌شود.

2. انتخاب آزمون آماری مناسب

بر اساس نوع داده‌ها و فرضیات، آزمون آماری مناسب انتخاب می‌شود:

آزمون t (یک یا دو نمونه) برای مقایسه میانگین‌ها.
آزمون z برای مقایسه نسبت‌ها یا داده‌های بزرگ.
آزمون کای‌دو () برای وابستگی بین متغیرها.
آزمون ANOVA برای مقایسه میانگین‌های چند گروه.

محاسبه آماره آزمون (Test Statistic)

فرمول یا رابطه مربوط به آزمون انتخابی را استفاده کنید. مثلاً:

برای آزمون t یک نمونه: $\frac{\bar{x} – \mu}{\frac{s}{\sqrt{n}}}$ که در آن:

- : میانگین نمونه.
- μ: میانگین جامعه تحت فرض صفر.
- s: انحراف معیار نمونه.
- n: حجم نمونه.

4. محاسبه P-value از آماره آزمون

پس از محاسبه مقدار آماره آزمون، $P$ -value به صورت زیر محاسبه می‌شود:

از جداول آماری: برای آزمون مربوطه (t، z، کای‌دو و غیره) مقدار $P$ -value را پیدا کنید.
از نرم‌افزارها یا ابزارهای آماری: مانند Excel، Python، SPSS، R، یا Minitab که $P$ -value را به صورت خودکار محاسبه می‌کنند.

5. تفسیر P-value

$P$ -value محاسبه شده را با سطح معناداری () مقایسه کنید تا تصمیم‌گیری شود که آیا فرض صفر را رد کنیم یا نه.

مثال ساده

فرض کنید می‌خواهید بررسی کنید که آیا میانگین وزن یک گروه خاص 70 کیلوگرم است. داده‌ها به شرح زیر است:

میانگین نمونه ( $ˉ$ ) = 72
انحراف معیار ( $s$ = 5
تعداد نمونه ( $n$ ) = 30
فرض صفر: میانگین وزن برابر 70 است ( $H0:μ=70H_0: \mu = 70$ ).

محاسبه آماره t:

$\frac{\bar{x} – \mu}{\frac{s}{\sqrt{n}}} = \frac{72 – 70}{\frac{5}{\sqrt{30}}} \approx 2.19$

محاسبه $P$ -value:

با استفاده از جدول t یا نرم‌افزار: -value حدود 0.036 است.
چون $P$ -value < $α = 0.05$ ، فرض صفر رد می‌شود.

ابزارهای رایج برای محاسبه $P$ -value

Excel:
- برای آزمون t:
  $‘ = T . D I ST .2 T (2.19, 29) ‘$
- برای آزمون z:
  $‘ = NORM . S . D I ST (z, TR U E) ‘$
Python (کتابخانه scipy):
python
from scipy.stats import t p_value = t.sf(abs(2.19), df=29) * 2 # دوطرفه print(p_value)

این ابزارها محاسبه را بسیار ساده‌تر می‌کنند!

وقتی از آماره آزمون test statisticو مقادیر بحرانی critical valuesبرای قبول یا رد فرض صفر استفاده می کنیم، چه نیازی به محاسبه p-value می باشد؟

استفاده از آماره آزمون و مقادیر بحرانی برای تصمیم‌گیری درباره فرض صفر کافی است. اما P-value مزایای بیشتری دارد که در زیر توضیح می‌دهم:

تفاوت‌های اصلی و نقش P-value

مقادیر بحرانی (Critical Values):
- شما قبل از آزمون، سطح معناداری (α) را تعیین می‌کنید (مثلاً 0.05).
- سپس آماره آزمون را محاسبه کرده و با مقدار بحرانی مقایسه می‌کنید.
- اگر آماره آزمون از مقدار بحرانی بیشتر باشد (برای آزمون یک‌طرفه) یا خارج از بازه بحرانی باشد (برای آزمون دوطرفه)، فرض صفر رد می‌شود.
P-value:
- نشان می‌دهد که اگر فرض صفر درست باشد، احتمال وقوع مقدار آماره آزمون محاسبه‌شده یا مقداری شدیدتر از آن چقدر است.
- به جای مقایسه با یک مقدار بحرانی ثابت، به شما اطلاعات دقیق‌تری درباره شدت شواهد علیه فرض صفر می‌دهد.

مزایای استفاده از P-value در کنار مقادیر بحرانی

انعطاف‌پذیری در سطوح معناداری

با مقادیر بحرانی، تصمیم‌گیری فقط برای یک سطح از α (مثلاً 0.05) انجام می‌شود. اما با P-value:

می‌توانید برای هر سطح معناداری، تصمیم بگیرید (مثلاً 0.01، 0.10، و غیره).
نیازی به محاسبه مقدار بحرانی جداگانه برای هر α ندارید.

اطلاعات دقیق‌تر درباره شدت شواهد

مقادیر بحرانی فقط نشان می‌دهند که فرض صفر رد می‌شود یا نه.
اما P-value شدت شواهد علیه فرض صفر را مشخص می‌کند:
- مقدار کوچک‌تر P-value (<0.01) نشان‌دهنده شواهد قوی‌تر علیه فرض صفر است.
- مقدار نزدیک به α شواهد ضعیف‌تری را نشان می‌دهد.

تفسیر آسان‌تر در مقالات و گزارش‌ها

در گزارش‌های علمی و صنعتی، ذکر P-value بیشتر مرسوم است، زیرا به خواننده امکان می‌دهد خودش تصمیم بگیرد که بر اساس سطح معناداری دلخواه چه نتیجه‌ای بگیرد.

قابل استفاده در روش‌های چندگانه آزمون (Multiple Testing)

در تحلیل‌هایی با چندین آزمون آماری (مانند مقایسه چند گروه)، P-value به شما کمک می‌کند که خطاهای آماری (مانند خطای نوع اول) را کنترل کنید.

تفاوت‌های اصلی

ویژگی	$P$ -Value	مقدار بحرانی (Critical Value)
تعریف	احتمال مشاهده آماره آزمون یا مقدار افراطی‌تر.	مرزی ثابت برای تصمیم‌گیری بر اساس .
روش محاسبه	از آماره آزمون و توزیع آن.	از و جدول توزیع مربوطه.
کاربرد	اندازه شدت شواهد علیه فرض صفر را می‌دهد.	برای تصمیم‌گیری مستقیم درباره رد یا قبول $H_{0}$ .
انعطاف‌پذیری	برای هر سطح قابل استفاده است.	فقط برای سطح از پیش تعیین‌شده .

آیا همیشه به P-value نیاز داریم؟

اگر آزمون را صرفاً برای یک سطح خاص از α انجام می‌دهید و فقط تصمیم‌گیری (رد یا عدم رد) اهمیت دارد، استفاده از مقادیر بحرانی کافی است.

اما در موارد زیر، P-value مفیدتر است:

وقتی بخواهید شدت شواهد را بررسی کنید.
وقتی بخواهید تصمیم‌گیری را برای چندین سطح از α انجام دهید.
در گزارش‌ها و مستندات، برای شفافیت بیشتر نتایج.

کد نمونه برای محاسبه P-Value با Python (کتابخانه SciPy)

python

این کد $P$ -value آزمون دوطرفه را بر اساس $= 2.19$ و محاسبه می‌کند.

نتیجه گیری

استفاده از مقادیر بحرانی برای تصمیم‌گیری سریع و ساده کافی است، اما P-value اطلاعات عمیق‌تر و انعطاف‌پذیری بیشتری فراهم می‌کند و در تحقیقات علمی و گزارش‌های حرفه‌ای بسیار کاربردی‌تر است.

آمار و احتمالات مهندسی قابلیت اطمینان

محاسبه احتمال براساس افراز

مثال

احتمال شرطی(Conditional Probability)

مثال

قضایای مربوط به احتمال کلاسیک:

P-Value چیست؟

ارتباط P-value با آلفا (α)

محاسبه P-value

1. تعریف فرضیات آماری

2. انتخاب آزمون آماری مناسب

4. محاسبه P-value از آماره آزمون

5. تفسیر P-value

مثال ساده

محاسبه آماره t:

محاسبه PPP-value:

ابزارهای رایج برای محاسبه PPP-value

تفاوت‌های اصلی

کد نمونه برای محاسبه P-Value با Python (کتابخانه SciPy)

python

دیدگاهتان را بنویسید لغو پاسخ

ارتباط P-value با آلفا ()

محاسبه $P$ -value:

ابزارهای رایج برای محاسبه $P$ -value