Bài 7: Xác xuất có điều kiện - Định luật nhân xác suất

XÁC SUẤT CÓ ĐIỀU KIỆN - ĐỊNH LUẬT NHÂN XÁC SUẤT

Mục tiêu
Sau khi nghiên cứu chủ đề, học viên có khả năng:
- Trình bày định nghĩa của xác suất có điều kiện
- Trình bày công thức cộng xác suất và công thức nhân xác suất

1. Xác suất có điều kiện

Nếu các kết cục có thể không bao gồm toàn thể các kết cục (khi một số kết cục bị hạn chế)  thì xác suất có thể được gọi là xác suất có điều kiện.
Xác xuất có điều kiện

Xác suất có điều kiện được kí hiệu P (đặc tính quan tâm|Điều kiện)

Bảng 2. Giới tính của bệnh nhân của khoa Phổi và khoa Thận bệnh viện X

Khoa Phổi
Khoa Thận
Tổng số
Nam
11
4
15
Nữ
27
8
35
Tổng số
38
12
50

Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng. Chọn một người bất kì, xác suất người là nam  và nằm ở khoa Phổi - P(Nam và Khoa Phổi)- có phải là xác suất có điều kiện hay không? Hãy tính xác suất này.

Chọn một người bất kì, Xác suất người là nam  và nằm ở khoa Phổi - P (Nam và Khoa Phổi) – không phải là xác suất có điều kiện bởi vì các kết cục không có hạn chế  (ai cũng có thể được chọn).  

N: Số kết cuộc có thể là 50; m: số các kết cuộc thuận lợi cho 11; 
P (Nam và Khoa Phổi) =  

Thí dụ: Chọn một người nam, xác suất người này nằm ở khoa Phổi có phải là xác suất có điều kiện hay không? Hãy tính xác suất này.

Chọn một người nam, xác suất người này nằm ở khoa Phổi là xác suất có điều kiện bởi vì số kết cục bị hạn chế (chỉ có bệnh nhân nam được chọn và như vậy kết cục chỉ có thể là 1 trong số 15 bệnh nhân nam)

Nc: Số kết cuộc có thể là 15; m: số các kết cuộc thuận lợi cho 11; 
Xác suất người này nằm ở khoa Phổi  với điều kiện người này là nam giới = P (Khoa Phổi|Nam) =  

Lưu ý: Xác suất có điều kiện được kí hiệu P(đặc tính quan tâm|Điều kiện) và điều kiện này phải đúng cho cả kết cục thuận lợi (m) và kết cục có thể (Nc). Trong thí dụ trên 11 kết cục thuận lợi vừa đòi hỏi điều kiện là nam giới và đặc tính là nằm ở khoa phổi và 15 kết cục có thể đòi hỏi điều kiện là nam giới. Thể hiện nhận xét bằng công thức:
 

n(A∩B ) là số kết cục thoả điều kiện A và đặc tính B và n(A) số kết cục thoả điều kiện A
Thí dụ: Chọn một bệnh nhân ở khoa Thận, tính xác suất bệnh nhân này là nữ.
Đây là xác suất có điều kiện. P(nữ|khoa Thận) =  =   =   = 0,75

Thí dụ: Theo bản báo cáo “Số ca nghi nhiễm SARS tích luỹ” của Tổ Chức Y tế Thế Giới https://www.who.int/csr/sars/country/2003_05_17/en/, Số ca bệnh SARS (Hội chứng Hô hấp cấp tính trầm trọng) từ ngày 1/10/2002 đến ngày 17/5/2003 là 7761 với 623 trường hợp tử vong. Xác suất tử vong của những người mắc SARS là xác suất có điều kiện: (cả 623 ca tử vong và 7761 ca bệnh đều mắc SARS).

P(tử vong|SARS)= 

Xác suất có điều kiện này (Xác suất tử vong ở những người mắc một bệnh cụ thể nào đó) được gọi là tỉ suất chết/mắc của bệnh đó (case-fatality rate).

Thí dụ: Trong một dân số, tỉ lệ những người có dấu hiệu lách to là 20%, những người vừa sốt rét vừa lách to là 18%, những người bị sốt rét là 23%. Một người ngẫu nhiên từ dân số đó, người này không có dấu hiệu lách to. Tính khả năng người này bị sốt rét? 

Bài giải: 
P(sốt rét|lách không to) = P(sốt rét và lách không to) / P(lách không to) 
= [P(sốt rét) - P(sốt rét và lách to)]/ P(lách không to) 
= (0.23-0.18)/0.8  =  0.05/0.8 =0.0625

2. Ðịnh luật nhân xác suất

Từ phương trình (5) ta có thể xây dựng công thức:
P(A∩B) = P(A) x  P(B|A)
P(AB) = P(BA) =P(B) x  P(A|B) 

Công thức này được gọi là định lí nhân xác suất.

Thí dụ: Nếu xác suất mắc bệnh lao, P(Lao) = 0,001 và xác suất chết/mắc của bệnh Lao, P(chết|Lao) = 0,1. Xác suất chết vì bệnh lao:
P(Lao và Chết) =  P(Lao) x  P(Chết | Lao) = 0,001 x 0,1 = 0,0001

Tính độc lập

Một trong những khái niệm quan trọng trong lí thuyết xác suất là tính độc lập (independence). Hai biến cố A và B được gọi là độc lập nếu P(B|A) = P(B), hoặc suy ra từ (6) nếu 
P(A∩B) = P(A) x  P(B)

Ý nghĩa của định nghĩa theo xác suất có điều kiện là xác suất của B không thay đổi dù có hay không có điều kiện A. Từ phương trình (7) chúng ta có thể suy ra là tính độc lập có tính chất đối xứng (nếu A độc lập với B thì B độc lập với A và ngược lại).

Thí dụ: 
Giả sử
Xác suất bị chấn thương giao thông trên dân  số chung = P(chấn thương giao thông) =0,01
Xác suất bị chấn thương giao thông ở người hút thuốc lá = P(chấn thương giao thông | hút thuốc lá) = 0,01
Khi đó chấn thương giao thông và hút thuốc lá là hai biến cố độc lập.

Giả sử
Xác suất bị chấn thương giao thông trên dân  số chung = P(chấn thương giao thông) =0,01
Xác suất bị chấn thương giao thông ở người nghiện rượu = P(chấn thương giao thông | nghiện rượu) = 0,03
Khi đó chấn thương giao thông và nghiện rượu là hai biến cố không độc lập
Khi biến cố A không độc lập với biến cố B thì:
- A => B hoặc
- B => A hoặc
- Có một yếu tố ảnh hưởng đến cả A và B (yếu tố này được gọi là yếu tố gây nhiễu).

Do đó nếu chúng ta có thể chứng minh P(B) ≠ P(B|A)  ≠ P(B|Ac) (A và B không độc lập) và chúng ta loại trừ được các mệnh đề
- B => A (bằng cách biện luận về thời gian)
- Yếu tố gây nhiễu ảnh hưởng đến cả A và B 

Nghĩa là chúng ta có chứng cớ (evidence) của mệnh đề A=>B.
Đây là cách lập luận thường được sử dụng trong nghiên cứu xác định nguyên nhân hay yếu tố nguy cơ.

Tính loại trừ của 2 biến cố

Nếu hai biến cố A và B không bao giờ xảy ra đồng thời người ta gọi biến cố A và B loại trừ lẫn nhau. 

Thí dụ bệnh nhân không bao giờ bị nhiễm sán dải và sán dải heo cùng lúc nên việc nhiễm sán dải bò và sán dải heo là 2 biến cố loại trừ lẫn nhau. Trong thửu nghiệm tung xúc xắc, biến cố  ra mặt chẵn  và biến cố ra mặt 3 là biến cố loại trừ lẫn nhau.

Cần lưu ý hai biến cố loại trừ lẫn nhau không phải là 2 biến cố độc lập mà thực chất là 2 biến cố phụ thuộc lẫn nhau. Biến cố A xảy ra phụ thuộc vào việc không xảy ra biến cố B và ngược lại.

3. Công thức cộng xác suất tổng quát

Thí dụ: Ở khoa Phổi và khoa Thận của bệnh viện X có 50 bệnh nhân và phân bố của các đặc điểm của bệnh nhân này được trình bày trong bảng ở đầu chương. Chọn một người bất kì, hãy tính xác suất người là nam  hay nằm ở khoa Phổi - P(Nam hay Khoa Phổi):

P(Nam hay Khoa Phổi)= 

P(Nam hay Khoa Phổi)=  =  P(Phổi)+P(Nam)-P(Phổi và Nam)

Một cách tổng quát, nếu AB ≠ Ø thì chúng ta có 
P(A∪B) = P(A) + P(B) – P(A∩B) (8)

Nếu hai biến cố A và B loại trừ lẫn nhau thì chúng ta có thể tính được xác suất xảy ra A hay B dựa trên nguyên lí cộng tính:
P(A∪B) = P(A) + P(B)

Đây là công thức cộng xác suất tổng quát. Sau đây là tổng kết công thức nhân và cộng xác suất tuỳ theo mối quan hệ giữa 2 biến số A và B
Quan hệ giữa biến cố A và B
Định luật Nhân xác suất
P(AÇB)
Định luật Cộng xác suất
P(AÈB)
Không đặc biệt (không độc lập và không loại trừ)
=P(A)´P(B|A)
= P(A) + P(B) – P(AÇB)
Độc lập
= P(A)´P(B)
= P(A) + P(B) – P(A)´P(B)
Loại trừ
= 0
= P(A) + P(B)

4. Công thức xác suất toàn phần và định lí Bayes

Nếu biến cố B phụ thuộc vào biến cố A – P(B) ≠ P(B|A) – thì xác suất của biến cố B phụ thuộc vào xác suất của biến cố A. Khi đó xác suất xảy ra B (Ac là biến cố đối lập của biến cố A và được đọc là không A)

Công thức này được gọi là công thức xác suất toàn phần (law of total probability). Áp dụng công thức này trong trường hợp ung thư phụ thuộc vào hút thuốc lá chúng ta có: Xác suất ung thư = Xác suất hút thuốc lá x xác suất ung thư khi hút thuốc lá + Xác suất không hút thuốc lá x xác suất ung thư khi không hút thuốc lá.

Tính xác suất A trên điều kiện B  - P(A|B) và thay mẫu số với công thức xác suất toàn phần ta được
 
Công thức này được gọi là định lí Bayes. Lí giải công thức này trong trường hợp hút thuốc lá tăng nguy cơ ung thư phổi như sau. Xác suất một người hút thuốc lá khi biết người này bị ung thư phổi bằng với tỉ lệ với xác suất vừa hút thuốc vừa ung thư phổi trong xác suất bị ung thư phổi.

5. Biến số ngẫu nhiên

Khi chúng ta tiến hành phép thử, chúng ta thường không quan tâm đến chi tiết của biến cố mà chỉ quan tâm giá trị của một đại lượng nào đó được xác định bởi kết cục của phép thử. Thí dụ, khi chúng ta gieo 3 con xúc xắc, có thể chúng ta không quan tâm đến con xúc xắc nào ra mặt mấy mà chỉ quan tâm đến tổng số điểm  của 3 con xúc xắc. Hay khi chúng ta mua vé số, chúng ta chỉ quan tâm đến số tiền mà chúng ta trúng được (hay số tiền bị mất) sau khi đã có kết quả xổ số.

Đại lượng mà giá trị của nó được xác định bởi  kết cục của phép thử  ngẫu nhiên được gọi là biến số ngẫu nhiên. Biến số ngẫu nhiên thường được kí hiệu bằng chữ in hoa (như X, Y,..). Biến số ngẫu nhiên X của biến cố e được kí hiệu là  X(e). Các thí dụ khác về biến số ngẫu nhiên gồm:

Thí dụ: Một người đặt một con số gồm 2 chữ số. Sau đó người ta tiến hành quay số để có kết quả là một số 2 chữ số. Như vậy phép thử sẽ có 100 kết cuộc là con số 00,01,02,03,...,99. Nếu kết cuộc trùng với con số được đặt, người đặt sẽ được 70 đồng. Nếu kết cuộc không trùng với con số được đặt, người đặt sẽ bị mất 1 đồng. Như vậy có 99 kết cục tương ứng với giá trị -1 và 1 kết cục tương ứng với giá trị 70. -1 và 70 là các giá trị của biến số ngẫu nhiên X “số tiền thu được”. Ta có thể tính được P(X=-1)=0,99 và P(X=70)=0,01

- Theo dõi 100 người nghiện chích ma tuý chưa bị nhiễm HIV, số người bị nhiễm HIV sau 1 năm là biến số ngẫu nhiên
- Điều trị cho 15 ca bệnh SARS, số ca tử vong trong số 15 ca bệnh này là biến số ngẫu nhiên
- Một gia đình  có 1 đứa con, số con trai trong gia đình này là biến số ngẫu nhiên.
- Đo chiều cao của một người, chiều cao người này là biến số ngẫu nhiên

6. Vọng trị 

Nếu chúng ta không quan tâm đến chi tiết, chúng ta sẽ gán cho mỗi kết cục một giá trị của biến số ngẫu nhiên và khi đó chúng ta sẽ gán cho phép thử một giá trị gọi là vọng trị. Hãy trở lại với ví dụ về phép thử quay số (gồm 2 chữ số) được đưa ra trong phần biến số ngẫu nhiên. Phép thử này có nhiều kết cục và các kết cục tương ứng với -1 và 70 là giá trị của biến số ngẫu nhiên “số tiền thu được”. Giả sử một người chơi trò chơi này rất nhiều lần (N lần) thì người số tiền người đó thu được sau N lần chơi:

70 x N x 0,01 – 1 x N x 0,99 = N x (0,70 – 0,99) = -0,29 x N

Như vậy trung bình mỗi lần chơi người đó bị thu được 
(-0,29 x N)/N=0,29 đồng

Con số này được gọi là vọng trị của trò chơi. Một cách tổng quát vọng trị của phép thử là trung bình của biến số ngẫu nhiên nếu phép thử được lập lại nhiều lần và vọng trị của biến số ngẫu nhiên X được kí hiệu là E(X)

E(X)=X(e1)P(e1) + X(e2)P(e2) +...

Bài tập
Ðịnh luật nhân và cộng xác suất

1. Trong một nhóm gồm 502 người có phân phối nhóm máu và giới tính như sau:

Giới tính


Nhóm máu
Nam
Nữ
Tổng số
O
113
113
226
A
103
103
206
B
25
25
50
AB
10
10
20
Tổng số
251
251
502

1a. Nếu một người được chọn ngẫu nhiên từ nhóm người này. Tính xác suất người này có nhóm máu O? xác suất người này có nhóm máu A? Xác suất người này có nhóm máu B? Xác suất người này có nhóm máu AB?

1b. Giới tính và nhóm máu có độc lập với nhau không? Chứng minh.

2. Xác suất một bệnh nhân được chọn từ một bệnh viện là nam là 0,6. Xác suất một bệnh nhân nam và ở khoa ngoại là 0,2. Một bệnh nhân được chọn ngẫu nhiên từ bệnh viện và người ta biết rằng đó là bệnh nhân nam. Tính xác suất bệnh nhân đó ở khoa ngoại.

3. Trong dân số của một bệnh viện, xác suất một bệnh nhân được chọn ngẫu nhiên là có bệnh tim là 0,35. Xác suất bệnh nhân bệnh tim là hút thuốc lá là 0,86. Tính xác suất một bệnh nhân được chọn ngẫu nhiên là người hút thuốc lá và mắc bệnh tim?

4. Một nhà nghiên cứu muốn ước tính tỉ lệ tiêm chủng ở trẻ em dưới 2 tuổi trong tỉnh X bằng phương pháp lấy mẫu PPS (probability proportionate to size) gồm 2 bước.  

Bước 1:  lên danh sách tất cả các xã trong tỉnh rồi chọn trong danh sách đó 30 xã.  
Bước 2: chọn ngẫu nhiên 7 đứa trẻ dưới 2 tuổi trong mỗi xã được chọn để điều tra về tình hình tiêm chủng của đứa trẻ đó.

Giả sử trong tỉnh có xã A có 100 trẻ dưới 2 tuổi và xã B có 40 trẻ dưới 2 tuổi.
a. Nếu trong bước 1 đã chọn xã A, tính xác suất một đứa trẻ dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu

b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, tính xác suất một đứa trẻ dưới 2 tuổi của xă A được chọn đưa vào nghiên cứu

c. Giả sử xác suất xã B được chọn đưa vào nghiên cứu  là 0,1, tính xác suất một đứa trẻ dưới 2 tuổi của xã B được chọn đưa vào nghiên cứu
Bài giải

1a. Theo công thức
Với N là số các biến cố có thể và m số các biến cố thuận lợi.
Khi chọn ngẫu nhiên một người ta có thể có 502 kết cuộc khác nhau (Số biến cố có thể N=502). Trong việc tính xác suất người có nhóm máu O, biến cố thuận lợi là biến cố chọn được người có nhóm máu O. Như vậy có 226 biến cố thuận lợi trong trường hợp này.
Xác suất người này có nhóm máu O là = 226/502=0,45
Tương tự
Xác suất người này có nhóm máu A là = 206/502=0,41
Xác suất người này có nhóm máu B là = 50/502=0,10
Xác suất người này có nhóm máu O là = 20/502=0,04

1b. Biến cố A độc lập với biến cố B khi (A|B)=P(A) hay chứng minh P(B|A)=P(B). Như vậy Nhóm máu và giới tính là độc lập với nhau bởi vì:
P(máu O | Nam)=113/251= 0,45 = P(máu O)
P(máu A | Nam)=103/251= 0,41 = P(máu A)
P(máu B | Nam)=25/251= 0,10 = P(máu B)
P(máu AB | Nam)=10/251= 0,04 = P(máu AB)

2. Áp dụng công thức P(A|B)=P(A(B)/P(B); với A là biến cố bệnh nhân ở khoa Ngoại và B là biến cố bệnh nhân là bệnh nhân nam ta có:
P(ngoại|nam)=P(ngoại(nam)/P(nam)= 0,2/0,6 = 0,33

3. Áp dụng công thức P(A(B) = P(A).P(B|A) = P(B).P(B|A) ta có
P(hút thuốc(bệnh tim)=P(bệnh tim) x P(hút thuốc|bệnh tim)
= 0,35 x 0,86 = 0,301

4. Ta kí hiệu đứa trẻ quan tâm là m
a. Nếu trong bước 1 đã chọn xã A, xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu = P(chọn m| chọn A) = 7/100 = 0,07

b. Nếu chúng ta không biết xã A có được chọn đưa vào nghiên cứu hay không, xác suất một đứa trẻ m dưới 2 tuổi của xã A được chọn đưa vào nghiên cứu = P(chọn m và chọn A) =  P(chọn A) x P (chọn m| chọn A) = 0,07  x P(chọn A)


No comments:

Post a Comment