Nguyễn Văn Tuấn: Câu chuyện OJ Simpson và xác suất trong toà án

Simpson tại tòa, đang thử đôi găng tay vào ngày 15/6/1995

Ngày 10/4/2024, ngôi sao banh banh bầu dục và có thời làm tài tử điện ảnh là OJ Simpson (hình) qua đời ở tuổi 76. Câu chuyện của anh ấy cho ra nhiều bài học, trong đó có một bài học về diễn giải xác suất trong toà án vốn là chủ đề của biết bao bài báo và bài giảng cho sinh viên thời đó. Tôi tóm tắt ‘câu chuyện’ như sau: 

Năm 1995, O.J Simpson bị truy tố về tội giết Nicole Brown Simpson (vợ cũ của anh ấy), và Ron Goldman (là bạn trai của vợ cũ anh ấy). Cả hai nạn nhân đều bị phát hiện có nhiều vết dao. Điều đáng ngạc nhiên là toà án đã kết luận rằng OJ Simpson vô tội trong vụ án. Tuy nhiên, sau này một phiên toà dân sự kết luận rằng anh ấy phải ‘chịu trách nhiệm’ về cái chết của người vợ cũ. 

Đã có nhiều bình luận chung quanh lời tuyên vô tội của toà án. Người ta bàn về sự thiên vị cảm tính của bồi thẩm đoàn đến sự thiếu năng lực của bên truy tố. Nhưng một vấn đề quan trọng là cách diễn giải xác suất trong phiên toà. 

Công tố viên bỏ ra 10 ngày đầu của phiên tòa để trình bày chứng cứ cho thấy OJ Simpson có tiền sử bạo hành vợ cũ của mình. Họ lập luận rằng có mối liên quan giữa bạo hành và động cơ sát nhân. Họ cũng lí giải rằng OJ Simpson là thủ phạm giết vợ cũ và bạn trai của vợ cũ. 

Luật sư Alan Dershowitz đại diện cho OJ Simpson phản bác lập luận của công tố viên. Ông Dershowitz cho rằng các cáo buộc của công tố viên không có liên quan gì cả. Ông đưa ra con số xác suất rằng cứ 2500 người đàn ông bạo hành vợ thì chỉ có 1 người sát hại vợ của họ. Nói cách khác, xác suất mà một người như OJ Simpson giết vợ là 1/2500 (0.0004), tức là rất thấp. Con số này có vẻ thuyết phục bồi thẩm đoàn. 

Cách lí giải của Dershowitz thuộc hạng ‘thông minh’, và con số ông đưa ra cũng không sai (ông dựa vào thống kê của ngành tư pháp Mĩ). Nhưng Dershowitz đã đưa ra một câu hỏi sai. Ông ấy hỏi: 

‘Trong số những người bạo hành vợ, có bao nhiêu người sẽ sát hại vợ’

Nhưng câu hỏi đó sai. Sai là vì không phải là ‘sẽ’ mà là ‘đã’. Nói cách khác, sự việc ĐÃ xảy ra rồi. Do đó, câu hỏi đúng và hợp lí là: 

‘Xác suất một người đàn ông ĐÃ sát hại vợ, nếu anh ta trước đó đã có tiền sử bạo hành, và cô ấy đã bị ai đó sát hại’. 

Câu trả lời cho câu hỏi này phải cần đến Định lí Bayes. Mô tả Định lí Bayes bằng công thức thì nhiêu khê lắm và có thể làm cho các bạn rối rắm, nên tôi sẽ mô tả bằng chữ cho dễ hiểu. Tưởng tượng tình huống như sau:

Một quần thể gồm 100,000 người phụ nữ bị chồng bạo hành. Theo con số của Alan Dershowitz (1/2500), trong số này sẽ có 40 người bị sát hại mỗi năm. Nhưng có 5 trường hợp bị sát hại mà thủ phạm không phải là chồng. Như vậy, chúng ta kì vọng có 45 phụ nữ bị sát hại, và trong số này 40 là do chồng sát hại. Do đó, xác suất chồng là thủ phạm là 40 / 45 = 0.89. Thật ra, cách tính chính xác hơn cho ra kết quả 97%. 

Nói cách khác, dựa vào con số thực tế, xác suất một người có tiển sử bạo hành vợ như OJ Simpson đã sát hại vợ cũ là 97%. 

Thế nhưng khổ nỗi trong phiên toà không ai biết cách đặt câu hỏi một cách logic như trên, mà họ bị thuyết phục bởi câu hỏi sai của luật sư. Đặt câu hỏi sai thì câu trả lời cũng sai. Giáo sư IJ Good đã gởi một lá thư cho luật sư Alan Dershowitz và toà án và chỉ ra rằng họ đã sai, nhưng sau khi xem xét chứng cớ DNA và cái găng tay, cuối cùng thì OJ Simpson vẫn được phán quyết là vô tội. Phán quyết đó chẳng thuyết phục được ai vì ai cũng nghĩ OJ Simpson có tội. 

Câu chuyện cho thấy hiểu sai xác suất có thể dẫn đến những phán quyết sai trong toà án. Ở Mĩ mà còn vậy, chẳng biết Việt Nam thì sao. 

TB: Các bạn có thể đọc câu chuyện này qua bài báo của IJ Good trên Nature 1995:  

https://www.nature.com/articles/375541a0

Note kĩ thuật:

Gọi K là sự việc chồng sát hại vợ; B là sự việc chồng bạo hành vợ. Dershowitz lí giải rằng P(K | B) = 1/2500. Nhưng trong trường hợp này, sự việc sát hại đã xảy ra (gọi đó là M), và do đó, cái xác suất mà chúng ta cần tính là P(K | B, M). Theo Định lí Bayes: 

P(K | B, M) = P(M | K, B) * P(K | B) / [P(M | K, B) * P(K | B) + P(M | B, not K) * P(not K | B)] 

trong đó: 

P(M | K) = P(M | K, B) = 1

Năm 1994, có 5000 phụ nữ Mĩ bị sát hại, trong số này 1500 trường hợp mà chồng là thủ phạm. Với dân số chừng 100 triệu phụ nữ, chúng ta có: 

P(M | notK) = 3500 / (100,000,000) = 1 / 30000

P(K | B) = 1/2500 (số của luật sư) 

P(notK | B) = 999/2500

Do đó: P(K | M, B) = (1 * 1/2500) / (1/2500 + 1/30000 * 999/2500) = 0.9677

Nguyễn Văn Tuấn