Nguyễn Văn Tuấn: AI có thông tuệ như con người?
Không bao giờ. Đó là câu trả lời đơn giản và dứt khoát trước những Sơn Đông Mãi Võ về AI. Nhưng nếu bạn không sử dụng AI thì đó là một thiệt thòi.
AI là gì?
AI ở đây là Artificial Intelligence, tức là ‘thông minh nhân tạo’ (chớ không phải ‘trí tuệ nhân tạo’ mà ai đó đã dịch trật lất — sẽ giải thích sau). AI là một thuật ngữ bao trùm những phương pháp như Machine Learning (ML; có khi còn gọi là Statistical Learning), Deep Learning (một phần của Machine Learning), GPT (một phần của Deep Learning), Large Language Model (một phần của GPT), chatGPT (một phần của Large Language Model). Như thấy qua cách phân nhóm trên, AI là một cách nói rất bao quát, không cụ thể.
Nói cách khác nữa, AI là một danh từ rất chung chung, nó bao hàm nhiều thuật toán trong đó, chủ yếu là Machine Learning. Và, chính vì tính chung chung này, AI trở thành một cái gì đó huyền bí, vạn năng, và được ‘thần tượng’ bởi nhiều người, kể cả trong giới khoa học
Nhưng hãy tập trung tìm hiểu AI là gì. Về bản chất, AI có mục tiêu tạo ra những máy tính thông minh có thể mô phỏng trí thông minh con người. Xin nhấn mạnh là ‘mô phỏng’, bắt chước. Nói nôm na, công việc mô phỏng chẳng khác gì huấn luyện máy tính có những ‘bộ não’ có thể nhận biết, lí luận và ra quyết định dựa trên dữ liệu, xác suất và mô hình. Mô hình nào? Xin thưa: mô hình thống kê [1].
Hứa hẹn của AI
Nếu đọc báo phổ thông hay nghe các nhà thuyết trình gây cảm hứng, các bạn có thể nghĩ rằng AI sẽ thay thế con người nay mai. Nhưng bao nhiêu tuyên bố là thật và bao nhiêu là giật gân thì chỉ có người trong cuộc may ra được biết. Cho tới nay, có thể nói rằng AI có nhiều hứa hẹn, nhưng cũng có rất nhiều ngộ nhận.
Có người tuyên bố rằng AI sẽ thay thế bác sĩ chẩn đoán và điều trị bịnh nhân, tức sẽ không cần bác sĩ? Có nhiều nhà khoa học tuyên bố rằng AI có thể phân tích dữ liệu và soạn bài báo khoa học. Họ nói như khẳng định rằng ‘Nghiên cứu khoa học sẽ không cần giả thuyết,’ tất cả cứ để cho AI sáng tạo ra tri thức mới. Họ tự tin tuyên bố ‘Nghiên cứu khoa học theo cách làm truyền thống sẽ là quá khứ.’ Lại có người cho rằng AI sẽ đạt đến mức ‘Siêu thông minh’ (dù ý tưởng đó là gì thì chưa ai rõ).
Trong thực tế, các thuật toán Machine/Statistical Learning được ứng dụng khá nhiều trong đời sống. Từ điều phối nhiệt độ của tủ lạnh, nấu cơm tự động, chỉnh sửa đánh vần và văn phạm tiếng Anh, đọc phim X quang, đến lái máy bay đều là thành tựu của ML. Mới đây nhứt, sự ra đời của ChatGPT thể hiện một thành công ngoạn mục của ML mà chúng ta đã nghe qua nhiều.
Có người nói rằng chatGPT có thể viết một bài báo khoa học, nhưng khi tôi thử qua thì thấy văn phong giống như học trò tiểu học cố viết văn đại học. Rất nhiều câu văn generic. Rất nhiều sáo ngữ. Rất nhiều câu văn ngây ngô. Khi cho chatGPT diễn giải một biểu đồ, nó cho ra những câu văn chung chung, có khi trật lất. ChatGPT dùng xác suất và ‘associative rule’ để nối kết những câu chữ với nhau (và những câu này có trong mạng), nên có rất nhiều câu văn sai một cách rất buồn cười. Nói chung, tôi không nghĩ đó là một bài báo khoa học dù là thấp nhứt. Thật sự, tôi không hiểu sao có người dám nói rằng chatGPT có thể soạn bản thảo một bài báo khoa học.
Qui luật GIGO
Nhưng cần nhớ rằng ML cũng chỉ là một sản phẩm do con người tạo ra. Máy tính (hay mô hình thống kê) học từ con người, chớ con người không ‘học máy.’
Con người tạo ra dữ liệu, với những sai lầm của con người bên cạnh những sự thực. Dữ liệu chúng ta tạo ra đều có sai sót và thiên lệch. Nếu chúng ta đọc X quang sai, thì máy cũng sai, vì máy bắt chước con người. Nếu đa số tờ báo có thành kiến với Trump (hay ai đó) thì ML cũng sẽ cho ra câu trả lời biased về một cá nhân. Chính vì bias/thiên lệch nên có người chỉ ra rằng AI có xu hướng … kì thị chủng tộc.
Tất cả chỉ để nói lên rằng máy tính (hay mô hình thống kê) học từ dữ liệu do con người tạo ra, nên máy vẫn cho ra kết quả sai.
Người ta có câu GIGO (garbage in – garbage out, đầu vào là rác thì đầu ra cũng là rác). Mà, thông tin và dữ liệu trong mạng thì tràn đầy rác rưởi. Điều này có nghĩa là tất cả các phương pháp ML dùng dữ liệu từ mạng đều sai. Tất cả đều sai.
Những sai lầm và thất bại của ML thì đếm không xuể. Google phải bỏ cái mô hình dự báo dịch cúm mùa dựa vào những ‘từ khoá’ mà người ta tìm qua google. Cái mô hình này có thể đếm được bao nhiêu lần người ta gõ chữ ‘cúm mùa’ nhưng nó không thể nào biết tại sao và bối cảnh khi người ta gõ chữ đó. Ở bên Tàu, người ta phải bỏ cái mô hình ML nhận dạng người có tiềm năng phạm tội. Cái sai lầm của mô hình nhận dạng tội phạm qua đo lường các đặc điểm trên khuôn mặt là nhóm nghiên cứu không biết thiết kế nghiên cứu! ‘Sai sót 101’ hết sức căn bản.
Tất cả những thất bại như thế xuất phát từ thiếu lí thuyết căn bản. Nhiều người hồ hởi ứng dụng ML để giải quyết những vấn đề lớn trong y khoa thiếu kiến thức chuyên ngành và thiếu kĩ năng căn bản về thống kê học và dịch tễ học, và do đó sản phẩm của họ không thể sử dụng được.
Nhưng AI vẫn có ích
Tuy có sai, nhưng một số phương pháp ML vẫn có ích. Chẳng hạn như chúng ta rất khó đọc hàng trăm phim X quang trong vài giờ đồng hồ, nhưng ML có thể đọc mỗi phim trong vòng 5 đến 10 giây. Hay nhìn vào hình ảnh, chúng ta khó có thể phát hiện những đốm nhỏ bất thường, nhưng ML có thể giúp chúng ta nhận ra rất nhanh và tương đối chính xác.
Nên nhớ rằng ML là một công cụ giúp con người; ML không thể thay thế con người. ML có thể chỉ ra một cá nhân bị gãy xương sống, nhưng nó vẫn có thể sai, và do đó cần phải có bác sĩ xem lại.
Vài người trong chúng ta không có khả năng giải phương trình bậc 5 (ví dụ), nhưng ML có khả năng giải bài toán phức tạp đó, và giải khá nhanh. Thành ra, tuy AI hay ML không phải là hoàn thiện, nhưng chúng vẫn giúp ích cho con người và nâng cao năng suất làm việc.
Trí thông minh và trí tuệ
Đối với những vấn đề hay công việc mang tính công thức và qui trình (lặp đi lặp lại) thì ML rất tuyệt vời. ML có thể tự động chiết xuất DNA rất tốt, có thể genotype hàng triệu SNPs khỏi chê, vì đó là những qui trình có thể tự động hoá. ML có thể thay thế phi công thời gian thời tiết ổn định trên không, nhưng nó khó mà lái xe Honda ở trong làng quê. Thật vậy, đối với những vấn đề cần đến sự đánh giá và phán xét thì ML không bao giờ đạt được năng lực của con người. Lí do đơn giản là ML không bao giờ biết được bộ não con người vận hành ra sao và ML cũng không có trực giác.
Để biết sự vận hành của bộ não con người, cần phải làm … phẫu thuật bộ não. Mà, dựa trên 1 bộ não thì không đủ, nên phải làm trên hàng triệu bộ não. Ngay cả 1 bộ não thì cái ý tưởng mổ xẻ đó đã là điên rồ, là không thể, thì làm sao nói tới chuyện xa vời. ML mãi mãi chỉ là mô phỏng không hoàn hảo bộ não con người, chớ không thể thay thế bộ não con người.
Do đó, AI hay ML (hay gì nữa) sẽ không bao giờ đạt được suy nghĩ của con người. ML sẽ không bao giờ đạt được mức độ thông minh như con người. AI/ML thiếu các đặc tính cơ bản của con người như ý thức, tự nhận thức, và tiềm thức. AI/ML phụ thuộc vào dữ liệu đầu vào sự và giám sát của con người, và những cái gọi là ‘quyết định’ của AI/ML được định hình bởi các mô hình thống kê và xác suất thay vì ý thức. Đã vô thức và kém thông minh (intelligence), thì chưa thể nói đến ‘trí tuệ’ (wisdom) được.
Cần phân biệt giữa trí thông minh và trí tuệ. Trí thông minh là năng lực suy luận một cách logic theo công thức, hay khả năng trừu tượng hóa từ quan sát thực tế. Còn trí tuệ là khả năng hiểu bản chất sự việc hay con người, là ‘cảnh giới’ của tâm hồn. Nói theo Phật, tuệ là từ tâm sanh (còn thông minh là ‘tai thính mắt tinh’). Người thông minh có nhiều kiến thức và kĩ năng tốt giúp cho họ làm ra nhiều tiền và có cuộc sống tiện nghi, còn người có trí tuệ là người giàu giá trị văn hoá và họ có niềm hạnh phúc viên mãn.
Hiểu như vậy để thấy rằng máy tính hay AI/ML sẽ không thể đạt được ‘trí tuệ’; nó chỉ đạt một mức độ ‘thông minh’ nhứt định nào đó. Bởi vậy, khi nghe các diễn giả ‘nổ’ về AI, các bạn cần bình tĩnh để không bị trở thành một nạn nhân của Sơn Đông Mãi Võ. Nếu chú ý kĩ, các bạn có thể nhận ra rằng có khi các diễn giả không biết họ nói cái gì vì họ thiếu lí thuyết cơ bản [2].
Tôi thấy cách nhìn AI sau đây thực tế hơn: trí thông minh nhân tạo sẽ không thay thế con người, nhưng con người với trí thông minh nhân tạo sẽ thay thế những người không sử dụng trí thông minh nhân tạo [3]. Thành ra, chúng ta phải học và hiểu AI [2].
———
[1] Artificial Intelligence, Statistics, and Statisticians. https://magazine.amstat.org/blog/2023/09/01/aihistory
[2] Ở đại học, tôi thường dự các seminar do các giáo sư về AI đến nói chuyện. Có khi tôi hỏi họ những câu hỏi hết sức căn bản về giả định đằng sau mô hình như Cox’s hay logistic, họ trả lời không thông, vì thiếu kiến thức căn bản về thống kê học (có người thậm chí không hiểu khoảng tin cậy 95% là gì) và đa số họ thiếu kiến thức dịch tễ học.
Hôm giữa Tháng 1, tôi có một bài nói chuyện trong hội nghị EIER, một bạn trẻ hỏi tôi rằng em ấy nên học gì để hiểu cái hay và nhược điểm AI, tôi trả lời rằng em ấy nên học thống kê học và phương pháp khoa học. Không biết thống kê học và phương pháp khoa học thì chẳng khác gì người có cái công cụ mà không biết nó làm từ cái gì. Đó là tình trạng hiện nay: nhiều người nói về AI nhưng vì không có kiến thức thống kê học nên họ có khi không biết họ sai chỗ nào.
[3] https://hbr.org/2023/08/ai-wont-replace-humans-but-humans-with-ai-will-replace-humans-without-ai
“AI Won’t Replace Humans — But Humans With AI Will Replace Humans Without AI”
[4] Nhân ngày Mồng Ba, tôi xin giới thiệu đến các bạn một bài giảng về Dữ liệu Lớn. Đây là bài tôi giảng trong hội nghị khoa học thường niên EIER vào giữa Tháng Một năm 2024 tại Vũng Tàu. Tôi nói qua zoom vì không có dịp về Việt Nam lúc đó. Trong bài này tôi nói về những vấn đề rất nghiêm trọng trong Dữ liệu lớn và những sai lầm nó tạo ra. Tôi cũng nói về một nghịch lí là dữ liệu càng lớn, mô hình càng xa sự thật.
Link: https://youtu.be/9nfHlGKMg9s
***
Thông minh con người
Trí thông minh của con người xuất phát từ cấu trúc phức tạp của bộ não, năng lực xã hội và cảm xúc, giúp chúng ta suy nghĩ trừu tượng, giải quyết vấn đề, hợp tác và tích luỹ vốn văn hóa. Đó là lí do tại sao chúng ta được coi là động vật thông minh hơn bất kì công nghệ nào trên thế giới.
Thông minh máy
Thông minh nhân tạo là thông minh của máy (đúng ra là của nhu liệu / software). Trí thông minh này do con người tạo ra bằng lập trình các mô hình thống kê và thuật toán để phát hiện xu hướng từ dữ liệu. Các mô hình và thuật toán mô phỏng não bộ con người (trên lí thuyết) hoặc dựa vào xác suất (thực tế) để ra quyết định về phân loại và tiên lượng.
Ví dụ: cách tôi dạy máy chẩn đoán loãng xương như sau:
- Bước 1: tôi chọn ra một nhóm người mà các bác sĩ lành nghề chẩn đoán là bị loãng xương. Sau đó tôi chọn một nhóm người bình thường không bị loãng xương và bác sĩ đã xác định thế.
- Bước 2: tôi sẽ cho máy tìm hiểu những đặc điểm nào của mỗi người có thể giúp phân biệt người loãng xương với người bình thường.
- Bước 3: tôi dùng các đặc điểm đó (có thể là giới tính, tuổi tác, trọng lượng, chiều cao, lối sống, dinh dưỡng, gen) để xây dựng một mô hình thống kê với mỗi đặc điểm được cho một trọng số.
- Bước 4: dùng các trọng số đó, mô hình sẽ cho ra xác suất loãng xương là bao nhiêu cho mỗi cá nhân. Chú ý là mô hình không xác định ai bị loãng xương hay không; nó chỉ đưa ra xác suất.
- Bước 5: sau đó tôi áp dụng mô hình trên vào một quần thể khác để đánh giá xem nó phân nhóm loãng xương vs bình thường chính xác đến độ nào. Nếu nó chính xác trên 80% thì tôi có thể đem ra ứng dụng rộng rãi hơn; nếu không, tôi sẽ dạy thêm cho máy để nó cho ra kết quả tốt hơn.
Trong ví dụ trên, trí thông minh của máy hay AI phụ thuộc vào: (a) nhóm bệnh nhân mà tôi chọn; (b) kĩ năng của bác sĩ chẩn đoán; (c) phương pháp đo lường các đặc điểm của mỗi cá nhân; (d) trọng số của mỗi đặc điểm; và (e) quần thể mà tôi kiểm tra độ chính xác của mô hình. Mỗi một sai sót từ bước (a) đến (e) đều ảnh hưởng đến AI. Vì AI phụ thuộc vào đầu vào nhiều như trên, nên đầu ra của nó có khi rất mong manh, thậm chí sai là … bình thường.
Tại sao AI sẽ không bao giờ đạt trí thông minh con người?
Có 5 lí do như sau:
1. AI/ML không có xúc cảm. Con người có xúc cảm, và qua đó chúng ta có thể bày tỏ tình cảm và đọc người và tiên đoán tình cảm của người khác. Chẳng hạn như ngành y tế không thể sử dụng AI để thay thế cho dịch vụ chăm sóc bệnh nhân, vì bệnh nhân muốn có giao tiếp với con người thay vì robot. Robot hay AI không thể thể hiện lòng trắc ẩn và tình cảm.
2. AI/ML không có trực giác và linh cảm. Bộ não chúng ta có một khả năng rất đặc biệt: trực giác. Đó là sự kết hợp của kinh nghiệm, kiến thức và xử lí tiềm thức. Trực giác nó giúp chúng ta đưa ra những quyết định nhanh chóng trong những tình huống thiếu thốn thông tin. AI dựa vào thuật toán thống kê và logic của xác suất, nhưng con người sở hữu khả năng bẩm sinh để tin tưởng vào trực giác của mình, đưa ra những quyết định vượt ra ngoài logic thuần túy.
3. AI/ML không sở hữu đạo đức. Đạo đức và đạo lí là nền tảng của cộng đồng con người, và là kim chỉ nam cho hành động của mỗi chúng ta. AI có thể tuân thủ theo các qui tắc và hướng dẫn được lập trình, nó thiếu lí luận đạo đức bẩm sinh và trách nhiệm đạo đức mà con người sở hữu. Con người xem xét những tình thế đạo đức phức tạp, cân nhắc nhiều quan điểm, sắc thái văn hóa và ảnh hưởng xã hội lâu dài. Chúng ta mang trên vai trách nhiệm cho những quyết định của mình, trong khi AI phải dựa vào sự can thiệp và giám sát của con người để đảm bảo hành vi đạo đức.
4. AI/ML không linh hoạt và không thích ứng. Con người là động vật học tập suốt đời, liên tục phát triển và thích ứng với tình huống và thách thức mới. Cái khả năng học suốt đời và thích ứng giúp chúng ta thu nhận kiến thức mới, phát triển kĩ năng mới và thích ứng với những biến động của tình huống. AI không thể có năng lực này.
5. AI/ML không thể sáng tạo như con người. AI chỉ làm việc theo công thức, nó không thể ‘nghĩ ngoài cái hộp’ (think outside the box). Nhưng con người thì khác: cùng với quá trình triển khai AI trong thực tế, con người có dịp ứng dụng nó vào những công việc sáng tạo. Không chỉ trong lãnh vực sáng tạo mà còn trong các việc liên quan đến phân tích hoặc lập trình, con người lúc nào cũng sáng tạo để làm việc một cách hữu hiệu hơn.
Nguyễn Văn Tuấn