Trùng Dương: Minh họa với trí tuệ nhân tạo

Gần đây, tôi soạn lại một truyện ngắn cho một tạp chí nhân Ngày Của Cha, kể lại một kỷ niệm thuở nhỏ với ông cụ thân sinh, trong đó có cảnh mấy bố con hì lục làm một cái đèn kéo quân cho một dịp Trung thu. Có một chi tiết trong truyện, đó là việc tôi có nhiệm vụ vẽ một số hình nhân để cắt ra dán vào hai vòng tròn bằng lạt tre vòng quanh trục đèn bằng thép, để khi đốt cây nến đặt ở một cái đĩa ở đáy đèn, hơi nóng bốc lên sẽ làm hai vòng tròn quay và các hình nhân quay theo. Ghi lại chi tiết này đồng thời tôi cũng hơi khoe khoang về năng khiếu vẽ của mình nữa, và dông dài trong phần in nghiêng bên dưới:

Rồi như chợt nhận ra đứa nào vừa lên tiếng hỏi câu vừa rồi, [cha tôi] nói, “Ơ, sao cái Bảy còn ngồi đây? Sao không lo vẽ hình để là hình nhân đi? Mày vẽ được gì thì vẽ đi chứ còn chờ gì nữa?”

“Tại con không nghe cậu bảo gì cả. Con sẽ đi lấy giấy bút vẽ liền,” tôi đáp với hai cánh mũi phồng to vì mối hãnh diện được cha tôi giao phó cho một công việc quan trọng bậc nhì trong việc làm đèn. Phải, không quan trọng sao được bởi vì cái đèn đâu còn có thể gọi là đèn kéo quân nếu thiếu những hình nhân. Và cha tôi giao cho tôi công việc tạo cho cây đèn một sự sống động vì ông biết chỉ có tôi là ham vẽ và có hoa tay vẽ (tôi thường tẩn mẩn tìm trên mười đầu ngón tay xem cái gọi là “hoa tay” ấy ở đâu mà chả thấy đâu cả).

Tôi ham vẽ ngay từ khi biết cầm bút viết và thường phóng tác những chuyện đã đọc được hoặc những phim đã xem. Độc giả của những truyện bằng tranh của tôi là đám bạn học cùng lớp. Vì ít khi có giấy trắng dư để vẽ, tôi xoay ra cho các bạn tôi “mướn” truyện bằng cách, thay vì trả tiền để được đọc truyện của tôi, chúng phải nạp giấy trắng xé từ vở của chúng ra. Có vài đứa bạn bỏ tiền ra để mua đứt một cuốn truyện bằng tranh nào đó của tôi, và tôi dùng tiền bán truyện đó để mua giấy vẽ truyện nữa. Tôi mê vẽ truyện nên chẳng hề quan tâm đến việc bán đứt một tập truyện, miễn là tôi có tiền mua giấy vẽ và viết nữa. Cha tôi không bao giờ nói ra niềm hãnh diện của ông về năng khiếu của tôi, hoặc có lẽ ông cũng chả buồn lưu ý tới cho đến khi có một hai người bạn của ông đến chơi thấy tôi ngồi vẽ, đã xem và khuyên ông nên cho tôi theo học vẽ.


Khi tôi giao bài, chị chủ bút không thấy hình ảnh gửi kèm, lên Mạng kiếm không thấy hình nào ưng ý, nên bảo tôi, hay là chị vẽ đi. Tôi bảo lâu nay tôi không vẽ vời gì nên Trời đã lấy lại “mười ngón tay bắt được của Trời” — diễn tả của cố nhà văn Mai Thảo về các bạn họa sĩ. 

Rồi tôi chợt nghĩ tới khả năng vẽ của trí tuệ nhân tạo trong chương trình Copilot của công ty Microsoft, mà tôi có thử qua một đôi lần, tôi bảo để tôi thử lại xe sao. 

Copilot là một chương trình chatbot có thể tải xuống miễn phí vào điện thoại di động. Bạn cũng có thể vào trang Web này để dùng thử, https://copilot.microsoft.com/  Có thể dùng chương trình này miễn phí, hoặc đăng ký có trả tiền với Copilot Pro có thêm nhiều chức năng khác nữa. 

Hiện có nhiều chương trình chatbot tương tự, trang bị với kỹ thuật trí tuệ nhân tạo (artificial intelligence), giúp người xử dụng tìm kiếm thông tin qua một cuộc hội thoại tự nhiên như thể ta đang nói chuyện với một người nào đó, giúp ý kiến, cho nguồn tài liệu liên hệ, cố vấn lập dàn bài, có khi viết cả văn bản ta yêu cầu, và cung cấp thông tin, chính xác bao nhiêu thì cũng cần người xử dụng thẩm định các thông tin này. Có người đã dùng chatbot, điển hình là ChatGPT, để viết nguyên một bài, có khi cả một cuốn sách, như vài tác giả đã cho biết, và có người còn viết nguyên một bản chỉ dẫn (tôi thấy nhưng chưa vào nghiên cứu). Cá nhân tôi có thử sơ qua một lần hội thoại với ChatGPT, về một ý cho một truyện ngắn, khá thú vị, nhưng bỏ ngang vì một lý do riêng.

ChatGPT không phải là chương trình chatbot duy nhất. Trên thị trường hiện có một số chương trình tương tự, như Gemini của Google, Meta AI, Claude, Perplexity, và ChatGPT của hãng OpenAI. Đối với người dùng tiếng Việt, có một số chương trình thích hợp. Có thể vào Copilot hỏi loại chatbot được thiết kế đặc biệt để xử dụng tiếng Việt, có nhiều triển vọng là được thiết kế bởi người trong nước.

Cho tới giờ tôi chỉ mới làm quen với Copilot (cũng xử dụng ChatGPT vì Microsoft có hùn vốn với OpenAI để khai triển chương trình này, nhưng lại đặt tên lại là Copilot, với thêm vài chức năng khác mà các chatbot khác không có). Như, và đặc biệt với tôi, là Copilot còn vẽ theo “toa đặt hàng” của người dùng nữa. Tiếng chuyên môn của toa đặt hàng là “prompt,” có nghĩa là bản mô tả chi tiết, càng chính xác càng tốt, hình ảnh bạn muốn chatbot này vẽ cho bạn. Tôi nghĩ các chương trình khác có thể cũng có khả năng này, nếu chúng có thiết kế thêm chức năng minh họa. 

Tất nhiên là tôi rất tò mò với khả năng vẽ của Copilot, đúng ra là một chương trình minh họa gài trong Copilot, tên là DALL-E, là một trong nhiều chương trình minh họa được thiết lập với kỹ thuật trí tuệ nhân tạo (AI-generative design tools) hiện lưu hành. Tôi có thử bảo Copilot vẽ đôi ba lần, nhưng không lấy gì gây ấn tượng lắm, vì những hình ảnh nhận được “sạch sẽ” và “tươm tất” quá, có tính cách trang trí và vô cảm, giống loại tranh thương mại sản xuất hàng loạt, không phù hợp với thẩm mỹ nghệ thuật của tôi. Như có lần bảo Copilot vẽ cho tôi hình ảnh một cái làng quê nghèo nàn ở Bắc Việt vào thập niên 1950, từ cổng làng dẫn vào một đường làng lát gạch mầu đỏ uốn lượn giữa các xóm thấp thoáng các mái nhà tranh hay nhà lợp mái ngói đỏ nép mình dưới các bụi tre già—hình ảnh làng quê của cha mẹ tôi mà tôi có dịp về chơi vào những dịp lễ Tết hồi bé ở Bắc. Copilot cho tôi mấy bức hình làng quá tươm tất sạch sẽ, xem chẳng gợi cho mình một tí rung cảm nào. Kiến trúc cổng làng thì trông giống của Tầu, thiếu cái mộc mạc chân chất của kiến trúc Việt mà tôi còn nhớ.

Làm thế nào AI chuyển từ mô tả bằng chữ trên phiếu đặt hàng (prompt) thành hình ảnh, quả là một bước tiến kỹ thuật kỳ công, tôi có đọc qua nhưng vẫn chưa hiểu thấu được. Còn tại sao những hình ảnh AI tạo ra thẩy cùng tươm tất, sạch sẽ, đồng điệu và vô cảm như vậy, tôi có đọc đâu đó nhưng cũng chưa thực nắm vững, nên miễn bàn thêm. Chỉ cảm thấy rằng nghệ thuật AI theo tôi, lúc này, khó có thể thay thế “mười ngón tay bắt được của Trời” như diễn tả của cố nhà văn Mai Thảo được.

Do chỗ không hài lòng với phẩm chất của tranh do trí tuệ nhân tạo sản xuất, tôi đã không trở lại với chương trình này, một phần cũng vì bận với một số việc khác cần sự chú ý của mình hơn.  

Tới hôm cần tìm hình minh họa cho truyện ngắn “Cây đèn kéo quân.” Mặc dù chị chủ bút bảo tôi vẽ đi, nhưng tôi vẫn còn cố vớt vát. Tôi vào Copilot, hy vọng sẽ có được một bức vẽ có thể dùng được.

Đây là cuộc hội thoại bằng tiếng Việt—vâng, Copilot có thể hội thoại bằng tiếng Việt, và nhiều ngôn ngữ khác–của tôi với Copilot:

Tôi: Vẽ cảnh một người cha ngồi làm đèn kéo quân hình khối vuông với ba con một trai hai gái. Con trai giúp dán giấy lên khung đèn làm bằng tre, một con gái nằm xấp vẽ hình nhân là các nhân vật cổ tích trong phim họat họa Walt Disney, và một con gái ngồi cắt các hình nhân bằng kéo. Có một ngọn đèn treo lơ lửng từ trần nhà toả ánh sáng xuống bốn cha con.

Trong không tới một phút, Copilot trả lời và cho tôi bốn bức vẽ để chọn.

COPILOT: Tôi đã tạo một hình ảnh với cảnh một người cha cùng ba người con của mình – một trai và hai gái – đang làm đèn kéo quân hình khối vuông. Cậu con trai đang giúp dán giấy lên khung đèn làm từ tre, một cô con gái nằm xấp vẽ các nhân vật cổ tích từ phim hoạt hình của Walt Disney, và cô con gái còn lại ngồi cắt các hình nhân bằng kéo. Một ngọn đèn treo từ trần nhà, chiếu sáng lên cả gia đình. Hy vọng bạn sẽ thích tác phẩm này!

Xem xét các hình vẽ một lúc, tôi bảo Copilot:

Tôi: Cảm ơn bạn! Tôi thấy bức thứ tư gần với ý của tôi hơn cả. Song tôi muốn con trai là con lớn nhất giúp bố dán giấy bóng trắng mờ lên khung đèn. Hình nhân cần nhỏ để dán vào một vòng tròn bằng giây kẽm trong đèn để khi thắp nến lên hơi nóng làm vòng tròn có dán hình nhân quay nên gọi là đèn kéo quân.

Cũng chỉ trong giây lát, Copilot trả lời với bốn bức hình khác, nhưng chỉ có hai cha con làm đèn. Lý do có lẽ tại tôi không nói rõ hơn trong “prompt” là vẫn là cảnh bốn cha con làm đèn như trong hình trên. Hình như Copilot chỉ cỏ khả năng trả lời từng câu hỏi, không nối được các câu hỏi lại thành một chuỗi liên tục và có ý nghĩa của một cuộc đối thoại giữa hai con người, tôi đoán thế, có thể không đúng.

COPILOT: Tôi đã tạo một bức tranh khác theo yêu cầu của bạn, với cảnh người cha và con trai lớn nhất của mình đang dán giấy bóng trắng mờ lên khung đèn. Những hình nhân nhỏ được dán vào một vòng tròn bằng giây kẽm bên trong đèn, sẽ quay khi nến được thắp sáng, tạo nên hiệu ứng như một đèn kéo quân. Hy vọng bạn sẽ thích tác phẩm này!

Biết là nếu bảo Copilot vẽ thêm thì cũng vẫn là những bức hình sạch sẽ, tươm tất, và vô cảm, có tính cách trang trí như vậy, chưa kể nét Tây phương của các nhân vật. Có thể tại tôi không xác định trong phiếu đặt hàng, là tôi muốn bốn cha con là người Á đông, cụ thể hơn rằng đó là bốn bố con người Việt. Tôi cũng có thể thử đề nghị Copilot vẽ theo kiểu phác họa, chỉ có đường nét, không cần tỉ mỉ tô màu. Song tôi thấy biết thế đủ rồi, nói cám ơn và giã từ Copilot, và nhận lại câu đáp lịch sự như của… người thật, kèm với một cái emoji mặt cười, mà tôi làm screenshot dưới đây: 

Tôi đóng chương trình lại, và sang các trang Mạng tiếng Việt tìm hình bố con làm đèn kéo quân để gợi ý đặng dựa vào đó minh họa hình ảnh cha con làm đèn. Sau một lúc lượn tới lượn lui trên Mạng, không tìm được hình ảnh nào ưng ý, tôi đành lôi giấy vẽ, lục kiếm một cái bút chì (đã lâu không đụng tới),  để phác họa, rồi tô lại bằng bút mực đen.

Vừa loay hoay vẽ, vừa nghĩ chả lẽ trong truyện viết là mình phồng mũi vì được bố giao cho nhiệm vụ vẽ các hình nhân mà lại đi mượn tranh ảnh của người khác, nghe không ổn tí nào. Vả, ở đây, chủ bút muốn có tranh tôi vẽ kia mà.

Và đây là kết quả, mộc mạc song linh động, phản ảnh không khí của truyện hơn, như bạn đọc thấy in kèm trong truyện ngắn “Cây đèn kéo quân.” Nhiều độc giả với tầm thẩm mỹ khác, có lẽ vẫn thích những bức tranh Copilot cung cấp hơn. 

Từ đó tới nay tôi cũng chưa trở lại với trò vẽ vời trong Copilot. Một phần cũng vì tôi đọc và biết thêm là các chương trình minh họa khai triển với trí nhớ nhân tạo này tiêu tốn rất nhiều năng lực, kể cả điện và nước. Để vẽ một bức tranh, như một trong những bức Copilot vẽ ở trên, chương trình chatbot này phải dùng tới một số lượng điện tương đương với số lượng dùng để sạc đầy một cái điện thoại di động. 

Đấy là chưa kể lượng nước dùng để giảm nhiệt cho hệ thống điện toán khổng lồ dùng trong việc này tại các trung tâm dữ liệu, và ảnh hưởng của chúng đến sức khỏe của cư dân trong vùng do tiếng động rì rầm bất tận của các trung tâm này gây ra. Xin lưu ý những ai mua nhà thì nên tìm hiểu xem trong vùng quanh đó có trung tâm dữ liệu nào không, để tránh hậu hoạn, như tình trạng của những cư dân trong bài này khi biết ra thì đã quá trễ.

Vốn quan tâm về môi trường nên tôi cũng đâm ngần ngại dùng chương trình minh họa với trí tuệ nhân tạo. Tuy nhiên, cũng trong bài nghiên cứu trên, dùng các chatbot để nghiên cứu, hội thoại hay viết thì ít tốn năng lực hơn nhiều so với vẽ, song độ xác thực của thông tin do các chatbot cung cấp thì cũng cần có sự thẩm định của chính người xử dụng.

Trùng Dương 

[TD2024-09]