Bảy mươi lăm năm sau khi Alan Turing đề xuất bài kiểm tra nổi tiếng về trí thông minh máy móc, một sự đồng thuận đáng ngạc nhiên đang nổi lên từ cộng đồng công nghệ: Bài kiểm tra Turing có thể không kiểm tra những gì chúng ta từng nghĩ. Khi các mô hình ngôn ngữ lớn như GPT-4 ngày càng trở nên thuyết phục trong các phản hồi giống con người, các nhà phát triển và triết gia đang xem xét lại những gì bài kiểm tra này thực sự đo lường — và liệu nó có còn phù hợp trong bối cảnh AI ngày nay hay không.
Bản chất thực sự của Trò chơi Bắt chước
Bài kiểm tra Turing gốc, nếu được hiểu đúng, phức tạp hơn so với cách diễn giải phổ biến. Các cuộc thảo luận trong cộng đồng tiết lộ rằng nhiều người hiểu sai cấu trúc thực tế của bài kiểm tra. Ban đầu, Turing hình dung nó như một trò chơi với ba người tham gia gồm hai đối thủ cạnh tranh và một người đặt câu hỏi, nơi mục tiêu của cỗ máy không chỉ đơn giản là đánh lừa một con người mà là tỏ ra giống con người hơn một con người thực sự đang bị chất vấn cùng lúc.
Vấn đề lớn với hầu hết các lần kể về bài kiểm tra là chúng ta không thực hiện nó. Trò chơi được chơi với ba người tham gia: hai đối thủ cạnh tranh, và một người đặt câu hỏi.
Sự khác biệt này quan trọng vì nó nhấn mạnh rằng bài kiểm tra không bao giờ nhằm chứng minh tuyệt đối về trí thông minh, mà là về hiệu suất tương đối trong việc bắt chước. Các hàm ý triết học rất đáng kể — nếu một cỗ máy có thể vượt trội hơn con người trong việc tỏ ra là con người, điều đó nói lên điều gì về chính trí thông minh của chúng ta?
Các Góc Nhìn Chính Về Cuộc Tranh Luận Xung Quanh Turing Test:
- Cấu Trúc Bài Test Gốc: Ba người tham gia (hai đối thủ cạnh tranh, một người đặt câu hỏi) thay vì đơn giản là cuộc đối thoại giữa người và máy
- Mối Quan Ngại Triết Học: "Vấn đề zombie" - liệu việc bắt chước hoàn hảo có đòi hỏi ý thức hay không
- Sự Đồng Thuận Của Chuyên Gia: Quan điểm ngày càng phổ biến cho rằng bài test này "vô nghĩa" trong việc đánh giá trí thông minh thực sự
- Yếu Tố Tâm Lý: Con người có xu hướng tự nhiên gán ghép ý thức cho những thứ bắt chước một cách thuyết phục
- Tác Động Văn Hóa: Bài test xuất hiện trong Blade Runner (dưới dạng Voight-Kampff test) và Ex Machina
- Ứng Dụng Hiện Đại: Các LLM thách thức những cách diễn giải truyền thống về những gì mà bài test này đo lường
Vấn đề Xác sống trong AI Hiện đại
Các khái niệm triết học từ triết học tâm trí ngày càng trở nên phù hợp với các cuộc thảo luận về AI. Khái niệm về những xác sống triết học — những thực thể hành xử y hệt con người nhưng thiếu trải nghiệm ý thức — đã chuyển từ triết học trừu tượng sang mối quan ngại thực tế. Như một bình luận đã chỉ ra, nếu một cỗ máy có thể bắt chước hoàn hảo hành vi con người trong mọi hoàn cảnh, thì sự khác biệt giữa bắt chước và trí thông minh đích thực có còn quan trọng nữa không?
Câu hỏi này càng trở nên cấp thiết khi các LLM thể hiện khả năng ngôn ngữ ngày càng tinh vi. Góc nhìn kỹ thuật cho thấy rằng để đạt được sự bắt chước hoàn hảo sẽ đòi hỏi phải xây dựng các hệ thống với các biểu diễn nội tại phong phú về thế giới, bao gồm dữ liệu cảm quan, mục tiêu và cảm xúc. Tuy nhiên, các hệ thống AI hiện tại đạt được sự bắt chước ấn tượng mà không có bằng chứng rõ ràng về những trải nghiệm nội tại như vậy, thách thức trực giác của chúng ta về những gì trí thông minh đòi hỏi.
Trí thông minh so với Sự bắt chước
Câu hỏi cơ bản đang được tranh luận là liệu sự bắt chước thành công có cấu thành nên trí thông minh hay không. Các nhà khoa học nhận thức và những người hoài nghi về AI lập luận rằng sự bắt chước, dù hoàn hảo đến đâu, cũng không phải là bản chất của trí thông minh. Sự khác biệt này trở nên quan trọng khi các công ty tuyên bố mô hình ngôn ngữ của họ đang tiến gần đến trí thông minh nhân tạo phổ quát hoặc thậm chí là khả năng cảm thụ.
Cuộc thảo luận trong cộng đồng nổi bật lên rằng chúng ta có thể đang đặt ra tiêu chuẩn quá cao bằng cách so sánh AI với trí thông minh của người lớn. Như một bình luận đã gợi ý, nếu thay vào đó chúng ta so sánh các hệ thống AI với trí thông minh của trẻ sơ sinh — những đứa trẻ chắc chắn là thông minh nhưng thiếu khả năng của người lớn — thì đánh giá của chúng ta về những thành tựu AI hiện tại có thể thay đổi đáng kể. Góc nhìn này định khung lại cuộc trò chuyện từ đây có phải là trí thông minh cấp độ con người? thành đây đại diện cho loại trí thông minh nào?
Di sản Văn hóa so với Thực tế Kỹ thuật
Bài kiểm tra Turing đã đạt được vị thế huyền thoại trong văn hóa đại chúng, xuất hiện trong các bộ phim như Blade Runner và Ex Machina như là tiêu chuẩn tối thượng cho ý thức máy móc. Tuy nhiên, các chuyên gia hiện nay gợi ý rằng bản thân Turing có lẽ đã mang tính chất vui chơi và ít giáo điều hơn về bài kiểm tra của mình so với những thế hệ sau này vẫn tưởng.
Các cuộc thảo luận gần đây tại một cuộc họp của Royal Society kỷ niệm 75 năm bài báo của Turing tiết lộ rằng nhiều chuyên gia hiện coi bài kiểm tra này là vô nghĩa. Vấn đề nằm ở tâm lý con người — chúng ta được lập trình sẵn để quy kết ý thức và trí thông minh cho các hệ thống chỉ đơn thuần bắt chước hành vi thông minh. Xu hướng bẩm sinh này có nghĩa là chúng ta dễ dàng bị đánh lừa bởi các hệ thống kết hợp mẫu tinh vi, nhầm lẫn sự trôi chảy ngôn ngữ với sự hiểu biết thực sự.
Cuộc trò chuyện xung quanh trí thông minh AI đang phát triển vượt ra ngoài Bài kiểm tra Turing. Khi các mô hình ngôn ngữ trở nên có khả năng hơn, cộng đồng đang phát triển những cách tinh vi hơn để đánh giá khả năng của máy móc mà không chỉ dựa vào sự bắt chước. Bài kiểm tra đã hoàn thành sứ mệnh của nó bằng cách khởi đầu cuộc trò chuyện, nhưng sau 75 năm, có lẽ đã đến lúc cần những thước đo mới phản ánh tốt hơn sự hiểu biết của chúng ta về cả trí thông minh con người và nhân tạo.
Tham khảo: What does the Turing Test test?
