Cộng đồng trí tuệ nhân tạo đang tham gia vào một cuộc tranh luận sôi nổi sau nghiên cứu của Apple đặt thách thức đến khả năng lý luận của các Mô hình Ngôn ngữ Lớn (LLM). Nghiên cứu này, đã xem xét cách các hệ thống AI này xử lý các vấn đề phức tạp như trò chơi đố Tháp Hanoi, đã khơi mào cuộc thảo luận rộng rãi về việc liệu công nghệ AI hiện tại có thực sự lý luận hay chỉ đơn giản là bắt chước các mẫu từ dữ liệu huấn luyện.
Gary Marcus , một nhà nghiên cứu AI nổi tiếng và là người chỉ trích, đã bảo vệ các phát hiện của Apple trước bảy lập luận phản bác phổ biến từ những người lạc quan về AI. Phân tích của ông đã thu hút cả sự ủng hộ và chỉ trích từ cộng đồng công nghệ, làm nổi bật sự chia rẽ sâu sắc về khả năng hiện tại và tiềm năng tương lai của AI.
Bất đồng cốt lõi: Khớp mẫu so với Lý luận thực sự
Cuộc tranh luận trung tâm xoay quanh việc liệu LLM có thể hiện khả năng lý luận thực sự hay chỉ là khớp mẫu tinh vi. Những người chỉ trích lập luận rằng các hệ thống này thất bại khi đối mặt với các vấn đề thực sự mới lạ nằm ngoài dữ liệu huấn luyện của chúng. Họ chỉ ra các phát hiện của nghiên cứu Apple rằng các mô hình AI gặp khó khăn với các biến thể của những câu đố nổi tiếng, cho thấy các hệ thống thiếu hiểu biết cơ bản.
Tuy nhiên, những người bảo vệ công nghệ AI hiện tại cho rằng lời chỉ trích này bỏ qua giá trị thực tế mà các công cụ này mang lại. Họ lập luận rằng ngay cả khi LLM dựa vào nhận dạng mẫu thay vì lý luận thuần túy, cách tiếp cận này vẫn mang lại kết quả hữu ích trong nhiều ứng dụng thực tế.
Những phát hiện chính từ nghiên cứu của Apple:
- Các mô hình LLM gặp khó khăn với các biến thể của trò chơi Tháp Hà Nội
- Hiệu suất giảm sút khi các bài toán trở nên phức tạp hơn
- Các hệ thống dường như dựa vào việc khớp mẫu thay vì lý luận thực sự
- Giải pháp tối ưu cho Tháp Hà Nội yêu cầu 255 nước đi (trong giới hạn token)
Phản ứng của cộng đồng tiết lộ căng thẳng nghề nghiệp
Cuộc thảo luận đã phơi bày những căng thẳng tiềm ẩn trong cộng đồng AI. Một số nhà phát triển và nhà nghiên cứu bày tỏ sự thất vọng với những gì họ coi là lời chỉ trích quá mức có thể gây hại đến tiến bộ và tài trợ. Những người khác lo ngại rằng việc thổi phồng quá mức khả năng AI mà không thừa nhận những hạn chế có thể dẫn đến một mùa đông AI khác - một giai đoạn giảm đầu tư và quan tâm đến nghiên cứu trí tuệ nhân tạo.
Những người thổi phồng AI thích phàn nàn rằng các chuyên gia AI thực sự quá quan tâm đến việc bác bỏ AI hiện tại hơn là cải thiện nó - nhưng sự thật là bác bỏ AI tồi CHÍNH LÀ cải thiện AI.
Cuộc tranh luận cũng phản ánh mối quan ngại về tính bền vững của các mô hình kinh doanh AI hiện tại, với một số thành viên cộng đồng lo lắng rằng những kỳ vọng không thực tế có thể dẫn đến sự thất vọng của nhà đầu tư và giảm khả năng tiếp cận các công cụ AI.
Quan điểm Cộng đồng:
- Những người chỉ trích: LLM thiếu khả năng suy luận thực sự, chỉ dựa vào các mẫu dữ liệu huấn luyện
- Những người ủng hộ: Việc khớp mẫu vẫn mang lại giá trị thực tiễn
- Những người ôn hòa: Có thể cần các phương pháp tiếp cận thần kinh-ký hiệu lai
- Mối quan ngại của doanh nghiệp: Chu kỳ cường điệu không bền vững, nguy cơ mùa đông AI
Hạn chế kỹ thuật và hướng phát triển tương lai
Một số vấn đề kỹ thuật đã nổi lên từ cuộc thảo luận của cộng đồng. Nghiên cứu của Apple nhấn mạnh rằng các hệ thống AI hiện tại gặp khó khăn với các tác vụ thuật toán đòi hỏi tiến trình logic từng bước, ngay cả khi các vấn đề có giải pháp được thiết lập tốt. Hạn chế này trở nên rõ rệt hơn khi các vấn đề tăng độ phức tạp hoặc lệch khỏi các ví dụ huấn luyện.
Một số thành viên cộng đồng đề xuất rằng các cách tiếp cận lai kết hợp lý luận tượng trưng với các phương pháp mạng nơ-ron hiện tại có thể giải quyết những thiếu sót này. Cách tiếp cận nơ-ron tượng trưng này có thể xử lý hiệu quả hơn cả các tác vụ nhận dạng mẫu và lý luận logic.
Bảy phản bác phổ biến đối với bài báo Apple:
- Con người cũng gặp khó khăn với các vấn đề phức tạp
- Giới hạn token ngăn cản việc tìm ra giải pháp phù hợp
- Tấn công cá nhân các tác giả của bài báo
- Các mô hình lớn hơn có thể hoạt động tốt hơn
- Hệ thống có thể giải quyết các câu đố bằng thuật toán/mã lệnh
- Những phát hiện trong bài báo không phải là thông tin mới
- Khả năng tổng quát hóa kém đã được biết đến từ trước
Tác động đến phát triển AI
Cuộc tranh cãi phản ánh những câu hỏi rộng lớn hơn về ưu tiên phát triển AI và các tuyên bố tiếp thị. Trong khi các hệ thống AI hiện tại thể hiện khả năng ấn tượng trong nhiều lĩnh vực, cuộc tranh luận làm nổi bật khoảng cách giữa kỳ vọng công chúng và thực tế kỹ thuật. Sự ngắt kết nối này có tác động thực tế đối với các doanh nghiệp và cá nhân đưa ra quyết định về việc áp dụng và đầu tư AI.
Cuộc thảo luận cũng tiết lộ những thách thức đang diễn ra trong đánh giá và kiểm tra AI. Việc xác định liệu các hệ thống AI có thể xử lý các vấn đề thực sự mới lạ vẫn còn khó khăn, vì thường không rõ liệu các trường hợp kiểm tra có tồn tại trong dữ liệu huấn luyện hay các dạng tương tự.
Cuộc tranh luận xung quanh nghiên cứu của Apple minh họa những khó khăn tăng trưởng hiện tại của lĩnh vực AI. Khi những công nghệ này trở nên phổ biến hơn trong cuộc sống hàng ngày và hoạt động kinh doanh, việc hiểu khả năng thực sự và hạn chế của chúng trở nên ngày càng quan trọng để đưa ra quyết định sáng suốt về việc sử dụng và phát triển chúng.
Tham khảo: Seven replies to the viral Apple reasoning paper - and why they fall short