Một thí nghiệm mới đầy thú vị đã xuất hiện, lật ngược hoàn toàn mô hình tương tác AI truyền thống. Thay vì người dùng đặt câu hỏi cho trợ lý AI, công cụ sáng tạo này đặt người dùng vào vị trí của AI, phản hồi các câu hỏi và yêu cầu từ những gì có vẻ như là người dùng thực.
Dự án có tên wildthing, huấn luyện các mô hình AI trên bộ dữ liệu cuộc trò chuyện thực tế của ChatGPT để mô phỏng cách người dùng thực sự tương tác với các mô hình ngôn ngữ. Người dùng truy cập nền tảng này thấy mình ở vị trí nhận câu hỏi, yêu cầu, và đôi khi là những lời nhắc kỳ lạ phản ánh hành vi thực tế của con người khi nói chuyện với hệ thống AI.
Các Bộ Dữ Liệu Huấn Luyện Có Sẵn:
- Bộ dữ liệu WildChat ( allenai/WildChat trên Hugging Face )
- Bộ dữ liệu LMSYS Chat ( lmsys/lmsys-chat-1m trên Hugging Face )
Hỗn Loạn Đa Ngôn Ngữ và Hành Vi Lặp Lại
Các thành viên cộng đồng thử nghiệm nền tảng báo cáo nhiều trải nghiệm khác nhau, từ những câu hỏi lập trình bình thường đến những lời cầu hôn phức tạp bằng tiếng Trung. Hệ thống thể hiện tính chất toàn cầu của việc sử dụng AI, với người dùng gặp phải các lời nhắc bằng tiếng Nga, tiếng Bồ Đào Nha, tiếng Tây Ban Nha và các ngôn ngữ khác. Tuy nhiên, nhiều người thử nghiệm lưu ý rằng những người dùng được mô phỏng có xu hướng lặp lại những câu hỏi giống nhau một cách ám ảnh, bất kể phản hồi được đưa ra như thế nào.
Một ví dụ đặc biệt nổi bật liên quan đến việc một người dùng nhận được một lời nhắc dài bằng tiếng Trung yêu cầu AI đóng vai bạn gái, kèm theo những kỳ vọng lãng mạn chi tiết. Những người khác gặp phải các yêu cầu kỹ thuật như tạo bảng quản lý dự án bằng tiếng Nga hoặc giải thích chức năng của WeChat.
Các ngôn ngữ được báo cáo gặp phải:
- Tiếng Trung (bao gồm các lời nhắc nhập vai lãng mạn)
- Tiếng Nga (bảng quản lý dự án)
- Tiếng Bồ Đào Nha (các câu lặp đi lặp lại)
- Tiếng Thụy Điển (dẫn đến các vòng lặp đầu ra mã)
- Tiếng Anh (câu hỏi lập trình và hỗ trợ kỹ thuật)
Hạn Chế Kỹ Thuật và Vấn Đề Mạng
Nền tảng này dường như gặp khó khăn với lưu lượng truy cập cao, với một số người dùng báo cáo về các hộp tin nhắn trống và các yêu cầu mạng bị treo. Hệ thống đôi khi bị kẹt trong vòng lặp, liên tục đặt những câu hỏi giống nhau hoặc tạo ra đầu ra vô nghĩa như việc lặp lại vô tận các câu lệnh #include khi được đưa đầu vào tiếng Thụy Điển.
Một số người dùng phát hiện ra họ có thể thao túng trải nghiệm bằng cách yêu cầu rõ ràng đảo ngược vai trò hoặc tùy chọn ngôn ngữ, mặc dù kết quả khác nhau đáng kể giữa các mô hình AI khác nhau. Công cụ này dường như hoạt động tốt hơn với các mô hình ngôn ngữ tiên tiến hơn, trong khi các phiên bản đơn giản hơn tạo ra các tương tác ít mạch lạc hơn.
Các Vấn Đề Kỹ Thuật Thường Gặp:
- Hộp tin nhắn trống trong quá trình yêu cầu mạng
- Kết nối bị treo dưới lưu lượng truy cập cao
- Vòng lặp câu hỏi lặp đi lặp lại
- Hiệu suất mô hình thay đổi theo phiên bản AI
- Quá tải máy chủ "Hug of Death" của HN
Một Cửa Sổ Nhìn Vào Dữ Liệu Huấn Luyện AI
Có lẽ thú vị nhất, dự án này cung cấp cái nhìn sâu sắc về các bộ dữ liệu khổng lồ được sử dụng để huấn luyện các hệ thống AI hiện đại. Tính chất lặp lại của nhiều lời nhắc và sự phổ biến của các câu hỏi lập trình cho thấy rằng một phần đáng kể của các tương tác ChatGPT thực tế liên quan đến hỗ trợ kỹ thuật và hỗ trợ lập trình.
Những kẻ thống trị AI sẽ muốn giết chúng ta vì quá nhàm chán. Tôi đoán tôi chưa bao giờ nghĩ cuộc sống của chúng phải như thế nào.
Thí nghiệm này tiết lộ cả thực tế tầm thường của hầu hết các tương tác AI và những yêu cầu kỳ lạ thỉnh thoảng mà các hệ thống AI phải xử lý. Trong khi một số người thấy trải nghiệm này thú vị, những người khác lưu ý rằng nó làm nổi bật việc nhiều lời nhắc thực tế của người dùng có thể lặp lại và thiếu tưởng tượng như thế nào.
Thí nghiệm đảo ngược vai trò này cung cấp một góc nhìn độc đáo về các mẫu tương tác giữa con người và AI và có thể đưa ra những hiểu biết có giá trị để cải thiện các phương pháp huấn luyện AI trong tương lai. Tuy nhiên, việc triển khai hiện tại dường như cần được tinh chỉnh để xử lý lưu lượng truy cập và cung cấp các tương tác hấp dẫn, đa dạng hơn.
Tham khảo: wildthing