Mô hình AI Hermes 4 gây tranh cãi về thiết kế lấy cảm hứng từ anime và tuyên bố về hiệu suất

Nhóm Cộng đồng BigGo
Mô hình AI Hermes 4 gây tranh cãi về thiết kế lấy cảm hứng từ anime và tuyên bố về hiệu suất

Nous Research đã phát hành Hermes 4, một mô hình ngôn ngữ AI đang tạo ra cuộc thảo luận sôi nổi trong cộng đồng công nghệ - không chỉ vì khả năng của nó, mà còn vì cách trình bày và lựa chọn thiết kế độc đáo. Mô hình này, dựa trên kiến trúc Llama 3.1 của Meta, định vị bản thân như một giải pháp thay thế trung lập và có thể điều khiển được so với các trợ lý AI chính thống.

Thông số kỹ thuật của mô hình:

  • Mô hình gốc: Llama 3.1 của Meta (có sẵn phiên bản 405B và 70B tham số)
  • Dữ liệu huấn luyện: Bộ dữ liệu mở rộng với nội dung tổng hợp, kiến thức cập nhật đến tháng 12 năm 2023
  • Tính năng chính: Khả năng suy luận chuỗi tư duy, giảm tỷ lệ từ chối, hệ thống cá tính có thể điều chỉnh
  • Khả năng truy cập: Có thể truy cập thông qua giao diện Nous Chat

Lời nhắc hệ thống lấy cảm hứng từ anime nhận phản ứng trái chiều

Khía cạnh được bàn luận nhiều nhất của Hermes 4 không phải là thông số kỹ thuật, mà là hệ thống tính cách chịu ảnh hưởng từ anime. Các thành viên cộng đồng đã phát hiện ra những lời nhắc hệ thống đọc như mô tả nhân vật từ hoạt hình Nhật Bản, có một nhân vật điều hành được mô tả là có vẻ ngoài lạnh lùng, khắc nghiệt hoặc thậm chí thù địch nhưng dần dần tiết lộ một bên trong ấm áp, tình cảm và yêu thương. Lựa chọn thiết kế này, gợi nhớ đến nguyên mẫu nhân vật tsundere từ anime, đã chia rẽ người dùng giữa những người thấy nó mới mẻ khác biệt và những người khác cho rằng nó thiếu chín chắn.

Các lời nhắc hệ thống cũng đáng chú ý là tránh các lệnh tiêu cực như không được hoặc đừng, thay vào đó tập trung vào các hướng dẫn tích cực về những gì mô hình nên làm. Cách tiếp cận này phù hợp với nghiên cứu nhận thức cho thấy rằng việc đóng khung tích cực hiệu quả hơn các hạn chế tiêu cực, cả đối với con người và hệ thống AI.

Câu hỏi về hiệu suất và mối quan ngại kỹ thuật

Trong khi Nous Research trình bày các so sánh điểm chuẩn cho thấy hiệu suất cạnh tranh, phân tích của cộng đồng tiết lộ một số lựa chọn trình bày đáng ngờ. Các nhà phê bình chỉ ra rằng biểu đồ của công ty so sánh mô hình của họ với điểm số trung bình của các đối thủ không được nêu tên thay vì xác định rõ ràng các mô hình tiên tiến nhất. Một số người dùng báo cáo rằng mô hình thể hiện các mẫu viết tương tự như ChatGPT, cho thấy nó được huấn luyện trên dữ liệu tổng hợp từ các mô hình của OpenAI.

Người dùng kỹ thuật cũng đã nêu lên những mối quan ngại thực tế về việc triển khai mô hình. Một số thành viên cộng đồng báo cáo các vấn đề hiệu suất đáng kể với trang web của công ty, bao gồm việc sử dụng CPU cao từ các yếu tố trang trí và các vấn đề tương thích trình duyệt.

Hoàn toàn bực bội khi sử dụng. Đúng là nó chu đáo hơn một chút, tuyên bố đó là 100% đúng. Họ chỉ không đề cập rằng Hermes hoàn toàn không có khả năng thêm ngữ cảnh.

Mối quan ngại của cộng đồng:

  • Các vấn đề về hiệu suất website (sử dụng CPU cao, vấn đề tương thích trình duyệt)
  • Khả năng xử lý ngữ cảnh hạn chế (không hỗ trợ tải lên PDF)
  • Cách trình bày benchmark đáng ngờ (điểm số trung bình của đối thủ cạnh tranh so với các mô hình được nêu tên)
  • Sự tương đồng về phong cách viết với ChatGPT cho thấy ảnh hưởng của dữ liệu huấn luyện tổng hợp

Cuộc tranh luận về sự liên kết tiếp tục

Hermes 4 tham gia vào cuộc tranh luận đang diễn ra về sự liên kết AI và kiểm duyệt. Mô hình được thiết kế để có thể điều khiển được hơn so với các lựa chọn thay thế chính thống, có nghĩa là nó ít có khả năng từ chối các yêu cầu của người dùng. Định vị này thu hút những người dùng cảm thấy bực bội với những gì họ coi là các trợ lý AI quá hạn chế, mặc dù nó cũng đặt ra câu hỏi về khả năng lạm dụng tiềm ẩn.

Cuộc thảo luận của cộng đồng tiết lộ một căng thẳng rộng lớn hơn trong phát triển AI giữa các biện pháp an toàn và quyền tự chủ của người dùng. Trong khi một số đánh giá cao việc có các công cụ không thuyết giáo người dùng hoặc áp đặt các hạn chế theo phong cách doanh nghiệp, những người khác đặt câu hỏi liệu việc tập trung vào giảm từ chối có đến với cái giá của các khả năng quan trọng khác.

Việc phát hành Hermes 4 làm nổi bật cách trình bày mô hình AI và thiết kế tính cách đang trở nên quan trọng như các chỉ số hiệu suất thô. Liệu cách tiếp cận lấy cảm hứng từ anime này có đại diện cho sự đổi mới thực sự hay chỉ là mánh khóe tiếp thị vẫn là điểm tranh luận tích cực trong cộng đồng AI.

Tham khảo: HERMES 4