Ngành công nghiệp game đang chứng kiến một biên giới mới trong trí tuệ nhân tạo khi các nhà phát triển giải quyết thách thức phức tạp trong việc tạo ra những nhân vật phi người chơi (NPC) thực sự tương tác. Những gì bắt đầu như các dự án đầy tham vọng để mang các nhân vật được hỗ trợ bởi AI trở nên sống động đã tiết lộ những rào cản kỹ thuật bất ngờ, đặc biệt trong việc quản lý ngữ cảnh AI - thông tin mà các hệ thống AI sử dụng để duy trì cuộc trò chuyện và ghi nhớ các tương tác.
Suy giảm hiệu suất với ngữ cảnh ngày càng mở rộng
Một trong những vấn đề quan trọng nhất mà các nhà phát triển phải đối mặt là tác động hiệu suất đáng kể của việc mở rộng ngữ cảnh AI. Các mô hình AI cục bộ như Mistral-Nemo có thể thấy tốc độ tạo token của chúng giảm mạnh từ 70 token mỗi giây xuống chỉ còn 20 token mỗi giây khi xử lý khoảng 10.000 token ngữ cảnh. Sự sụt giảm hiệu suất này không chỉ làm chậm các tương tác - nó thay đổi cơ bản cách các NPC hoạt động, khi các mô hình ngôn ngữ lớn bắt đầu bỏ qua thông tin ngữ cảnh khi nó trở nên quá rộng lớn.
Cộng đồng đã xác định điều này như một hạn chế cốt lõi ảnh hưởng đến tính khả thi của AI NPC. Một số nhà phát triển cho rằng chỉ có các mô hình dựa trên đám mây hiện tại mới cung cấp hiệu suất cần thiết cho các tương tác NPC tinh vi, mặc dù điều này đi kèm với những tác động chi phí đáng kể đối với các nhà phát triển game.
So sánh Tác động Hiệu suất
- Mistral-Nemo ở ngữ cảnh bình thường: 70 token/giây
- Mistral-Nemo ở ngữ cảnh 10.000 token: 20 token/giây
- Suy giảm hiệu suất: giảm tốc độ ~71%
Ngữ cảnh không gian và thông tin có chọn lọc
Để giải quyết những hạn chế này, các nhà phát triển đang triển khai các hệ thống không gian hạn chế những gì NPC có thể nghe và biết dựa trên vị trí ảo và hoàn cảnh của chúng. Cách tiếp cận này phục vụ mục đích kép: nó giảm tải tính toán bằng cách giữ ngữ cảnh ở mức có thể quản lý được, và nó tạo ra hành vi NPC thực tế hơn bằng cách ngăn các nhân vật có kiến thức toàn tri về tất cả các sự kiện trong game.
Cách tiếp cận thông tin có chọn lọc này đã được chứng minh là đặc biệt quan trọng để duy trì tính nhất quán của nhân vật. Các NPC không hoạt động trong thời gian dài có thể mất danh tính của chúng nếu ngữ cảnh của chúng trở nên lộn xộn với các cuộc trò chuyện không liên quan từ các nhân vật khác.
Các Giải Pháp Kỹ Thuật Chính Đang Được Khám Phá
- Tóm tắt thường xuyên với RAG tự phát triển ( Retrieval-Augmented Generation )
- Tích hợp cơ sở dữ liệu Vector và SQL cho bộ nhớ NPC
- Hệ thống không gian để giới hạn nhận thức của NPC
- Mô phỏng nền với nhiều mức độ chi tiết khác nhau
- Làm sạch ngữ cảnh để loại bỏ thông tin liên quan đến công cụ
Thách thức mô phỏng nền
Cộng đồng game đang tích cực tranh luận về cách xử lý NPC khi người chơi không tương tác trực tiếp với chúng. Các game truyền thống đơn giản chỉ đóng băng các nhân vật không hoạt động, nhưng AI NPC với tính cách phức tạp và ký ức đặt ra những câu hỏi mới về việc duy trì ảo tưởng về cuộc sống đang diễn ra.
Với các NPC phức tạp hơn, liệu việc cuộc sống của chúng tạm dừng khi chúng ta đi vắng có phá vỡ ảo tưởng không?
Một số nhà phát triển đề xuất chạy các mô phỏng nền đơn giản hóa, tương tự như các cách tiếp cận được sử dụng trong các game như X4: Foundations , duy trì nhiều mức độ trung thực cho các khu vực khác nhau của thế giới game. Những người khác đề xuất tạo ra các sự kiện câu chuyện nền phù hợp khi người chơi tái nhập vào phạm vi tương tác của NPC, tạo ra ấn tượng rằng cuộc sống đã tiếp tục trong sự vắng mặt của họ.
Kỹ thuật ngữ cảnh như một ngành học mới
Thuật ngữ kỹ thuật ngữ cảnh đang thu hút sự chú ý khi các nhà phát triển nhận ra rằng việc quản lý ngữ cảnh AI đòi hỏi các kỹ năng chuyên môn vượt ra ngoài kỹ thuật prompt truyền thống. Điều này bao gồm việc triển khai các hệ thống tóm tắt tự động, quản lý bộ nhớ và cơ chế chuyển đổi ngữ cảnh hoạt động ở hậu trường.
Tuy nhiên, những thách thức cơ bản vẫn còn. Các mô hình AI sở hữu kiến thức rộng lớn mở rộng xa hơn các vai trò nhân vật dự định của chúng, khiến người chơi dễ dàng phá vỡ sự đắm chìm trong nhân vật bằng cách hỏi NPC về các chủ đề mà chúng không nên biết, chẳng hạn như lập trình hoặc các lý thuyết khoa học.
Việc phát triển AI NPC thực sự thuyết phục dường như đòi hỏi không chỉ quản lý ngữ cảnh tốt hơn, mà còn có thể cần các cách tiếp cận mới để hạn chế kiến thức AI và duy trì ranh giới nhân vật. Khi công nghệ phát triển, ngành công nghiệp game tiếp tục khám phá các giải pháp cân bằng hiệu quả tính toán với giấc mơ tạo ra các nhân vật ảo thực sự tương tác.
Tham khảo: Importance of context management in AI NPCs