Một công cụ viết truyện được hỗ trợ bởi AI cho phép tác giả chỉnh sửa câu chuyện thông qua thao tác hình ảnh đang thu hút sự chú ý từ các nhà phát triển và nhà nghiên cứu. Hệ thống tự động tạo ra bản đồ hình ảnh của các yếu tố câu chuyện như di chuyển nhân vật, dòng thời gian và mối quan hệ, sau đó cho phép người viết chỉnh sửa câu chuyện của họ bằng cách kéo và kết nối các thành phần hình ảnh này.
Công cụ hoạt động bằng cách sử dụng GPT-4o để phân tích văn bản viết và trích xuất thông tin câu chuyện chính. Người viết sau đó có thể tương tác với các biểu diễn hình ảnh để thực hiện thay đổi - kết nối hai nhân vật gợi ý các tương tác mới, di chuyển nhân vật cập nhật vị trí của họ, và sắp xếp lại các sự kiện trên dòng thời gian để tái cấu trúc trình tự thời gian của câu chuyện. Những chỉnh sửa hình ảnh này tự động tạo ra các gợi ý văn bản để phù hợp với cấu trúc câu chuyện mới.
Tính năng chính
- Tự động tạo hình ảnh trực quan cho câu chuyện từ văn bản
- Lập bản đồ chuyển động nhân vật và mối quan hệ
- Thao tác dòng thời gian tương tác
- Gợi ý chỉnh sửa văn bản theo thời gian thực
- Giao diện chỉnh sửa câu chuyện bằng kéo thả trực quan
Ứng dụng trong game thúc đẩy sự quan tâm của cộng đồng
Những cuộc thảo luận thú vị nhất tập trung vào các ứng dụng tiềm năng trong gaming. Các thành viên cộng đồng nhanh chóng xác định được cơ hội cho việc tạo câu chuyện theo thủ tục trong các game như Dwarf Fortress , nơi những câu chuyện phức tạp nổi lên từ gameplay. Phương pháp hình ảnh có thể giúp các nhà phát triển game tạo ra những trải nghiệm phiêu lưu dựa trên văn bản và nhập vai tinh vi hơn.
Một nhà phát triển đã lưu ý đến tiềm năng của công cụ trong việc tăng cường các game dựa trên văn bản cổ điển với khả năng AI hiện đại. Điều này gợi ý một cầu nối giữa tiểu thuyết tương tác truyền thống và các mô hình ngôn ngữ đương đại, mở ra những khả năng mới cho việc kể chuyện động trong game.
Mối quan ngại học thuật về bối cảnh nghiên cứu
Một số nhà nghiên cứu đã nêu lên mối quan ngại về nền tảng học thuật của dự án. Các nhà phê bình chỉ ra việc thiếu tham chiếu đến các công trình đã được thiết lập trong hiểu biết câu chuyện tính toán, đặc biệt là hệ thống Genesis của Patrick Winston từ MIT . Nghiên cứu hàng thập kỷ trước này đã đặt nền móng cho việc phân tích và tạo câu chuyện dựa trên máy tính.
Cuộc tranh luận làm nổi bật những căng thẳng đang diễn ra trong nghiên cứu AI giữa việc tạo mẫu nhanh và nền tảng học thuật kỹ lưỡng. Trong khi phương pháp chỉnh sửa hình ảnh mang lại sự đổi mới thực tế, một số người cho rằng nó nên thừa nhận tốt hơn công việc trước đây trong các hệ thống tường thuật tính toán.
Triển khai kỹ thuật và khả năng tiếp cận
Công cụ chạy cục bộ trong trình duyệt web sử dụng TypeScript và React , yêu cầu người dùng cung cấp khóa API OpenAI của riêng họ. Phương pháp này giữ dữ liệu người dùng riêng tư trong khi tận dụng các mô hình ngôn ngữ mạnh mẽ để phân tích câu chuyện. Hệ thống hoạt động tốt nhất với các phiên bản gần đây của Chrome hoặc Firefox .
Đối với những người không có quyền truy cập API, giao diện vẫn hoạt động nhưng không thể xử lý các chỉnh sửa câu chuyện thực tế. Các nhà phát triển cung cấp hướng dẫn video và tài liệu học tập để giúp người dùng hiểu các khái niệm chỉnh sửa hình ảnh.
Dự án đại diện cho một sự kết hợp thú vị giữa các công cụ viết truyền thống với khả năng AI hiện đại. Bằng cách làm cho cấu trúc câu chuyện trở nên có thể nhìn thấy và thao tác được, nó có thể thay đổi cách người viết tiếp cận việc xây dựng câu chuyện, cho dù là cho văn học, game hay các phương tiện tương tác khác.
Tham khảo: Visual Story-Writing: Writing by Manipulating Visual Representations