Rowboat Áp Dụng Phương Pháp Ngôn Ngữ Tự Nhiên Trong Xây Dựng AI Agent, Gây Tranh Luận Về Thiết Kế Sơ Đồ So Với Thiết Kế Hội Thoại

Nhóm Cộng đồng BigGo
Rowboat Áp Dụng Phương Pháp Ngôn Ngữ Tự Nhiên Trong Xây Dựng AI Agent, Gây Tranh Luận Về Thiết Kế Sơ Đồ So Với Thiết Kế Hội Thoại

Rowboat , một startup thuộc Y Combinator S24 , đã ra mắt một nền tảng mã nguồn mở cho phép người dùng xây dựng quy trình làm việc của AI agent thông qua các cuộc hội thoại bằng ngôn ngữ tự nhiên thay vì giao diện sơ đồ truyền thống. Cách tiếp cận này đã gây ra cuộc thảo luận sôi nổi trong cộng đồng nhà phát triển về tương lai của các công cụ tự động hóa agent.

Nền tảng này cho phép người dùng mô tả nhu cầu tự động hóa của họ bằng tiếng Anh đơn giản với một AI copilot, sau đó sẽ tự động xây dựng quy trình làm việc đa agent. Người dùng có thể tích hợp các công cụ, thêm tài liệu cho retrieval-augmented generation (RAG), thiết lập triggers và triển khai agents thông qua API hoặc SDK - tất cả mà không cần vẽ sơ đồ quy trình thủ công.

Tính năng chính

  • Xây dựng agent ngôn ngữ tự nhiên thông qua AI copilot
  • Tích hợp công cụ chỉ với một cú nhấp chuột
  • Hỗ trợ RAG tích hợp sẵn cho việc tải lên tài liệu và thu thập dữ liệu từ URL
  • Kích hoạt dựa trên thời gian và tự động hóa sự kiện
  • API và SDK cho các tích hợp tùy chỉnh
  • Tùy chọn triển khai tự lưu trữ ( Docker ) và đám mây

Mối Quan Ngại Về Tin Cậy Và Kiểm Soát Thách Thức Phương Pháp Ngôn Ngữ Tự Nhiên

Việc chuyển đổi khỏi các công cụ xây dựng quy trình trực quan đã đặt ra những câu hỏi quan trọng về độ tin cậy và giám sát hệ thống. Các thành viên cộng đồng đã nhấn mạnh rằng các công cụ xây dựng kiểu sơ đồ mang lại lợi thế rõ ràng trong việc thiết lập niềm tin, cho phép các nhà phát triển chèn các bước phê duyệt của con người và đảm bảo các hành động quan trọng được thực hiện trong các điều kiện cụ thể. Khả năng hiển thị này giúp việc kiểm toán và xác minh hành vi hệ thống trước khi triển khai trở nên dễ dàng hơn.

Đội ngũ Rowboat thừa nhận sự đánh đổi này, cho rằng niềm tin vào các hệ thống agent phải được xây dựng thông qua kiểm tra thực nghiệm thay vì xác minh trực quan. Họ đề xuất bắt đầu với kiểm tra thủ công và mở rộng quy mô với các mô phỏng dựa trên AI để bao phủ nhiều tình huống hơn, đồng thời sử dụng nhiều agents chuyên biệt để cô lập và kiểm tra các thành phần riêng biệt.

Các Ứng Dụng Thực Tế Cho Thấy Tiềm Năng Mặc Dù Gặp Thách Thức Tích Hợp

Những người dùng đầu tiên đã thử nghiệm Rowboat cho các tác vụ tự động hóa khác nhau, bao gồm giám sát tin tức và quy trình đăng bài trên mạng xã hội. Tuy nhiên, một số đã gặp phải các trở ngại kỹ thuật với tích hợp bên thứ ba, đặc biệt là với các dịch vụ như Instagram thông qua Composio connectors, dẫn đến lỗi 400 và gián đoạn quy trình làm việc.

Nền tảng này cung cấp một số khả năng tích hợp sẵn bao gồm tìm kiếm web, duyệt Reddit và triggers dựa trên thời gian. Rowboat cung cấp cả phiên bản tự lưu trữ và đám mây, với mức giá bắt đầu từ 20 đô la Mỹ cho các gói cơ bản và tăng lên 200 đô la Mỹ cho sử dụng chuyên nghiệp, với các tùy chọn trả theo sử dụng được lên kế hoạch.

Cấu trúc giá

  • Gói Starter: $20 USD
  • Gói Pro: $200 USD
  • Giá trả theo sử dụng: Sắp ra mắt

Định Vị Cạnh Tranh Với Các Công Cụ Quy Trình Đã Thiết Lập

Khi so sánh với các nền tảng đã được thiết lập như n8n và Relevance AI , Rowboat nhấn mạnh trọng tâm của mình vào các mẫu agentic thay vì kết nối API tuyến tính. Đội ngũ lập luận rằng các tình huống ra quyết định phức tạp, phi tuyến tính trở nên khó sử dụng trong các định dạng sơ đồ, đặc biệt là cho hỗ trợ khách hàng hoặc các trường hợp sử dụng tương tác con người khác.

Chúng tôi tin tưởng mạnh mẽ rằng một công cụ xây dựng kiểu sơ đồ nhanh chóng đạt đến giới hạn về loại trợ lý mà bạn có thể xây dựng với nó. Và điều này liên quan đến thực tế là nhiều tác vụ trong thế giới thực không có quy trình được định nghĩa rõ ràng.

Nền tảng sử dụng agent SDK của OpenAI với ba loại agents: conversational agents tương tác với người dùng, task agents để xử lý nội bộ, và pipeline agents cho các hoạt động tuần tự. Kiến trúc này nhằm xử lý các tình huống phức tạp mà sẽ yêu cầu logic nhảy mở rộng trong các hệ thống sơ đồ truyền thống.

Các loại Agent trong Rowboat

  • Conversational agents: Có thể trò chuyện với người dùng, gọi các công cụ và chuyển giao cho các agent khác
  • Task agents: Các agent nội bộ có thể gọi các công cụ nhưng không thể tương tác với người dùng
  • Pipeline agents: Chuỗi tuần tự các task agent với luồng điều khiển xác định

Nhìn Về Phía Trước

Rowboat đại diện cho một cược lớn vào sự phát triển của khả năng AI, giả định rằng việc cải thiện các mô hình ngôn ngữ sẽ làm cho việc định nghĩa quy trình làm việc rõ ràng trở nên không cần thiết. Liệu cách tiếp cận ngôn ngữ tự nhiên này có thể mang lại độ tin cậy và minh bạch mà người dùng doanh nghiệp yêu cầu hay không vẫn còn phải chờ xem, nhưng sự tham gia sớm của cộng đồng cho thấy sự quan tâm mạnh mẽ đến các lựa chọn thay thế cho các công cụ tự động hóa truyền thống.

RAG (Retrieval-Augmented Generation): Một kỹ thuật nâng cao phản hồi AI bằng cách kết hợp thông tin liên quan từ các tài liệu hoặc cơ sở dữ liệu bên ngoài.

Tham khảo: rowboat