Một khái niệm mới có tên gọi deep agents đã gây ra cuộc thảo luận sôi nổi trong cộng đồng phát triển AI, với nhiều người đặt câu hỏi liệu những hệ thống này có đại diện cho sự đổi mới thực sự hay chỉ đơn giản là các phiên bản được thiết kế tốt của công nghệ AI agent hiện có.
Thuật ngữ này xuất hiện từ việc phân tích các ứng dụng AI thành công như Claude Code , Deep Research , và Manus , những hệ thống thể hiện hiệu suất vượt trội trong các tác vụ phức tạp, dài hạn so với các AI agent cơ bản. Những hệ thống này có thể xử lý các dự án nghiên cứu, bài tập lập trình và các công việc đòi hỏi khác cần sự tập trung và lập kế hoạch bền bỉ.
Các ví dụ về ứng dụng Deep Agent
- Claude Code: Trợ lý lập trình AI với khả năng lập kế hoạch danh sách công việc và tạo ra các sub-agent
- Deep Research: Trợ lý nghiên cứu AI cho các tác vụ thu thập thông tin phức tạp
- Manus: AI agent sử dụng hệ thống file một cách đáng kể để quản lý bộ nhớ
- Junie ( JetBrains ): Triển khai sớm tính năng lập kế hoạch danh sách công việc chất lượng cao
- Cursor: Tính năng danh sách công việc tích hợp giao diện người dùng cho các tác vụ phát triển
Kiến trúc cốt lõi vẫn đơn giản
Mặc dù có khả năng ấn tượng, công nghệ cơ bản lại đơn giản một cách đáng ngạc nhiên. Deep agents vẫn sử dụng cách tiếp cận cơ bản giống như các AI agent thông thường: một mô hình ngôn ngữ lớn chạy trong vòng lặp và gọi các công cụ khi cần thiết. Điều kỳ diệu không nằm ở các thuật toán mới mang tính cách mạng, mà ở bốn cải tiến chính giúp biến đổi các shallow agent thành những trợ lý có khả năng.
Thành phần quan trọng nhất dường như là các system prompt chi tiết. Những hướng dẫn này có thể cực kỳ dài và chứa các chỉ dẫn cụ thể về cách sử dụng công cụ, cùng với các ví dụ cho thấy cách xử lý các tình huống khác nhau. Không có những prompt toàn diện này, các agent sẽ mất đi phần lớn hiệu quả của chúng.
Các Thành Phần Chính của Deep Agents
Thành Phần | Mục Đích | Triển Khai |
---|---|---|
System Prompt Chi Tiết | Cung cấp hướng dẫn và ví dụ toàn diện | Prompt dài với hướng dẫn sử dụng công cụ và các ví dụ few-shot |
Công Cụ Lập Kế Hoạch | Duy trì sự tập trung và tổ chức | Công cụ danh sách todo không hoạt động để thiết kế ngữ cảnh |
Sub-Agents | Chia nhỏ các tác vụ phức tạp | Các agent chuyên biệt với prompt tập trung và công cụ hạn chế |
Hệ Thống File | Cung cấp bộ nhớ và không gian làm việc | Lưu trữ bền vững cho ghi chú và cộng tác giữa các agent |
Các công cụ lập kế hoạch không làm gì cả
Một trong những khám phá thú vị nhất là cách những hệ thống này sử dụng các công cụ lập kế hoạch no-op. Claude Code sử dụng một công cụ danh sách việc cần làm không thực sự thực hiện bất kỳ hành động bên ngoài nào - nó chỉ đơn giản giúp AI tổ chức suy nghĩ và duy trì sự tập trung vào các mục tiêu dài hạn. Cách tiếp cận này ngăn chặn vấn đề phổ biến của các AI agent là mất dấu mục tiêu của chúng chỉ sau vài lần tương tác.
Một số nhà phát triển đã triển khai các hệ thống danh sách việc cần làm tương tự trong các dự án của riêng họ, thấy chúng hiệu quả một cách đáng ngạc nhiên trong việc giữ các AI agent đi đúng hướng trong suốt các tác vụ kéo dài. Các danh sách việc cần làm thậm chí có thể sử dụng cấu trúc lồng nhau, hoạt động tốt vì chúng vẫn dễ dàng cho các mô hình ngôn ngữ xử lý ở định dạng tuyến tính.
Sub-Agents và hệ thống tệp cho phép độ phức tạp
Khả năng tạo ra các sub-agent chuyên biệt cho phép những hệ thống này chia nhỏ các tác vụ phức tạp thành những phần có thể quản lý được. Mỗi sub-agent có thể tập trung vào một khía cạnh cụ thể của dự án tổng thể trong khi duy trì ngữ cảnh riêng và các hướng dẫn chuyên biệt. Sự phân chia công việc này giúp quản lý độ phức tạp mà nếu không sẽ làm choáng ngợp một agent đơn lẻ.
Quyền truy cập hệ thống tệp đóng vai trò như một không gian làm việc và hệ thống bộ nhớ. Các agent có thể lưu trữ ghi chú, chia sẻ thông tin với các sub-agent, và duy trì hồ sơ bền vững qua các tác vụ chạy dài. Khả năng này giải quyết một trong những thách thức lớn nhất trong thiết kế AI agent: quản lý ngữ cảnh và thông tin trong thời gian dài.
Sự hoài nghi của cộng đồng và thực tế triển khai
Cộng đồng nhà phát triển vẫn chia rẽ về việc liệu deep agents có xứng đáng được công nhận như một danh mục riêng biệt hay không. Những người chỉ trích cho rằng thuật ngữ này là cách nói marketing không cần thiết cho các agent truyền thống được triển khai tốt. Họ chỉ ra rằng kiến trúc vòng lặp và công cụ cốt lõi không thay đổi về cơ bản.
Deep agents = agents với lập kế hoạch + agents như công cụ => vậy là regular agents. Tôi ghét cách LangChain luôn cố gắng làm cho những thứ đơn giản có vẻ rất phức tạp.
Tuy nhiên, những người ủng hộ nhấn mạnh rằng sự kết hợp cụ thể của các tính năng tạo ra khả năng khác biệt về chất lượng. Sự tích hợp của các prompt chi tiết, công cụ lập kế hoạch, sub-agent và hệ thống tệp tạo ra kết quả vượt xa những gì các triển khai agent cơ bản có thể đạt được.
Thách thức triển khai thực tế
Mặc dù khái niệm có thể đơn giản, các nhà phát triển lưu ý rằng việc xây dựng các hệ thống agent sẵn sàng cho sản xuất bao gồm những thách thức kỹ thuật đáng kể. Các vấn đề như multi-tenancy, streaming responses, xử lý hủy bỏ, và tìm ra sự kết hợp đúng của các công cụ đòi hỏi chuyên môn đáng kể để giải quyết một cách thích hợp.
Một số triển khai mã nguồn mở đã xuất hiện, bao gồm các dự án cuối tuần và các framework toàn diện hơn. Những công cụ này nhằm làm cho khả năng deep agent trở nên dễ tiếp cận với các nhà phát triển làm việc trên các ứng dụng chuyên biệt trong nhiều ngành công nghiệp khác nhau.
Kết luận
Cuộc thảo luận về deep agents làm nổi bật một thực tế quan trọng trong phát triển AI: đôi khi những đổi mới hiệu quả nhất đến từ kỹ thuật suy nghĩ chu đáo hơn là những đột phá thuật toán. Cho dù thuật ngữ có được chấp nhận hay không, các kỹ thuật được thảo luận đại diện cho những tiến bộ thực tế trong việc làm cho các AI agent có khả năng và đáng tin cậy hơn cho các ứng dụng thế giới thực.
Cuộc tranh luận cũng phản ánh những căng thẳng rộng lớn hơn trong cộng đồng AI về marketing so với bản chất, và liệu những cải tiến từng bước có xứng đáng với tên danh mục mới hay không. Bất kể quy ước đặt tên, việc tập trung vào lập kế hoạch, quản lý ngữ cảnh và phân tách tác vụ cung cấp những hiểu biết có giá trị cho bất kỳ ai xây dựng hệ thống AI agent.
Tham khảo: Deep Agents