Tác nhân nghiên cứu TTD-DR của Google gây tranh cãi về việc lạm dụng thuật ngữ "Diffusion"

Nhóm Cộng đồng BigGo
Tác nhân nghiên cứu TTD-DR của Google gây tranh cãi về việc lạm dụng thuật ngữ "Diffusion"

Google đã giới thiệu Test-Time Diffusion Deep Researcher ( TTD-DR ), một framework nghiên cứu AI mới tuyên bố vượt trội hơn hệ thống Deep Research của OpenAI . Tuy nhiên, thông báo này đã kích thích cuộc thảo luận sôi nổi trong cộng đồng công nghệ về việc liệu hệ thống có thực sự sử dụng kỹ thuật diffusion hay chỉ đơn giản mượn thuật ngữ này để tạo sức hút marketing.

Trang web của Google Research trình bày chi tiết về khung Test-Time Diffusion Deep Researcher ( TTD-DR )
Trang web của Google Research trình bày chi tiết về khung Test-Time Diffusion Deep Researcher ( TTD-DR )

Cộng đồng đặt câu hỏi về tuyên bố Diffusion của Google

Các chuyên gia công nghệ đang tỏ ra nghi ngờ về việc Google sử dụng thuật ngữ diffusion để mô tả TTD-DR . Hệ thống hoạt động bằng cách tạo ra một bản thảo báo cáo ban đầu và sau đó cải thiện nó một cách lặp đi lặp lại thông qua nghiên cứu bổ sung và truy xuất thông tin. Các nhà phê bình cho rằng quy trình này có rất ít điểm tương đồng với các mô hình diffusion thực tế, vốn thường bắt đầu với nhiễu ngẫu nhiên và dần dần khử nhiễu thông qua các phép biến đổi đã học.

Điều đó nói rằng, đây có vẻ như là một sự lạm dụng thực sự thuật ngữ diffusion, theo như tôi có thể hiểu. Tôi không nghĩ thứ này đang đảo ngược bất kỳ entropy nào trên bất kỳ không gian tiềm ẩn nào.

Cuộc tranh cãi này làm nổi bật một xu hướng rộng lớn hơn trong nghiên cứu AI, nơi các thuật ngữ kỹ thuật đã được thiết lập đôi khi bị kéo dài để mô tả các khái niệm liên quan lỏng lẻo, có thể tạo ra sự nhầm lẫn trong lĩnh vực này.

Các thành phần của khung TTD-DR:

  • Giai đoạn 1: Tạo kế hoạch nghiên cứu
  • Giai đoạn 2a: Tạo câu hỏi tìm kiếm
  • Giai đoạn 2b: Tìm kiếm câu trả lời với hệ thống giống RAG
  • Giai đoạn 3: Tổng hợp báo cáo cuối cùng
  • Cải tiến: Thuật toán tự tiến hóa theo từng thành phần
  • Tinh chỉnh: Khử nhiễu cấp báo cáo với truy xuất

Tuyên bố về hiệu suất cho thấy tiềm năng bất chấp các vấn đề về thuật ngữ

Bỏ qua cuộc tranh luận về tên gọi, những cải thiện hiệu suất được báo cáo của TTD-DR đáng chú ý. Hệ thống đạt được tỷ lệ thắng 74.5% so với Deep Research của OpenAI trong các tác vụ tạo báo cáo dạng dài. Nó cũng cho thấy sự cải thiện 7.7% và 1.7% trên hai bộ dữ liệu nghiên cứu yêu cầu khả năng tìm kiếm và lập luận mở rộng.

Framework sử dụng phương pháp ba giai đoạn: tạo kế hoạch nghiên cứu, thực hiện tìm kiếm lặp với tạo sinh tăng cường truy xuất, và tạo ra báo cáo cuối cùng. Điều làm nó khác biệt là phương pháp draft-first, nơi một báo cáo thô ban đầu hướng dẫn các hướng nghiên cứu tiếp theo thay vì tuân theo một kế hoạch định trước.

So sánh hiệu suất với OpenAI Deep Research:

  • Tạo báo cáo dạng dài: tỷ lệ thắng 74.5%
  • Bộ dữ liệu HLE-Search: cải thiện +7.7%
  • Bộ dữ liệu GAIA: cải thiện +1.7%
  • Mô hình cơ sở: Gemini 2.5-pro
Minh họa về phương pháp tiếp cận có hệ thống để giải quyết các câu hỏi, tương tự như quy trình tạo báo cáo lặp của TTD-DR
Minh họa về phương pháp tiếp cận có hệ thống để giải quyết các câu hỏi, tương tự như quy trình tạo báo cáo lặp của TTD-DR

Mối quan ngại về khả năng tiếp cận và rào cản triển khai

Mặc dù nghiên cứu cho thấy tiềm năng, khả năng tiếp cận thực tế vẫn còn hạn chế. Hệ thống hiện chỉ có sẵn thông qua nền tảng AgentSpace của Google , yêu cầu đăng ký Enterprise Agentic . Giá cho dịch vụ này chưa được tiết lộ, có thể hạn chế việc áp dụng trong các nhà nghiên cứu cá nhân và các tổ chức nhỏ hơn.

Tuy nhiên, một số thành viên cộng đồng cho rằng phương pháp này có thể được sao chép độc lập, lưu ý rằng các khái niệm cơ bản đủ đơn giản để triển khai bằng cách sử dụng các công cụ mã nguồn mở và mô hình ngôn ngữ hiện có.

Tiêu chuẩn đánh giá:

  • DeepConsult: Báo cáo toàn diện dạng dài
  • Humanity's Last Exam (HLE-Search): 200 truy vấn con được lấy mẫu yêu cầu tìm kiếm và lý luận
  • GAIA: Truy vấn đa bước với yêu cầu tìm kiếm mở rộng

Ý nghĩa rộng lớn hơn đối với phương pháp nghiên cứu AI

Phương pháp TTD-DR phản ánh sự quan tâm ngày càng tăng trong việc làm cho các hệ thống AI hoạt động giống như các nhà nghiên cứu con người hơn. Quy trình lặp của việc soạn thảo, nghiên cứu và tinh chỉnh phản ánh cách con người tự nhiên tiếp cận các tác vụ viết phức tạp. Phương pháp lấy cảm hứng từ con người này có thể có ứng dụng ngoài các báo cáo nghiên cứu, có thể cải thiện các trợ lý lập trình và các công cụ AI khác hưởng lợi từ việc tinh chỉnh lặp.

Cuộc tranh luận xung quanh TTD-DR cũng đặt ra những câu hỏi quan trọng về các tiêu chuẩn thuật ngữ trong nghiên cứu AI phát triển nhanh chóng, nơi giao tiếp rõ ràng trở nên quan trọng khi lĩnh vực này trở nên phức tạp và liên ngành hơn.

Tham khảo: Deep researcher with test-time diffusion