Dự án Astra của Google Phát Triển: Trợ lý AI Giờ đây Điều Khiển Điện thoại Android và Hành động Chủ động

BigGo Editorial Team
Dự án Astra của Google Phát Triển: Trợ lý AI Giờ đây Điều Khiển Điện thoại Android và Hành động Chủ động

Trợ lý AI thử nghiệm của Google đang có những bước tiến đáng kể để trở thành thứ mà công ty gọi là trợ lý AI đa năng. Dự án Astra, lần đầu tiên được giới thiệu tại Google I/O 2024, đã trở lại với những khả năng ấn tượng mới thể hiện tầm nhìn của Google về tương lai của các trợ lý AI có thể hiểu ngữ cảnh, lập kế hoạch và thực hiện hành động thay cho người dùng.

Mẫu Concept Car của Trợ lý AI

Dự án Astra đóng vai trò là bãi thử nghiệm của Google cho những tính năng trợ lý AI tham vọng nhất. Greg Wayne, giám đốc nghiên cứu tại Google DeepMind, mô tả nó như một mẫu concept car của trợ lý AI đa năng. Mặc dù không phải là sản phẩm tiêu dùng có sẵn cho công chúng, Astra hoạt động như một nền tảng thử nghiệm, nơi các tính năng thành công cuối cùng sẽ được đưa vào các sản phẩm chính thống như Gemini. Dự án này thể hiện tầm nhìn dài hạn của Google về trợ lý AI có thể tích hợp liền mạch vào cuộc sống hàng ngày của người dùng thông qua điện thoại và có thể cả kính thông minh.

Trí thông minh chủ động mới

Có lẽ tiến bộ đáng kể nhất trong Dự án Astra là khả năng chủ động mới. Không giống như các trợ lý truyền thống chỉ phản hồi khi được yêu cầu, Astra giờ đây có thể chọn thời điểm tham gia dựa trên những gì nó quan sát được. Astra có thể chọn thời điểm nói chuyện dựa trên các sự kiện nó nhìn thấy, Wayne giải thích. Nó thực sự đang quan sát liên tục, và sau đó có thể đưa ra bình luận. Điều này thể hiện một sự thay đổi cơ bản trong cách hoạt động của trợ lý AI, chuyển từ hỗ trợ phản ứng sang hỗ trợ chủ động.

Ứng dụng thực tế

Google đã trình diễn một số ứng dụng thực tế của khả năng chủ động này. Ví dụ, nếu Astra nhận thấy bạn mắc lỗi khi làm bài tập về nhà, nó có thể chỉ ra lỗi đó thay vì chờ bạn yêu cầu trợ giúp. Nếu bạn đang theo chế độ nhịn ăn gián đoạn, nó có thể nhắc nhở bạn khi cửa sổ ăn uống của bạn sắp đóng hoặc nhẹ nhàng đề nghị bạn xem xét lại việc ăn ngoài thời gian đã định.

Thách thức trong việc đọc hiểu tình huống

CEO DeepMind Demis Hassabis thừa nhận rằng việc dạy AI hành động phù hợp theo sáng kiến của riêng mình là vô cùng khó khăn. Ông gọi đó là đọc hiểu tình huống - biết khi nào nên can thiệp, dùng giọng điệu nào, làm thế nào để hữu ích, và khi nào nên giữ im lặng. Trí thông minh xã hội mà con người phát triển một cách tự nhiên này rất khó để lượng hóa và lập trình. Cái giá phải trả là rất cao, như Hassabis lưu ý: Không ai sẽ sử dụng nó nếu nó làm vậy, đề cập đến một trợ lý ngắt lời không phù hợp hoặc không hữu ích.

Điều khiển điện thoại Android của bạn

Một trong những màn trình diễn ấn tượng nhất tại Google I/O 2025 cho thấy Astra điều khiển trực tiếp các ứng dụng Android. Trong kịch bản sửa xe đạp, Astra có thể tìm sách hướng dẫn xe đạp, cuộn đến phần liên quan đến phanh, mở YouTube để tìm video hướng dẫn, và thậm chí có thể liên hệ với cửa hàng xe đạp - tất cả bằng cách mô phỏng các thao tác đầu vào trên màn hình thiết bị. Tác nhân AI Android này dường như đọc nội dung màn hình và quyết định nơi để nhấn hoặc vuốt, mặc dù theo báo cáo thì bản demo đã được tăng tốc, cho thấy công nghệ vẫn cần được tối ưu hóa.

Truy cập thông tin nâng cao

Để trở nên thực sự hữu ích, Astra giờ đây truy cập thông tin từ web và các sản phẩm Google khác. Nó có thể kiểm tra lịch của bạn để cho bạn biết khi nào nên rời đi để đến cuộc hẹn, tìm kiếm email của bạn để lấy số xác nhận, hoặc tìm thông tin liên quan đến những gì camera điện thoại của bạn đang nhìn thấy. Trong một bản demo, quản lý sản phẩm Bibo Xiu đã cho thấy Astra nhận diện tai nghe Sony thông qua camera, tìm sách hướng dẫn, giải thích quy trình ghép nối, và sau đó tự động mở Cài đặt để ghép nối tai nghe.

Con đường đến với việc áp dụng rộng rãi

Mặc dù Dự án Astra thể hiện tầm nhìn đầy tham vọng của Google, công ty đang áp dụng cách tiếp cận có chừng mực để triển khai những khả năng này. Nhiều tính năng đang được tích hợp vào Gemini Live và các sản phẩm khác trước khi có thể quay trở lại giao diện trợ lý toàn diện. Công nghệ này đối mặt với những thách thức đáng kể, bao gồm đảm bảo độ tin cậy, giải quyết các vấn đề về quyền riêng tư, và tạo ra giao diện người dùng trực quan.

Lộ trình phát triển Project Astra:

  • Ban đầu được giới thiệu tại Google I/O 2024
  • Các tính năng mới được trình diễn tại Google I/O 2025
  • Hiện đang trong giai đoạn thử nghiệm giới hạn, chưa có sẵn cho công chúng
  • Các tính năng đang dần được tích hợp vào Gemini và các sản phẩm khác của Google

Cạnh tranh trong không gian Trợ lý AI

Google không đơn độc trong việc theo đuổi tầm nhìn này. Apple đang làm việc trên những khả năng tương tự cho Siri thế hệ tiếp theo, với cả hai công ty đều nhắm đến việc tạo ra các trợ lý có thể điều hướng ứng dụng, điều chỉnh cài đặt, phản hồi tin nhắn và thực hiện các tác vụ phức tạp mà không yêu cầu người dùng chạm vào màn hình. Đây là ranh giới tiếp theo trong cuộc cạnh tranh trợ lý AI giữa các gã khổng lồ công nghệ.

Các Khả Năng Chính Của Project Astra:

  • Hỗ trợ chủ động: Có thể quan sát và bình luận mà không cần được yêu cầu
  • Điều khiển thiết bị: Mô phỏng đầu vào màn hình để điều hướng các ứng dụng Android
  • Truy cập thông tin: Tích hợp với các dịch vụ của Google (lịch, email, v.v.)
  • Thị giác máy tính: Nhận diện đối tượng thông qua camera điện thoại
  • Bộ nhớ: Ghi nhớ vị trí đặt đồ vật hoặc thông tin đã xem trước đó

Tầm nhìn tương lai

Hassabis tin rằng một trợ lý AI thực sự đa năng đòi hỏi mức độ thông minh chủ động và khả năng điều khiển thiết bị này. Cần một mức độ thông minh khác để có thể đạt được điều đó, ông nói. Nhưng nếu bạn có thể, nó sẽ cảm thấy hoàn toàn khác biệt so với các hệ thống hiện nay. Tôi nghĩ một trợ lý đa năng phải có nó để thực sự hữu ích. Mặc dù việc hiện thực hóa đầy đủ tầm nhìn này có thể vẫn còn nhiều năm nữa, Dự án Astra cung cấp một cái nhìn hấp dẫn về nơi Google tin rằng các trợ lý AI đang hướng tới.