Thiết bị AI không màn hình của OpenAI đối mặt với những trở ngại kỹ thuật lớn khi cộng đồng đặt câu hỏi về tính thực tiễn

Nhóm Cộng đồng BigGo
Thiết bị AI không màn hình của OpenAI đối mặt với những trở ngại kỹ thuật lớn khi cộng đồng đặt câu hỏi về tính thực tiễn

OpenAI và cựu giám đốc thiết kế Apple Jony Ive đang gặp phải những trở ngại kỹ thuật đáng kể trong việc phát triển thiết bị AI không màn hình đầy tham vọng của họ, làm dấy lên câu hỏi liệu sản phẩm này có thể thực hiện được những lời hứa hay không. Thương vụ mua lại công ty của Ive với giá 6,5 tỷ đô la Mỹ vào tháng 5 năm 2024 nhằm mang chuyên môn thiết kế của Apple đến với tham vọng phần cứng của OpenAI , nhưng thực tế việc tạo ra một trợ lý AI cách mạng đang chứng tỏ phức tạp hơn dự kiến.

Thiết bị này, có kích thước xấp xỉ một chiếc smartphone nhưng không có màn hình, nhằm mục đích cách mạng hóa cách người dùng tương tác với AI thông qua giọng nói và cảm biến hình ảnh. Tuy nhiên, cộng đồng công nghệ đang bày tỏ những nghi ngờ nghiêm trọng về cả tính khả thi kỹ thuật và tiện ích thực tiễn của sản phẩm như vậy.

Bối cảnh thị trường:

  • Việc OpenAI mua lại công ty của Jony Ive: 6,5 tỷ USD (tháng 5/2024)
  • Định giá hiện tại của OpenAI: 500 tỷ USD
  • Các sản phẩm cạnh tranh: Amazon Echo/Alexa, Google Home, Humane AI pin đã ngừng sản xuất
  • Thị trường mục tiêu: Nâng cấp loa thông minh với khả năng AI tiên tiến

Sức mạnh tính toán tạo ra nút thắt cổ chai lớn

Một trong những thách thức cấp bách nhất mà dự án đối mặt là yêu cầu tính toán khổng lồ cần thiết để chạy các mô hình tiên tiến của OpenAI trên một thiết bị tiêu dùng. Không giống như các thiết bị Alexa của Amazon hay Google Home , vốn dựa vào công nghệ nhận dạng giọng nói đơn giản hơn, tầm nhìn của OpenAI đòi hỏi sức mạnh xử lý đáng kể hơn nhiều. Điều này tạo ra những lo ngại về cả chi phí và tuổi thọ pin mà nhóm vẫn chưa giải quyết được.

Bản chất luôn hoạt động của thiết bị làm trầm trọng thêm những vấn đề này. Không giống như các loa thông minh hiện tại được kích hoạt bằng từ đánh thức, thiết bị này sẽ liên tục giám sát môi trường xung quanh, xây dựng cái mà công ty gọi là bộ nhớ suốt cả ngày. Cách tiếp cận này đặt ra những câu hỏi tức thì về tiêu thụ điện năng và liệu công nghệ pin hiện tại có thể hỗ trợ các hoạt động chuyên sâu như vậy hay không.

Thách thức kỹ thuật:

  • Yêu cầu về sức mạnh tính toán để chạy các mô hình OpenAI
  • Thời lượng pin cho hoạt động luôn bật
  • Quản lý tính cách AI và cuộc trò chuyện
  • Mối quan ngại về quyền riêng tư và thu thập dữ liệu
  • Mở rộng quy mô cơ sở hạ tầng cho việc triển khai tiêu dùng đại chúng

Tính cách AI chứng tỏ khó khăn một cách đáng ngạc nhiên

Có lẽ thách thức lớn hơn cả những hạn chế về phần cứng là việc xác định cách AI nên hành xử trong các cuộc trò chuyện thực tế. Nhóm phát triển đang gặp khó khăn với những câu hỏi cơ bản về khi nào thiết bị nên lên tiếng và khi nào nên giữ im lặng. Việc cân bằng sai có thể dẫn đến một trợ lý hoặc liên tục ngắt lời hoặc không thể giúp đỡ khi cần thiết.

Tính cách mô hình là một điều khó cân bằng. Nó không thể quá xu nịnh, không quá trực tiếp, hữu ích, nhưng không tiếp tục nói trong một vòng lặp phản hồi.

Cộng đồng đã chỉ ra rằng ngay cả các hệ thống AI hiện tại như ChatGPT cũng gặp khó khăn trong việc biết khi nào kết thúc cuộc trò chuyện, khiến một thiết bị luôn lắng nghe trở nên đặc biệt có vấn đề. Người dùng đã so sánh khái niệm này với tính năng Recall gây tranh cãi của Microsoft , làm nổi bật những lo ngại về quyền riêng tư liên quan đến việc giám sát liên tục.

Kiểm tra thực tế thị trường từ cộng đồng công nghệ

Phản ứng của cộng đồng công nghệ đã đặc biệt hoài nghi, với nhiều người đặt câu hỏi liệu việc loại bỏ màn hình có thực sự cải thiện trải nghiệm người dùng hay không. Các nhà phê bình lập luận rằng màn hình vẫn là cách hiệu quả nhất để truyền đạt thông tin phức tạp, và giao diện chỉ bằng giọng nói trở nên tẻ nhạt đối với bất cứ điều gì ngoài các lệnh đơn giản.

Những nỗ lực trước đây với các thiết bị AI không màn hình phần lớn đã thất bại trên thị trường. AI pin của Humane đã bị ngừng sản xuất, và mặt dây chuyền AI Friend nhận được chỉ trích vì đáng sợ. Những thất bại này cho thấy người tiêu dùng có thể chưa sẵn sàng cho các bạn đồng hành AI luôn hoạt động, bất kể công nghệ có tinh vi đến đâu.

Dự án cũng đối mặt với thách thức phân biệt bản thân với các loa thông minh hiện có trong khi biện minh cho mức giá cao cấp có thể. Nhiều người dùng đã lưu ý rằng họ đã không tận dụng hết các trợ lý giọng nói hiện tại như Siri , chủ yếu sử dụng chúng cho các tác vụ cơ bản như đặt hẹn giờ thay vì các tương tác phức tạp.

Thông số kỹ thuật thiết bị:

  • Kích thước: Bằng lòng bàn tay, khoảng bằng kích thước smartphone
  • Màn hình: Không có màn hình
  • Đầu vào: Camera, microphone, cảm biến môi trường
  • Đầu ra: Loa để phát âm thanh phản hồi
  • Hoạt động: Giám sát liên tục (không cần từ đánh thức)
  • Tính di động: Thiết kế để sử dụng trên bàn làm việc/bàn nhưng có thể mang theo

Lo ngại về quyền riêng tư gia tăng

Khả năng ghi âm luôn hoạt động đặt ra những câu hỏi đáng kể về quyền riêng tư vượt ra ngoài chủ sở hữu thiết bị. Việc ghi lại các cuộc trò chuyện liên quan đến người khác mà không có sự đồng ý rõ ràng của họ có thể tạo ra các biến chứng pháp lý và xã hội. Cộng đồng đã bày tỏ lo ngại đặc biệt về một thiết bị ghi lại mọi người xung quanh bạn, mọi lúc.

Những thách thức về quyền riêng tư này trở nên phức tạp hơn khi xem xét việc sử dụng dự định của thiết bị trong các môi trường xã hội và nghề nghiệp khác nhau. Không giống như smartphone, mà người dùng có ý thức kích hoạt để ghi âm, một trợ lý AI luôn lắng nghe làm mờ ranh giới của sự đồng ý và giám sát.

Bất chấp những thách thức này, OpenAI tiếp tục tuyển dụng các chuyên gia phần cứng từ Apple và Meta , làm việc với các nhà sản xuất Trung Quốc như Luxshare để đưa thiết bị ra thị trường. Tuy nhiên, những trở ngại kỹ thuật và xã hội ngày càng tăng cho thấy rằng lịch trình ban đầu cho việc ra mắt năm 2025 có thể quá lạc quan. Sự thành công của liên doanh này cuối cùng có thể phụ thuộc vào việc liệu OpenAI có thể giải quyết những vấn đề cơ bản đã làm khổ ngành công nghiệp trợ lý giọng nói trong nhiều năm, đồng thời thuyết phục người tiêu dùng rằng họ cần một giải pháp cho những vấn đề mà họ có thể không nhận ra mình có.

Tham khảo: OpenAI, Jony Ive struggle with technical details on secretive new AI gadget