Gemini của Google Được Trang Bị Khả Năng Phát Hiện Ảnh AI, Nhưng Không Thể Nhận Diện Hàng Giả Của Đối Thủ

Nhóm biên tập BigGo
Gemini của Google Được Trang Bị Khả Năng Phát Hiện Ảnh AI, Nhưng Không Thể Nhận Diện Hàng Giả Của Đối Thủ

Khi hình ảnh do AI tạo ra ngày càng tinh vi và khó phân biệt với thực tế, cuộc đua phát triển các công cụ phát hiện đáng tin cậy đang diễn ra. Google đang bước vào lĩnh vực này với một bản cập nhật quan trọng cho AI Gemini của mình, tích hợp khả năng phát hiện hình ảnh trực tiếp vào ứng dụng. Động thái này nhằm mang lại sự minh bạch cho thế giới phương tiện tổng hợp đầy phức tạp, mặc dù nó đi kèm với một hạn chế đáng chú ý làm nổi bật tình trạng phân mảnh của ngành công nghiệp.

Tính Năng Phát Hiện Ảnh AI Mới Của Gemini

Google đã triển khai một tính năng mới trong ứng dụng Gemini cho phép nó xác định hình ảnh được tạo bởi AI. Hệ thống hoạt động bằng cách quét để tìm một hình mờ ẩn có tên SynthID, mà Google nhúng vào các hình ảnh được tạo bởi các mô hình AI của chính hãng. Khi người dùng tải lên một bức ảnh vào Gemini, ứng dụng giờ đây có thể tự động phát hiện hình mờ này và đánh dấu hình ảnh là do AI tạo ra. Điều này mang lại trải nghiệm nhanh chóng và được tích hợp tốt hơn nhiều so với phương pháp trước đây, vốn yêu cầu người dùng phải tự tải hình ảnh lên một công cụ SynthID Detector riêng biệt trên web. Sự tích hợp này thể hiện nỗ lực đưa dữ liệu về nguồn gốc từ một công cụ dành cho nhà phát triển trở thành thứ mà người dùng hàng ngày có thể truy cập được khi họ lướt web.

Các Tính Năng Chính của Khả Năng Phát Hiện Hình Ảnh AI của Gemini:

  • Công Nghệ Sử Dụng: Thủy vô hình SynthID và siêu dữ liệu C2PA.
  • Phạm Vi Phát Hiện: Chỉ xác nhận hình ảnh được tạo bằng AI đối với những hình ảnh được tạo ra từ các mô hình AI của chính Google (ví dụ: Gemini, Google Ads, Vertex AI).
  • Điểm Truy Cập: Được tích hợp trực tiếp vào ứng dụng Gemini để phát hiện tự động.
  • Kế Hoạch Tương Lai: Mở rộng sang âm thanh, video và kết quả Tìm kiếm Google.

Điểm Mù Quan Trọng Trong Việc Phát Hiện

Một hạn chế quan trọng của hệ thống mới này là nó chỉ hoạt động đối với các hình ảnh được tạo ra bởi chính các công cụ AI của Google. Gemini không thể xác nhận liệu một hình ảnh có được tạo bởi mô hình của đối thủ cạnh tranh hay không, chẳng hạn như từ OpenAI, Midjourney, hoặc Stability AI. Điều này tạo ra một điểm mù đáng kể, khi một lượng lớn hình ảnh AI lưu hành trên internet có nguồn gốc từ các nguồn không phải của Google. Để hệ sinh thái phát hiện này thực sự hiệu quả, việc áp dụng rộng rãi hơn một tiêu chuẩn chung trên toàn ngành là cần thiết. Việc triển khai hiện tại của Google là một công cụ mạnh mẽ trong "khu vườn có tường bao" của chính họ, nhưng nó chưa đủ để trở thành một giải pháp toàn cầu để xác định nội dung AI trên toàn bộ internet.

Hạn chế của Hệ thống Hiện tại: Không thể phát hiện hình ảnh do AI tạo ra từ các mô hình của công ty khác (ví dụ: OpenAI, Midjourney). Hiệu quả bị hạn chế nếu không có sự áp dụng rộng rãi các tiêu chuẩn tương tự trên toàn ngành.

Cách Tiếp Cận Hai Lớp Của Google Đối Với Tính Minh Bạch

Để củng cố nỗ lực phát hiện, Google sử dụng một hệ thống hai lớp để truy tìm nội dung AI. Lớp đầu tiên là hình mờ SynthID vô hình, được thiết kế để vẫn có thể phát hiện được ngay cả sau khi hình ảnh bị chỉnh sửa, cắt xén hoặc nén. Lớp thứ hai liên quan đến việc đính kèm siêu dữ liệu C2PA, một định dạng được hậu thuẫn bởi ngành công nghiệp, hoạt động như một "nhãn dinh dưỡng" cho phương tiện kỹ thuật số, chi tiết về lịch sử tạo và sửa đổi của nó. Mục tiêu của cách tiếp cận kết hợp này là làm cho nội dung AI dễ dàng truy tìm hơn khi nó được đăng lại, phối lại hoặc có khả năng được sử dụng trong các bối cảnh gây hiểu lầm trên các nền tảng trực tuyến khác nhau.

Mở Rộng Trong Tương Lai Và Thúc Đẩy Tiêu Chuẩn Ngành

Google đã công bố kế hoạch mở rộng công nghệ phát hiện này ra ngoài phạm vi hình ảnh tĩnh. Công ty dự định sẽ mang các khả năng truy xuất nguồn gốc và phát hiện tương tự đến với âm thanh, video và thậm chí cả kết quả Tìm kiếm cốt lõi của họ trong tương lai. Điều này báo hiệu một cam kết lâu dài trong việc giải quyết thách thức về thông tin sai lệch từ AI. Tuy nhiên, thành công của những sáng kiến như vậy phụ thuộc vào sự hợp tác rộng rãi trong ngành. Sự chắp vá hiện tại của các hệ thống độc quyền nhấn mạnh sự cần thiết phải có một tiêu chuẩn thống nhất mà tất cả các nhà phát triển AI có thể áp dụng, biến việc phát hiện trở nên liền mạch và phổ quát như chính việc tạo ra phương tiện tổng hợp.

Một Công Cụ Học Tập Tương Tác Mới Cho Gemini

Trong một bản cập nhật riêng biệt nhưng có liên quan, Gemini cũng đang có được một tính năng mới được thiết kế để nâng cao việc học tập: hình ảnh tương tác. Chức năng này cho phép Gemini tạo ra các biểu đồ, chẳng hạn như một tế bào thực vật chi tiết, với các nhãn có thể nhấp. Nhấn vào một nhãn sẽ mở ra một bảng bên cạnh với các định nghĩa, giải thích và nội dung liên quan về yếu tố cụ thể đó. Tính năng này chủ yếu hướng đến việc giúp người dùng, đặc biệt là học sinh, khám phá và hiểu các khái niệm học thuật phức tạp một cách trực quan bằng cách cho phép họ tương tác tích cực với tài liệu và đặt các câu hỏi tiếp theo để tìm hiểu sâu hơn.