Google Gemini nhận được các bản cập nhật lớn với tính năng chỉnh sửa hình ảnh nâng cao và trò chuyện tạm thời

Nhóm biên tập BigGo
Google Gemini nhận được các bản cập nhật lớn với tính năng chỉnh sửa hình ảnh nâng cao và trò chuyện tạm thời

Google đã triển khai các bản cập nhật quan trọng cho nền tảng AI Gemini của mình, giới thiệu khả năng chỉnh sửa hình ảnh được cải tiến và tính năng trò chuyện tạm thời tập trung vào quyền riêng tư. Những phát triển này đánh dấu một bước tiến đáng kể trong các dịch vụ AI của công ty, mặc dù chúng cũng đặt ra những câu hỏi quan trọng về công nghệ deepfake và thao tác kỹ thuật số.

Chỉnh sửa hình ảnh cách mạng với Gemini 2.5 Flash

Điểm nhấn của bản cập nhật mới nhất từ Google là mô hình tạo hình ảnh Gemini 2.5 Flash , được nhóm phát triển đặt biệt danh vui nhộn là Nano Banana . Hệ thống AI được cải tiến này đại diện cho một bước nhảy vọt lớn về tính nhất quán và chất lượng chỉnh sửa hình ảnh. Mô hình hiện đứng đầu bảng xếp hạng chỉnh sửa hình ảnh của LMArena , chứng minh sự vượt trội về mặt kỹ thuật so với các giải pháp cạnh tranh.

Khả năng mới cho phép người dùng kết hợp liền mạch nhiều bức ảnh, đặt bản thân cùng với thú cưng hoặc trong các môi trường hoàn toàn khác nhau trong khi vẫn duy trì tính nhất quán về mặt hình ảnh. Người dùng có thể biến đổi diện mạo của mình thành các nhân vật khác nhau, từ đấu sĩ bò tót đến các nhân vật sitcom những năm 1990, với độ chính xác đáng kinh ngạc. Hệ thống xuất sắc trong việc chỉnh sửa nhiều lượt, cho phép thực hiện các thay đổi từng bước đối với hình ảnh mà không gây ra sự không nhất quán về mặt hình ảnh thường gặp ở nội dung do AI tạo ra.

Các tính năng chính của Gemini 2.5 Flash "Nano Banana":

  • Chỉnh sửa hình ảnh nhiều lượt với duy trì tính nhất quán
  • Kết hợp chủ thể từ nhiều ảnh khác nhau
  • Thao tác nền và thay đổi cảnh
  • Khả năng biến đổi nhân vật
  • Hiện đang xếp hạng 1 trên bảng xếp hạng chỉnh sửa hình ảnh của LMArena
  • Không thể thực hiện cắt cơ bản theo tỷ lệ khung hình cụ thể

Tính năng nâng cao và hạn chế

Ứng dụng Gemini được cập nhật của Google hiện hỗ trợ thao tác nền phức tạp và tích hợp chủ thể. Người dùng có thể chụp ảnh một căn phòng trống và giao nhiệm vụ cho AI trang bị nội thất, hoặc thay đổi giấy dán tường để xem trước các tùy chọn thiết kế nội thất. Hệ thống duy trì tính mạch lạc qua nhiều phiên chỉnh sửa, giải quyết một điểm yếu phổ biến trong các trình chỉnh sửa hình ảnh AI trước đây.

Tuy nhiên, công nghệ này vẫn thể hiện những hạn chế đáng ngạc nhiên. Mặc dù có khả năng tiên tiến, hệ thống không thể thực hiện các tác vụ cơ bản như cắt hình ảnh theo tỷ lệ khung hình cụ thể. Khi được yêu cầu chuyển đổi hình ảnh vuông sang định dạng 16:9, Gemini tuyên bố rõ ràng rằng nó không có khả năng thực hiện các chỉnh sửa chính xác như cắt hình ảnh theo tỷ lệ khung hình cụ thể.

Mối quan ngại về quyền riêng tư và tác động của Deepfake

Khả năng chỉnh sửa hình ảnh được cải tiến đặt ra những mối quan ngại đáng kể về thao tác kỹ thuật số và tính xác thực. Hệ thống có thể tạo ra những hình ảnh có tính thuyết phục cao về các ngôi sao đã qua đời trong những kịch bản hoàn toàn bịa đặt, thách thức khả năng phân biệt giữa nội dung thật và do AI tạo ra của người dùng. Trong khi Google bao gồm các watermark có thể nhìn thấy trên tất cả hình ảnh được tạo ra, những watermark này có thể dễ dàng bị bỏ qua hoặc loại bỏ bởi các tác nhân độc hại sử dụng phần mềm chỉnh sửa tiêu chuẩn.

Google đã triển khai hệ thống watermark kỹ thuật số vô hình SynthID được thiết kế để phát hiện bởi SynthID Detector của công ty. Tuy nhiên, hệ thống phát hiện này vẫn đang trong giai đoạn thử nghiệm hạn chế và chưa được công chúng tiếp cận rộng rãi, tạo ra khoảng trống trong khả năng xác minh.

Các Biện Pháp An Toàn và Xác Minh:

  • Watermark hiển thị trên tất cả hình ảnh được tạo bởi AI
  • Hệ thống watermark số ẩn SynthID
  • SynthID Detector để xác minh (khả năng tiếp cận hạn chế)
  • Watermark có thể bị cắt bỏ bởi phần mềm bên thứ ba

Tính năng trò chuyện tạm thời tăng cường quyền riêng tư

Cùng với các bản cập nhật chỉnh sửa hình ảnh, Google đã giới thiệu chức năng Trò chuyện Tạm thời cho Gemini , tương đương với tính năng đã có sẵn trên các nền tảng cạnh tranh như ChatGPT . Công cụ tập trung vào quyền riêng tư này cho phép người dùng tương tác với AI mà không lưu lịch sử cuộc trò chuyện, giải quyết những mối quan ngại ngày càng tăng về việc lưu trữ dữ liệu và quyền riêng tư.

Tính năng trò chuyện tạm thời có thể truy cập thông qua biểu tượng trò chuyện có đường gạch ngang được đặt bên cạnh nút trò chuyện mới tiêu chuẩn. Các cuộc trò chuyện trong chế độ này không đóng góp vào việc huấn luyện mô hình, cá nhân hóa, hoặc xuất hiện trong lịch sử trò chuyện. Tuy nhiên, Google giữ lại những cuộc trò chuyện này trong 72 giờ cho mục đích an toàn và tối ưu hóa phản hồi.

Thông số kỹ thuật Temporary Chat:

  • Có sẵn trên các nền tảng Android, iOS và web
  • Các cuộc trò chuyện không được sử dụng để huấn luyện mô hình hoặc cá nhân hóa
  • Dữ liệu được lưu giữ trong 72 giờ vì mục đích an toàn
  • Không có quyền truy cập vào lịch sử trò chuyện tạm thời trước đó
  • Chỉ giới hạn cho tài khoản Google cá nhân (không áp dụng cho tài khoản công việc/trường học)

Tính khả dụng và quyền truy cập

Tính năng trò chuyện tạm thời hiện đang được triển khai cho tất cả người dùng Google Gemini trên các nền tảng Android , iOS và web. Chức năng này có sẵn cho người dùng có tài khoản Google cá nhân, mặc dù những người sử dụng tài khoản dựa trên trường học hoặc công việc hiện tại thiếu quyền truy cập. Khả năng tạo hình ảnh, bao gồm các tính năng Nano Banana mới, có sẵn cho tất cả người dùng bất kể trạng thái đăng ký, mặc dù các gói cao cấp mở khóa các tính năng bổ sung.

Các bản cập nhật đại diện cho sự đầu tư liên tục của Google vào khả năng AI trong khi làm nổi bật những thách thức đang diễn ra trong việc cân bằng đổi mới với triển khai có trách nhiệm trong thời đại ngày càng quan ngại về thao tác kỹ thuật số và quyền riêng tư.