Google đã chính thức ra mắt Nano Banana Pro, một bản nâng cấp đáng kể cho khả năng tạo và chỉnh sửa hình ảnh AI của mình. Được xây dựng trên kiến trúc Gemini 3 Pro vừa được công bố, mô hình này nhằm mục đích thay đổi cách người dùng tạo và thao tác hình ảnh trực quan, từ các bản phác thảo chuyên nghiệp đến nội dung mạng xã hội thông thường. Bản nâng cấp tập trung vào việc mang lại độ chính xác chưa từng có, hình ảnh giàu ngữ cảnh và các công cụ chỉnh sửa đạt cấp độ chuyên nghiệp trực tiếp từ một dòng nhắc văn bản, đánh dấu một bước nhảy vọt đáng kể so với phiên bản tiền nhiệm.
Nền Tảng Mới Với Gemini 3 Pro
Cốt lõi của hiệu suất được cải thiện trong Nano Banana Pro nằm ở nền tảng của nó, mô hình Gemini 3 Pro. Kiến trúc tiên tiến này cung cấp cho hệ thống khả năng suy luận được cải thiện và sự hiểu biết sâu sắc hơn về bối cảnh thực tế. Điều này cho phép AI diễn giải các lệnh phức tạp một cách hiệu quả hơn, vượt ra ngoài việc tạo đối tượng đơn giản để tạo ra các cảnh liên kết chặt chẽ với các yếu tố thiết kế chính xác. Mô hình có thể kết nối với Google Search để thu thập thông tin thời gian thực, cho phép người dùng tạo hình ảnh trực quan dựa trên dữ liệu trực tiếp như các kiểu thời tiết hiện tại hoặc tỷ số thể thao, bổ sung một lớp động cho việc sáng tạo nội dung vốn trước đây rất khó đạt được.
Đột Phá Trong Kết Xuất Văn Bản và Hỗ Trợ Đa Ngôn Ngữ
Một trong những cải tiến đáng chú ý nhất trong Nano Banana Pro là khả năng tạo ra văn bản dễ đọc và chính xác về mặt phong cách bên trong hình ảnh. Các trình tạo ảnh AI trước đây thường tạo ra văn bản lộn xộn hoặc vô nghĩa, một hiện tượng phổ biến được gọi là "AI squiggles". Google tự hào rằng mô hình mới này là tốt nhất từ trước đến nay của họ trong việc kết xuất văn bản chính xác, cho phép tạo các bản phác thảo chi tiết, áp phích và đồ họa thông tin với nhiều loại phông chữ, kết cấu và thư pháp khác nhau. Hơn nữa, tận dụng khả năng suy luận đa ngôn ngữ của Gemini, công cụ có thể tạo và bản địa hóa văn bản bằng nhiều ngôn ngữ trong một hình ảnh duy nhất, phá vỡ rào cản cho việc sáng tạo nội dung toàn cầu.
Thông số kỹ thuật chính của Nano Banana Pro:
- Mô hình nền tảng: Gemini 3 Pro
- Độ phân giải tối đa: 4K
- Kết hợp hình ảnh: Lên đến 14 hình ảnh
- Tính nhất quán con người: Duy trì hình dạng cho tối đa 5 người
- Tạo văn bản: Kết xuất tiên tiến văn bản dễ đọc bằng nhiều ngôn ngữ và phông chữ
- Bảo mật: Hình mờ SynthID vô hình và siêu dữ liệu C2PA để xác định nguồn gốc
- Khả năng tiếp cận: Toàn cầu trên ứng dụng Gemini, có tại Hoa Kỳ trên Chế độ AI của Google Search cho thuê bao Pro/Ultra và trên NotebookLM cho người đăng ký.
Chỉnh Sửa Nâng Cao và Kiểm Soát Chưa Từng Có
Nano Banana Pro giới thiệu một bộ tính năng chỉnh sửa tinh vi trao cho người dùng quyền kiểm soát chi tiết đối với tác phẩm của họ. Người dùng giờ đây có thể pha trộn tới 14 hình ảnh tham chiếu và duy trì sự giống nhau nhất quán của tối đa năm người riêng biệt xuyên suốt một loạt ảnh được tạo. Khả năng chỉnh sửa cục bộ cho phép lựa chọn và tinh chỉnh các phần cụ thể của hình ảnh—chẳng hạn như điều chỉnh góc máy, thay đổi tiêu điểm hoặc áp dụng tạo màu phức tạp—mà không ảnh hưởng đến phần còn lại của bố cục. Sự kiểm soát có mục tiêu này giúp giảm thiểu rủi ro xuất hiện các lỗi hình ảnh vốn phổ biến với các mô hình kém tiên tiến hơn.
Đầu Ra Chuyên Nghiệp và Bảo Mật
Đáp ứng nhu cầu chuyên nghiệp, Nano Banana Pro hỗ trợ tạo ảnh ở độ phân giải "2K" và 4K, làm cho đầu ra phù hợp cho các tài liệu tiếp thị chất lượng cao và hình ảnh hóa dữ liệu chi tiết. Về mặt bảo mật, tất cả hình ảnh được tạo ra đều bao gồm hình mờ SynthID được nhúng, có thể phát hiện được bằng các công cụ chuyên dụng của Google nhưng vô hình với mắt thường. Điều này, kết hợp với siêu dữ liệu C2PA được mở rộng, tạo thành một phần trong sáng kiến minh bạch của Google, cho phép xác minh nội dung được tạo bởi AI khi ranh giới giữa hình ảnh tổng hợp và hình ảnh thực tiếp tục bị xóa nhòa. Người đăng ký gói AI Ultra cao cấp có thể tạo hình ảnh mà không có hình mờ hiện hữu, mặc dù SynthID vô hình vẫn được giữ lại để truy xuất nguồn gốc.
Triển Khai Toàn Cầu và Các Gói Đăng Ký
Việc triển khai Nano Banana Pro hiện đã toàn cầu trong ứng dụng Gemini, có thể truy cập khi người dùng chọn tùy chọn "Tạo ảnh" trong mô hình "Thinking". Quyền truy cập được phân cấp: người dùng miễn phí nhận được một hạn ngạch giới hạn để thử nghiệm các tính năng Pro trước khi quay trở lại phiên bản tiêu chuẩn, trong khi những người đăng ký các gói AI Plus, Pro và Ultra của Google được hưởng giới hạn sử dụng cao hơn. Tại Hoa Kỳ, tính năng này cũng có sẵn trong Chế độ AI trong Google Search cho người đăng ký gói Pro và Ultra, và nó đã được tích hợp vào NotebookLM cho người đăng ký trên toàn cầu, mở rộng tính hữu ích của nó trên toàn bộ hệ sinh thái các công cụ được hỗ trợ bởi AI của Google.
