Google Ra Mắt Nano Banana Pro, Tạo Hình Ảnh AI 4K Với Dữ Liệu Tìm Kiếm Thời Gian Thực

Nhóm biên tập BigGo
Google Ra Mắt Nano Banana Pro, Tạo Hình Ảnh AI 4K Với Dữ Liệu Tìm Kiếm Thời Gian Thực

Google đã nâng cao đáng kể mức độ cạnh tranh trong lĩnh vực tạo hình ảnh AI với việc triển khai toàn cầu Nano Banana Pro. Kế thừa thành công lan truyền của phiên bản tiền nhiệm, mô hình mới này tận dụng các khả năng tiên tiến của kiến trúc Gemini 3 Pro vừa được công bố, giới thiệu các tính năng cấp chuyên nghiệp như đầu ra độ phân giải cao, kết xuất văn bản tinh vi và khả năng độc đáo là kết hợp thông tin trực tiếp từ web.

Các Khả Năng Kỹ Thuật Chính:

  • Mô Hình Cơ Sở: Gemini 3 Pro Image
  • Độ Phân Giải Tối Đa: 4K
  • Kết Hợp Đối Tượng: Lên đến 14 hình ảnh
  • Tính Nhất Quán: Duy trì sự tương đồng cho tối đa 5 người
  • Dữ Liệu Thời Gian Thực: Tích hợp truy cập Google Search
  • Chỉnh Sửa: Chỉnh sửa cục bộ cho góc máy, tiêu cự và ánh sáng

Bước Nhảy Vọt Với Gemini 3 Pro

Nano Banana Pro về cơ bản được vận hành bởi mô hình Hình ảnh Gemini 3 Pro, mang lại một bản nâng cấp đáng kể về trí thông minh cốt lõi. Nền tảng mới này trang bị cho công cụ tạo hình ảnh khả năng lập luận đỉnh cao và sự hiểu biết tinh tế hơn về thế giới thực. Mô hình không còn bị giới hạn trong việc tạo ra những bức ảnh đẹp mắt; giờ đây nó đã trở thành một công cụ để tạo ra nội dung mang tính thông tin. Người dùng có thể tạo ra các bản giải thích chi tiết, đồ họa thông tin và biểu đồ phức tạp với độ chính xác và mạch lạc cao hơn, vượt ra ngoài phạm vi sáng tạo nghệ thuật để bước vào lĩnh vực truyền thông trực quan.

Sức Mạnh Của Thông Tin Thời Gian Thực

Một trong những tính năng khác biệt nhất của Nano Banana Pro là sự tích hợp trực tiếp của nó với cơ sở kiến thức của Google Search. Điều này cho phép mô hình thu thập dữ liệu thời gian thực, chẳng hạn như điều kiện thời tiết hiện tại, tỷ số thể thao trực tiếp hoặc tin tức thịnh hành, và kết hợp liền mạch thông tin này vào các hình ảnh được tạo ra. Khả năng này mở ra những khả năng mới cho việc tạo ra các hình ảnh trực quan, năng động, dựa trên dữ liệu luôn cập nhật, một lợi thế đáng kể cho những người sáng tạo nội dung và nhà tiếp thị cần phản ứng nhanh với các sự kiện hiện tại.

Khả Năng Đa Ngôn Ngữ và Xử Lý Văn Bản Chưa Từng Có

Google tuyên bố rằng Nano Banana Pro thiết lập một tiêu chuẩn mới cho việc kết xuất văn bản dễ đọc và chính xác trực tiếp trong hình ảnh. Đây từng là một thách thức dai dẳng đối với nhiều mô hình hình ảnh AI, vốn thường tạo ra các ký tự lộn xộn hoặc vô nghĩa. Khả năng lập luận đa ngôn ngữ nâng cao của Gemini 3 cho phép mô hình tạo ra văn bản mạch lạc bằng nhiều ngôn ngữ, hỗ trợ nhiều kiểu chữ và phông chữ khác nhau. Điều này biến nó thành một công cụ mạnh mẽ để tạo meme, áp phích, đồ họa mạng xã hội và tài liệu hướng dẫn mà không cần phần mềm chỉnh sửa thứ cấp để thêm chữ.

Kiểm Soát Sáng Tạo Nâng Cao và Độ Phân Giải

Đối với các chuyên gia tìm kiếm khả năng kiểm soát chi tiết hơn, Nano Banana Pro giới thiệu các tính năng chỉnh sửa được nâng cấp đáng kể. Chức năng chỉnh sửa cục bộ mới cho phép người dùng thực hiện các điều chỉnh chính xác đến các yếu tố cụ thể trong hình ảnh, chẳng hạn như thay đổi góc máy, dịch chuyển tiêu điểm hoặc hoàn toàn biến đổi ánh sáng của cảnh. Hơn nữa, sự bực bội về tỷ lệ khung hình cố định đã được giải quyết. Người dùng giờ đây có thể tạo hình ảnh ở nhiều kích thước khác nhau, với tùy chọn độ phân giải 2K và 4K, một bước tiến lớn so với giới hạn 1024 x 1024 pixel của mô hình Nano Banana ban đầu.

Tính Khả Dụng và Các Gói Truy Cập

Mô hình mới đang được triển khai toàn cầu trong ứng dụng Gemini. Quyền truy cập được phân cấp, với người dùng miễn phí nhận được một số lượt tạo hình giới hạn trước khi được chuyển về sử dụng mô hình Nano Banana gốc. Những người đăng ký trả phí của Google — AI Plus, Pro và Ultra — nhận được hạn ngạch cao hơn. Ngoài ứng dụng Gemini, Nano Banana Pro đang được tích hợp trên toàn bộ hệ sinh thái của Google. Nó có sẵn tại Mỹ cho những người đăng ký AI Pro và Ultra sử dụng Chế độ AI trong Tìm kiếm, toàn cầu cho người đăng ký NotebookLM, và sẽ sớm có mặt trên các công cụ Workspace như Slides và Vids, Google Ads, và Gemini API dành cho nhà phát triển.

So sánh Giá: Nano Banana gốc: 0,039 USD cho mỗi ảnh 1024px Nano Banana Pro (1080p/2K): 0,139 USD cho mỗi ảnh

  • Nano Banana Pro (4K): 0,24 USD cho mỗi ảnh

Giải Quyết Thách Thức Về Tính Xác Thực Của AI

Để đáp ứng với các khả năng nâng cao của chính công cụ tạo hình ảnh của mình, Google cũng đang củng cố các công cụ để xác định nội dung được tạo bởi AI. Ứng dụng Gemini đang được nâng cấp với công nghệ SynthID, cho phép nó phát hiện hình ảnh được tạo hoặc sửa đổi bởi chính các mô hình AI của Google. Tính năng này được lên kế hoạch mở rộng để bao gồm cả âm thanh và video được tạo bởi AI trong tương lai. Để duy trì tính minh bạch, một hình mờ Gemini sẽ hiển thị trên các hình ảnh được tạo bởi người dùng miễn phí và gói Pro, mặc dù những người đăng ký Ultra sẽ có tùy chọn nhận hình ảnh không có hình mờ.