FLUX.1-Krea Gây Tranh Cãi Về Các Phương Pháp Tạo Ảnh AI Khi Cộng Đồng Cân Nhắc Giữa Fine-Tuning và Post-Training

Nhóm Cộng đồng BigGo
FLUX.1-Krea Gây Tranh Cãi Về Các Phương Pháp Tạo Ảnh AI Khi Cộng Đồng Cân Nhắc Giữa Fine-Tuning và Post-Training

Việc phát hành FLUX.1-Krea đã châm ngòi cho một cuộc thảo luận sôi nổi trong cộng đồng tạo ảnh AI về các phương pháp tốt nhất để chống lại vẻ ngoài AI khét tiếng vốn làm hỏng hầu hết các hình ảnh được tạo ra. Trong khi Krea tuyên bố mô hình của họ giải quyết các vấn đề thẩm mỹ thông qua các kỹ thuật post-training tiên tiến, những người dùng có kinh nghiệm đang đặt câu hỏi liệu điều này có thể hiện sự đổi mới thực sự hay chỉ đơn giản là đóng gói lại các giải pháp hiện có.

Một khám phá về những biểu cảm đa dạng của con người trong định dạng bộ ba, phản ánh sự đa dạng mà AI đang cố gắng miêu tả
Một khám phá về những biểu cảm đa dạng của con người trong định dạng bộ ba, phản ánh sự đa dạng mà AI đang cố gắng miêu tả

Cộng Đồng Đặt Câu Hỏi Về Những Tuyên Bố Đổi Mới Của Krea

Cộng đồng AI đã phản ứng với sự hoài nghi đối với việc Krea định vị mô hình của họ như một giải pháp đột phá. Nhiều người dùng chỉ ra rằng các kỹ thuật fine-tuning và LoRA (Low-Rank Adaptations) đã giải quyết các vấn đề thẩm mỹ tương tự kể từ thời Stable Diffusion 1.5. Cuộc thảo luận tiết lộ sự chia rẽ giữa những gì có thể thực hiện được về mặt kỹ thuật đối với những người đam mê so với những gì có thể tiếp cận được đối với người dùng phổ thông.

Một số thành viên cộng đồng lưu ý rằng hàng nghìn mô hình tùy chỉnh và LoRA đã tồn tại trên các nền tảng như Civitai , được thiết kế đặc biệt để loại bỏ vẻ ngoài nhựa, quá xử lý đặc trưng cho các hình ảnh được tạo bởi AI thông thường. Điều này đặt ra câu hỏi liệu phương pháp của Krea có mang lại sự tiến bộ thực sự hay chỉ đơn giản là làm cho các giải pháp hiện có thân thiện hơn với người dùng.

LoRA là những tệp bổ trợ nhỏ sửa đổi cách các mô hình AI tạo ra hình ảnh, cho phép người dùng đạt được các phong cách nghệ thuật cụ thể hoặc khắc phục các vấn đề thường gặp.

Các Phương Pháp Kỹ Thuật Chính:

  • LoRAs (Low-Rank Adaptations): Các tệp chỉnh sửa nhỏ cho các mô hình hiện có
  • Fine-tuning: Huấn luyện các mô hình hiện có trên các bộ dữ liệu cụ thể
  • Post-training: Các kỹ thuật huấn luyện nâng cao bao gồm học tăng cường
  • Model merging: Kết hợp các mô hình khác nhau để cải thiện kết quả
  • Diffusion-PPO: Kỹ thuật học tăng cường cho việc tạo sinh hình ảnh
Một bức tranh ba phần ấm cúng với chủ đề mèo làm nổi bật những lựa chọn nghệ thuật và tính thẩm mỹ tự nhiên mà các bộ tạo sinh hình ảnh AI hướng tới
Một bức tranh ba phần ấm cúng với chủ đề mèo làm nổi bật những lựa chọn nghệ thuật và tính thẩm mỹ tự nhiên mà các bộ tạo sinh hình ảnh AI hướng tới

Các Mô Hình Thay Thế Cho Thấy Tiềm Năng Cho Kết Quả Tự Nhiên

Cuộc thảo luận của cộng đồng đã làm nổi bật các mô hình khác có thể thực sự hoạt động tốt hơn FLUX.1-Krea để có kết quả trông tự nhiên. Wan 2.2 , ban đầu được thiết kế như một mô hình video, đã thu hút sự chú ý vì tạo ra những hình ảnh trông xác thực hơn khi được sử dụng để tạo ảnh từ văn bản. Người dùng báo cáo rằng việc kết hợp Wan 2.2 với quy trình tinh chỉnh của Krea mang lại kết quả đặc biệt ấn tượng.

Sự phát triển này cho thấy rằng giải pháp cho các vấn đề thẩm mỹ của AI có thể không đến từ các mô hình tạo ảnh truyền thống, mà từ việc tái sử dụng công nghệ tạo video. Phương pháp này chứng minh cách cộng đồng AI thường tìm ra những cách sáng tạo để giải quyết vấn đề bằng cách sử dụng các công cụ theo những cách bất ngờ.

Các mô hình được đề cập trong thảo luận:

  • FLUX.1-Krea : Mô hình được huấn luyện sau của Krea tập trung vào việc giảm thiểu "vẻ ngoài AI"
  • Wan 2.2 : Mô hình video được tái sử dụng cho việc tạo hình ảnh từ văn bản
  • GPT-4.1 : Mô hình tạo hình ảnh của OpenAI được sử dụng để so sánh
  • Stable Diffusion 1.5/SDXL : Các mô hình trước đó với cộng đồng tinh chỉnh rộng lớn
  • Stable Diffusion 3.0/3.5 : Các mô hình gần đây với các vấn đề chất lượng được báo cáo

Các Hạn Chế Kỹ Thuật Vẫn Còn Tồn Tại Mặc Dù Có Cải Thiện Thẩm Mỹ

Mặc dù Krea tập trung vào thẩm mỹ, việc thử nghiệm của cộng đồng tiết lộ rằng các vấn đề cơ bản vẫn tồn tại. Người dùng báo cáo rằng trong khi mô hình giảm vẻ ngoài AI rõ ràng, nó vẫn tạo ra những hình ảnh trông quá sạch sẽ và nhân tạo khi quan sát kỹ hơn. Mô hình dường như tránh một số yếu tố có vấn đề thay vì thực sự giải quyết chúng - tương tự như cách các mô hình đầu tiên tránh tạo ra bàn tay để ngăn ngừa lỗi đếm ngón tay.

Tôi không biết, tất cả những cái đó vẫn trông giống AI, nghĩa là, quá sạch sẽ.

Cuộc thảo luận cũng tiết lộ những thách thức đang diễn ra với việc tuân thủ lời nhắc, nơi các mô hình không thể tuân theo chính xác các hướng dẫn cụ thể trong khi tập trung mạnh vào việc cải thiện thẩm mỹ. Sự đánh đổi giữa tính chính xác và sự hấp dẫn thị giác này tiếp tục thách thức các nhà phát triển trên toàn ngành.

Các Nền Tảng Cộng Đồng:

  • Civitai: Kho lưu trữ cho các mô hình tùy chỉnh và LoRAs
  • ComfyUI: Giao diện phổ biến cho quy trình tạo ảnh AI
  • Krea Platform: Lưu trữ hàng nghìn LoRAs và các mô hình tùy chỉnh
Một bức chân dung tự nhiên ngoài trời ghi lại những sắc thái tinh tế của biểu cảm con người, tương phản với thẩm mỹ quá hoàn hảo đặc trưng của một số sản phẩm AI
Một bức chân dung tự nhiên ngoài trời ghi lại những sắc thái tinh tế của biểu cảm con người, tương phản với thẩm mỹ quá hoàn hảo đặc trưng của một số sản phẩm AI

Tương Lai Hướng Tới Các Mô Hình Chuyên Biệt, Có Quan Điểm

Sự đồng thuận của cộng đồng cho thấy rằng tương lai của việc tạo ảnh AI không nằm ở các giải pháp phù hợp với tất cả, mà ở các mô hình chuyên biệt được đào tạo cho các sở thích thẩm mỹ hoặc trường hợp sử dụng cụ thể. Khi chi phí đào tạo giảm, các studio và nhà sản xuất có khả năng sẽ phát triển các mô hình tùy chỉnh riêng phù hợp với các phong cách thị giác và yêu cầu cụ thể của họ.

Xu hướng chuyên môn hóa này phản ánh một sự thay đổi rộng lớn hơn trong phát triển AI, nơi các mô hình đa năng nhường chỗ cho các công cụ tập trung được thiết kế cho các nhiệm vụ hoặc sở thích thẩm mỹ cụ thể. Cuộc thảo luận xung quanh FLUX.1-Krea đóng vai trò như một nghiên cứu điển hình về cách ngành công nghiệp có thể phát triển vượt ra ngoài kỷ nguyên hiện tại của các đầu ra AI chung chung, được thiết kế bởi ủy ban.

Tham khảo: FLUX.1-Krea & the Rise of Opinionated Models