Mô hình FLUX.1 Kontext Dev gây tranh cãi về điều khoản giấy phép phi thương mại

Nhóm Cộng đồng BigGo
Mô hình FLUX.1 Kontext Dev gây tranh cãi về điều khoản giấy phép phi thương mại

Black Forest Labs gần đây đã phát hành FLUX.1 Kontext [dev], một mô hình chỉnh sửa hình ảnh mã nguồn mở hứa hẹn hiệu suất chuyên nghiệp trên phần cứng tiêu dùng. Trong khi khả năng kỹ thuật đã gây ấn tượng với các nhà phát triển, giấy phép phi thương mại của mô hình đã trở thành tâm điểm của cuộc thảo luận sôi nổi trong cộng đồng.

Hạn chế giấy phép tạo ra rào cản thương mại

Giấy phép phi thương mại FLUX.1 [dev] được cập nhật bao gồm một số yêu cầu mới đã thu hút sự chú ý của các nhà phát triển. Người dùng phải triển khai bộ lọc nội dung hoặc quy trình xem xét thủ công, tuân thủ luật nguồn gốc nội dung, và không thể sử dụng mô hình cho bất kỳ mục đích thương mại nào mà không mua giấy phép riêng biệt. Điều này đã khiến một số thành viên cộng đồng đặt câu hỏi liệu mô hình có thể thực sự được gọi là mã nguồn mở khi việc sử dụng thương mại đòi hỏi phải trả phí.

Cách tiếp cận cấp phép đã tạo ra cái mà một nhà phát triển mô tả là một hệ thống về mặt kỹ thuật là mở, nhưng về mặt vận hành thì hạn hẹp. Trong khi các nhà học thuật và nghiên cứu có thể truy cập mô hình miễn phí, các doanh nghiệp phải điều hướng qua cổng cấp phép tự phục vụ mới của BFL để có được quyền thương mại.

Yêu cầu Giấy phép:

  • Miễn phí cho mục đích nghiên cứu và sử dụng phi thương mại
  • Sử dụng thương mại yêu cầu cấp phép riêng biệt
  • Phải triển khai bộ lọc nội dung hoặc xem xét thủ công
  • Phải tuân thủ các luật về nguồn gốc nội dung hiện hành
  • Có sẵn thông qua cổng cấp phép tự phục vụ của BFL

Đổi mới kỹ thuật gặp phải thách thức về khả năng tiếp cận

Bất chấp những lo ngại về cấp phép, các nhà phát triển vẫn hào hứng với khả năng của mô hình. Mô hình 128 tham số có thể chạy trên phần cứng tiêu dùng, yêu cầu khoảng 18-20GB VRAM ở dạng tiêu chuẩn, mặc dù các phiên bản được tối ưu hóa có thể giảm xuống còn 12GB hoặc ít hơn. Những người dùng đầu tiên báo cáo rằng mô hình xuất sắc trong việc chỉnh sửa lặp đi lặp lại và bảo tồn nhân vật qua các cảnh đa dạng.

Bản phát hành bao gồm hỗ trợ ngày đầu cho các framework phổ biến như ComfyUI , HuggingFace Diffusers , và TensorRT . Các nhà phát triển cộng đồng đã bắt đầu thử nghiệm thêm khả năng mới vào mô hình, lưu ý rằng nó tổng quát hóa tốt với tương đối ít mẫu huấn luyện.

Thông số kỹ thuật của Model:

  • Tham số: 128 tỷ
  • Yêu cầu VRAM: 18-20GB (tiêu chuẩn), 12GB hoặc ít hơn (phiên bản FP8 tối ưu hóa)
  • Kiến trúc: Được tối ưu hóa cho NVIDIA Blackwell
  • Framework được hỗ trợ: ComfyUI , HuggingFace Diffusers , TensorRT
So sánh hiệu suất của các tensor core khác nhau liên quan đến khả năng chỉnh sửa hình ảnh của FLUX1
So sánh hiệu suất của các tensor core khác nhau liên quan đến khả năng chỉnh sửa hình ảnh của FLUX1

Câu hỏi về bản quyền và thực thi nổi lên

Cuộc thảo luận về cấp phép đã tiết lộ những câu hỏi sâu sắc hơn về khả năng thực thi bản quyền mô hình. Một số thành viên cộng đồng cho rằng trọng số mô hình có thể hoàn toàn không thể có bản quyền, đặt câu hỏi về nền tảng pháp lý của các giấy phép như vậy. Những người khác chỉ ra cái mà họ coi là tiêu chuẩn kép, nơi các công ty huấn luyện trên nội dung có bản quyền mà không xin phép nhưng sau đó hạn chế quyền truy cập vào đầu ra mô hình của chính họ.

Tiêu chuẩn kép này thật sự đáng ghê tởm. Tôi thực sự ủng hộ việc huấn luyện mở nhưng tôi nghĩ chỉ công bằng khi bạn đối xử với mô hình như cách bạn đã đối xử với công sức cả đời của người khác.

BFL đã triển khai một số biện pháp để bảo vệ mô hình của họ, bao gồm đánh dấu watermark trên đầu ra và sử dụng các prompt cụ thể tạo ra kết quả đã biết. Tuy nhiên, các cuộc thảo luận kỹ thuật cho thấy rằng những người dùng quyết tâm có thể tìm cách vượt qua những biện pháp bảo vệ này thông qua các kỹ thuật lượng tử hóa hoặc tinh chỉnh.

Bản phát hành này đại diện cho một bước tiến đáng kể trong khả năng chỉnh sửa hình ảnh mã nguồn mở, nhưng phản ứng của cộng đồng làm nổi bật những căng thẳng đang diễn ra giữa khả năng tiếp cận, tính khả thi thương mại và bảo vệ sở hữu trí tuệ trong hệ sinh thái mô hình AI . Khi nhiều công ty áp dụng các chiến lược cấp phép tương tự, những cuộc tranh luận này có khả năng sẽ gia tăng và có thể ảnh hưởng đến các cách tiếp cận quy định trong tương lai đối với việc phân phối mô hình AI .

Tham khảo: FLUX.1 Kontext [dev] - Open Weights for Image Editing

Bảng xếp hạng ELO so sánh thể hiện hiệu suất của các mô hình khác nhau trong các tác vụ bảo tồn nhân vật và chỉnh sửa
Bảng xếp hạng ELO so sánh thể hiện hiệu suất của các mô hình khác nhau trong các tác vụ bảo tồn nhân vật và chỉnh sửa