Âm mưu "Tẩy trắng" mã nguồn bằng AI phơi bày lỗ hổng của mã nguồn mở

Nhóm Cộng đồng BigGo

Âm mưu "Tẩy trắng" mã nguồn bằng AI phơi bày lỗ hổng của mã nguồn mở

Một vụ việc đáng lo ngại đã xuất hiện khi trí tuệ nhân tạo được cáo buộc sử dụng để sao chép và đổi thương hiệu một cách có hệ thống nhiều dự án mã nguồn mở mà không ghi nhận tác giả đúng cách. Sự việc liên quan đến một công ty tên là Inspacs , được cho là đã sử dụng AI để trích xuất mã từ nhiều dự án bao gồm rEFul , refurbish và undom-ng , đóng gói lại chúng dưới thương hiệu inspatial-kit của họ.

Nhà phát triển ban đầu, ClassicOldSong , phát hiện ra rằng công trình của họ đã bị sao chép và cấp lại giấy phép dưới một giấy phép độc quyền có tên Intentional-1.0 , hạn chế việc sử dụng thương mại - vi phạm trực tiếp các giấy phép MIT và Apache-2.0 ban đầu yêu cầu ghi nhận tác giả và bảo toàn bản quyền. Điều khiến vụ việc này đặc biệt đáng lo ngại là việc sử dụng AI rõ ràng trong toàn bộ quá trình, từ việc sao chép mã đến tạo tài liệu và thậm chí cả các tệp ghi nhận công trạng.

Các Dự Án Bị Ảnh Hưởng và Vi Phạm Bản Quyền

Package	Nguồn Gốc	Giấy Phép	Bằng Chứng Sao Chép	Đã Xóa Giấy Phép
@inspatial/run	rEFul	Apache-2.0	Sao chép từng dòng code của signals, HMR, control-flow	Có
@inspatial/view	undom-ng	MIT	DOM factory với việc đổi tên biến	Có
@inspatial/test	Deno std: assert	MIT	Các hàm assertion giống hệt nhau	Có
@inspatial/theme	chalk/kleur + ansi-regex	MIT	Cùng pattern mã ANSI	Có
@inspatial/type	ArkType	MIT	Import và re-export toàn bộ	Có
@inspatial/cloud-client	mime-types/mime-db	MIT	Bản đồ extension JSON giống hệt nhau	Có

Dấu vết AI trong vụ trộm mã nguồn

Bằng chứng cho thấy đây không phải là hành vi đạo văn truyền thống của con người mà là tẩy trắng mã nguồn có sự hỗ trợ của AI. Những kẻ thủ phạm liên tục viết sai tên dự án, sử dụng nhiều biểu tượng cảm xúc trong tài liệu và thể hiện sự thiếu hiểu biết cơ bản về mã nguồn đã sao chép. Khi được yêu cầu sửa các lỗi cơ bản trong phần triển khai do AI tạo ra, họ không thể giải thích điều gì sai hoặc cách họ sửa nó, cho thấy sự phụ thuộc liên tục vào các công cụ AI thay vì hiểu biết thực sự.

Một phân tích chi tiết bởi GPT-3 đã tiết lộ việc sao chép có hệ thống trên nhiều gói phần mềm, với toàn bộ các module được nhập khẩu nguyên vẹn trước khi được tái cấu trúc để đổi tên các định danh và loại bỏ các tiêu đề giấy phép. Lịch sử commit cho thấy các commit ban đầu lớn thêm hàng nghìn dòng cùng một lúc, sau đó là những thay đổi mang tính thẩm mỹ - một mô hình điển hình của việc sao chép hàng loạt có sự hỗ trợ của AI.

Cộng đồng vật lộn với thực tế mới

Cộng đồng nhà phát triển đang vật lộn với những tác động của việc trộm cắp mã nguồn có sự hỗ trợ của AI. Một số người coi đây là sự tiến hóa không thể tránh khỏi, cho rằng AI chỉ đơn giản biến cơ sở mã nguồn của thế giới thành một thư viện khổng lồ. Những người khác lo lắng về việc tập trung quyền lực vào tay các công ty AI và sự xói mòn các nguyên tắc mã nguồn mở.

Đây là thực tế mới. Các tài sản giờ đây thuộc về các phòng thí nghiệm lớn, nếu nó có trên internet. Internet cộng với AI ngụ ý thảm kịch của tài sản chung được thể hiện trong thế giới số.

Sự việc này làm nổi bật một mối lo ngại ngày càng tăng: trong khi việc con người học hỏi từ mã nguồn hiện có được chấp nhận, AI hoạt động ở quy mô có thể xử lý và tái tạo hàng nghìn dự án đồng thời. Không giống như các nhà phát triển con người thường đóng góp lại cho cộng đồng với những đổi mới mới, việc sao chép có sự hỗ trợ của AI có thể chỉ đơn giản trích xuất giá trị mà không đền đáp lại.

Dòng thời gian của sự việc

28 tháng 5, 2025: Liên hệ ban đầu bày tỏ sự ngưỡng mộ đối với tác phẩm của ClassicOldSong
3-4 tháng 6, 2025: Những nghi ngờ đầu tiên được nêu ra về hiểu biết kỹ thuật
29-30 tháng 6, 2025: Đề xuất hợp tác với những lời hứa đầy tham vọng
21 tháng 7, 2025: Yêu cầu làm việc với template Deno
24 tháng 7, 2025: Giới thiệu "inspatial/run" - rEFul được đổi tên thương hiệu với mã code được tạo bởi AI
29 tháng 7, 2025: Những sai lầm kỹ thuật được làm nổi bật, các câu hỏi về năng lực được đặt ra

Tác động pháp lý và đạo đức

Vụ việc này phơi bày những khoảng trống đáng kể trong cách luật bản quyền hiện tại xử lý vi phạm có sự hỗ trợ của AI. Việc loại bỏ có hệ thống các tiêu đề giấy phép và cấp lại giấy phép dưới các điều khoản hạn chế vi phạm cả yêu cầu của giấy phép Apache-2.0 và MIT . Tuy nhiên, việc thực thi trở nên phức tạp khi AI được sử dụng như một trung gian trong quá trình sao chép.

Sự việc này đóng vai trò như một hồi chuông cảnh báo cho các nhà duy trì mã nguồn mở để xem xét cách công trình của họ có thể dễ bị chiếm đoạt có sự hỗ trợ của AI. Trong khi một số nhà phát triển hoan nghênh việc AI học hỏi từ mã nguồn của họ, việc thiếu ghi nhận tác giả và cấp lại giấy phép độc quyền đã vượt qua các ranh giới đạo đức mà cộng đồng vẫn đang xác định.

Khi khả năng của AI tiếp tục mở rộng, hệ sinh thái mã nguồn mở có thể cần các khung làm việc mới để bảo vệ người sáng tạo trong khi vẫn bảo tồn tinh thần hợp tác thúc đẩy đổi mới. Sự cân bằng giữa việc cho phép phát triển AI và bảo vệ quyền sở hữu trí tuệ vẫn là một thách thức chưa được giải quyết có thể sẽ định hình tương lai của phát triển phần mềm.

Tham khảo: Hall of Shame

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌