iNaturalist Giữ Bí Mật Các Mô Hình AI Bất Chấp Đóng Góp Của Cộng Đồng, Châm Ngòi Tranh Luận Về Khoa Học Mở

Nhóm Cộng đồng BigGo
iNaturalist Giữ Bí Mật Các Mô Hình AI Bất Chấp Đóng Góp Của Cộng Đồng, Châm Ngòi Tranh Luận Về Khoa Học Mở

Nền tảng nhận dạng thiên nhiên phổ biến iNaturalist đã phát hành tài liệu kỹ thuật cho API thị giác máy tính của họ, nhưng động thái này đã làm bùng phát lại cuộc tranh luận gay gắt về quyền sở hữu dữ liệu và tính minh bạch khoa học. Trong khi tổ chức này cung cấp công khai các mô hình nhỏ hơn, các mô hình phân loại loài đầy đủ của họ vẫn được giữ kín, với lý do lo ngại về sở hữu trí tuệ và chính sách tổ chức.

Quyết định này đã tạo ra căng thẳng trong cộng đồng khoa học, đặc biệt khi xem xét rằng iNaturalist hoạt động như một tổ chức phi lợi nhuận được tài trợ chủ yếu bằng quyên góp và các khoản tài trợ. Nền tảng này phụ thuộc rất nhiều vào những đóng góp tình nguyện từ người dùng, những người chụp ảnh và nhận dạng các loài trên toàn thế giới, về cơ bản là cung cấp lao động miễn phí để huấn luyện các mô hình AI tinh vi.

Tổng quan tài chính iNaturalist 2024:

  • Tổng doanh thu: 4,71 triệu USD
  • Nguồn tài trợ: 94% từ các khoản đóng góp và nguồn từ thiện
  • Quy mô nhân viên: ~20 nhân viên toàn thời gian
  • Tỷ lệ người dùng quyên góp: 0,24% người dùng quyên góp
  • Các nhà tài trợ chính: Quỹ Gordon and Betty Moore , NSF , Hiệp hội National Geographic

Tiến Thoái Lưỡng Nan Của Khoa Học Mở

Tranh cãi cốt lõi tập trung xung quanh điều mà nhiều người coi là sự không phù hợp cơ bản giữa tính minh bạch đầu vào và đầu ra. Các thành viên cộng đồng cho rằng khi các tình nguyện viên tự do đóng góp thời gian, chuyên môn và dữ liệu của họ cho một nền tảng phi lợi nhuận, các mô hình AI thu được nên được cung cấp để sử dụng khoa học rộng rãi hơn. Tình cảm này phản ánh những lo ngại ngày càng tăng về các tổ chức hưởng lợi từ những đóng góp cộng đồng mở trong khi giữ các sản phẩm có giá trị nhất của họ ở dạng độc quyền.

Cuộc tranh luận trở nên phức tạp hơn khi xem xét cơ cấu tài trợ của iNaturalist . Với doanh thu được báo cáo là 4,71 triệu đô la Mỹ trong năm 2024, hơn 94% đến từ các nguồn từ thiện bao gồm Quỹ Gordon and Betty Moore , Quỹ Khoa học Quốc gia và Hiệp hội National Geographic . Các nhà phê bình cho rằng việc phụ thuộc nặng nề như vậy vào tài trợ công và phi lợi nhuận nên đi kèm với các nghĩa vụ truy cập mở đối với các kết quả nghiên cứu.

Hạn Chế Kỹ Thuật và Khoảng Trống Khu Vực

Ngoài các cuộc tranh luận triết học, những hạn chế thực tế của hệ thống hiện tại đã nổi lên thông qua các cuộc thảo luận cộng đồng. Người dùng báo cáo về sự thiên vị khu vực đáng kể trong các mô hình AI, với những điểm yếu đặc biệt trong việc nhận dạng các loài bản địa từ các khu vực như Australia . Hệ thống dường như hoạt động tốt hơn với các loài xâm lấn đã được ghi chép rộng rãi hơn trong dữ liệu huấn luyện.

Ở đây tại Australia , tôi biết một loài thực vật là loài xâm lấn khi iNaturalist / Seek có thể nhận dạng nó. Nó không tốt với thực vật bản địa Australia nên tôi muốn xây dựng một giải pháp địa phương.

Sự thiên vị địa lý này làm nổi bật cách các mô hình đóng có thể duy trì các khoảng trống kiến thức thay vì giải quyết chúng. Các nhà nghiên cứu và tổ chức địa phương có khả năng cải thiện khả năng nhận dạng khu vực không thể truy cập và điều chỉnh công nghệ cơ bản.

Câu Hỏi Về Tính Bền Vững

Những người ủng hộ cách tiếp cận hiện tại của iNaturalist đưa ra những lo ngại hợp lý về tính bền vững lâu dài. Với chỉ 0,24% người dùng quyên góp tiền, sự phụ thuộc nặng nề của nền tảng vào các khoản tài trợ lớn từ các quỹ có thể không bền vững vô thời hạn. Một số người cho rằng việc duy trì kiểm soát độc quyền đối với các mô hình AI có thể cung cấp các nguồn doanh thu trong tương lai thông qua việc cấp phép cho các tổ chức nghiên cứu hoặc ứng dụng thương mại.

Tuy nhiên, tiềm năng thương mại này tạo ra những câu hỏi đạo đức riêng. Nếu một tổ chức phi lợi nhuận có kế hoạch kiếm tiền từ các mô hình được huấn luyện dựa trên đóng góp tình nguyện, liệu những người đóng góp có nên có tiếng nói trong quyết định đó không? Căng thẳng giữa nhu cầu bền vững và các nguyên tắc khoa học mở vẫn chưa được giải quyết.

Cuộc tranh luận phản ánh những thách thức rộng lớn hơn đối với giao điểm giữa khoa học do cộng đồng thúc đẩy và tính bền vững thể chế. Khi AI ngày càng trở thành trung tâm của nghiên cứu khoa học, các câu hỏi về quyền sở hữu dữ liệu, quyền truy cập mô hình và quyền cộng đồng có thể sẽ trở nên cấp bách hơn trong nhiều lĩnh vực.

Tham khảo: computervision