JetBrains đối mặt với phản ứng dữ dội từ cộng đồng lập trình viên về việc thu thập dữ liệu mặc định để huấn luyện AI

Nhóm Cộng đồng BigGo
JetBrains đối mặt với phản ứng dữ dội từ cộng đồng lập trình viên về việc thu thập dữ liệu mặc định để huấn luyện AI

JetBrains đã công bố chương trình thu thập dữ liệu mới nhằm cải thiện các công cụ AI của họ, nhưng cộng đồng lập trình viên đang phản ứng mạnh mẽ với cách tiếp cận của công ty. Nhà sản xuất IDE này muốn thu thập dữ liệu chi tiết liên quan đến code từ người dùng để huấn luyện các mô hình AI tốt hơn, nhưng cách triển khai của họ đã gây ra tranh cãi đáng kể trong số các khách hàng lâu năm.

Công ty gần đây đã tiết lộ kế hoạch thu thập dữ liệu phát triển toàn diện, bao gồm lịch sử chỉnh sửa, việc sử dụng terminal và các tương tác với AI. Trong khi JetBrains đóng khung điều này là cần thiết để cải thiện các công cụ AI vượt ra ngoài các tác vụ đơn giản, nhiều lập trình viên coi đây là sự thay đổi cơ bản khỏi các giá trị truyền thống của công ty.

Các Loại Dữ Liệu Được Thu Thập

Telemetry Ẩn Danh (hiện tại):

  • Thống kê sử dụng tính năng
  • Thời gian sử dụng trong IDE
  • Các mẫu quy trình làm việc chung
  • Theo dõi nhấp chuột

Dữ Liệu Chi Tiết Liên Quan Đến Code (mới):

  • Lịch sử chỉnh sửa và thay đổi code
  • Các lệnh terminal và cách sử dụng
  • Tương tác với tính năng AI
  • Các đoạn code và ngữ cảnh
  • Văn bản prompt gửi cho AI
  • Phản hồi được tạo bởi AI

Thu thập dữ liệu mặc định làm dấy lên lo ngại về quyền riêng tư

Khía cạnh gây tranh cãi nhất trong thông báo của JetBrains là cách tiếp cận của họ đối với người dùng phi thương mại. Không giống như những người sở hữu giấy phép thương mại phải chủ động tham gia, người dùng với giấy phép giáo dục và sở thích miễn phí sẽ có tính năng thu thập dữ liệu được bật theo mặc định. Điều này có nghĩa là sinh viên, những người đóng góp mã nguồn mở và những người có sở thích sẽ tự động chia sẻ code của họ trừ khi họ tắt tính năng này một cách thủ công.

Dữ liệu được thu thập vượt xa các thống kê sử dụng cơ bản. JetBrains có kế hoạch thu thập các đoạn code, văn bản prompt, phản hồi AI và các mẫu tương tác chi tiết. Mặc dù công ty hứa hẹn loại trừ thông tin cá nhân nhạy cảm, phạm vi thu thập đã làm báo động các lập trình viên quan tâm đến quyền riêng tư.

Thu thập Dữ liệu theo Loại Giấy phép

Loại Giấy phép Cài đặt Mặc định Quyền Kiểm soát của Người dùng
Phi thương mại (giáo dục, sở thích, mã nguồn mở) Được bật theo mặc định Có thể từ chối bất cứ lúc nào
Giấy phép thương mại cá nhân Bị vô hiệu hóa Có thể tham gia nếu muốn
Giấy phép tổ chức Bị vô hiệu hóa Quản trị viên phải kích hoạt toàn công ty
Bản dùng thử miễn phí, giấy phép cộng đồng, bản build EAP Bị vô hiệu hóa Có thể tham gia với sự chấp thuận của quản trị viên

Cộng đồng đặt câu hỏi về hướng đi của công ty

Những người dùng JetBrains lâu năm bày tỏ sự thất vọng mở rộng ra ngoài việc thu thập dữ liệu. Nhiều người cảm thấy công ty đã mất tập trung vào những thế mạnh cốt lõi trong khi đuổi theo các xu hướng AI. Những lời chỉ trích tập trung vào các thay đổi giao diện người dùng gần đây, sự thay đổi ưu tiên và những gì một số người coi là việc từ bỏ những khách hàng trung thành đã xây dựng nên thành công của công ty.

JetBrains hoàn toàn thống trị thị trường cho người dùng chuyên nghiệp, và giờ họ muốn phá hỏng tất cả. Thậm chí không phải vì động cơ lợi nhuận hợp lý, họ chỉ đang đuổi theo các mốt nhất thời bởi vì... bởi vì mọi người khác đang làm vậy, tôi đoán vậy.

Một số lập trình viên báo cáo đang cân nhắc các lựa chọn thay thế như Visual Studio hoặc Neovim với các language server, mặc dù họ thừa nhận các IDE của JetBrains vẫn vượt trội về mặt kỹ thuật cho nhiều trường hợp sử dụng. Việc thiếu cạnh tranh mạnh mẽ trong thị trường IDE chuyên nghiệp mang lại cho JetBrains đòn bẩy đáng kể, điều mà một số người dùng cảm thấy công ty đang lợi dụng.

Các IDE của JetBrains tích hợp công nghệ AI, làm nổi bật những lời chỉ trích từ các nhà phát triển về việc chuyển hướng khỏi các giá trị cốt lõi
Các IDE của JetBrains tích hợp công nghệ AI, làm nổi bật những lời chỉ trích từ các nhà phát triển về việc chuyển hướng khỏi các giá trị cốt lõi

Các vấn đề về niềm tin và minh bạch nổi lên

Một số thành viên cộng đồng đã nêu lên lo ngại về các thực hành minh bạch và giao tiếp của JetBrains. Người dùng báo cáo rằng phản hồi tiêu cực trên các bài đăng blog của công ty bị xóa, và một số đặt câu hỏi liệu các lời hứa của công ty về xử lý dữ liệu có thể được tin tưởng hay không khi xem xét các thực hành kiểm duyệt này.

Thời điểm thu thập dữ liệu cũng khiến người dùng lo lắng. Ngay cả khi có các tùy chọn từ chối tham gia, hệ thống bắt đầu thu thập dữ liệu ngay lập tức khi kích hoạt, có khả năng thu thập thông tin nhạy cảm trước khi người dùng có thể tắt nó. Cách tiếp cận này đã khiến một số người đặt câu hỏi liệu JetBrains có thực sự tôn trọng lựa chọn của người dùng hay chỉ đơn giản cung cấp ảo tưởng về quyền kiểm soát.

Cuộc tranh cãi này làm nổi bật một căng thẳng rộng lớn hơn trong ngành công nghiệp phần mềm giữa việc cải thiện khả năng AI và duy trì niềm tin của người dùng. Khi ngày càng nhiều công cụ phát triển tích hợp các tính năng AI, các công ty phải cân bằng nhu cầu dữ liệu với kỳ vọng về quyền riêng tư của lập trình viên. Cách JetBrains xử lý sự cân bằng này có khả năng ảnh hưởng đến cách các nhà sản xuất công cụ khác tiếp cận các sáng kiến tương tự.

Hiện tại, các lập trình viên sử dụng sản phẩm JetBrains nên xem xét cẩn thận các cài đặt chia sẻ dữ liệu của họ, đặc biệt là những người có giấy phép phi thương mại nơi việc thu thập được bật theo mặc định.

Tham khảo: Better AI Depends on Better Data: We Need Your Help