Tính năng Share của ChatGPT đã để lộ hơn 100.000 cuộc trò chuyện riêng tư lên các công cụ tìm kiếm

Nhóm Cộng đồng BigGo

Tính năng Share của ChatGPT đã để lộ hơn 100.000 cuộc trò chuyện riêng tư lên các công cụ tìm kiếm

Một nút Share tưởng chừng vô hại trong ChatGPT đã trở thành một sự cố bảo mật lớn, khiến hơn 100.000 cuộc trò chuyện riêng tư bị lộ ra các công cụ tìm kiếm công cộng. Tính năng này được thiết kế để cho phép người dùng chia sẻ các cuộc trò chuyện AI của họ với người khác, bao gồm một checkbox nhỏ mà nhiều người dùng không hiểu đầy đủ - dẫn đến việc thông tin cá nhân, kế hoạch kinh doanh và các tài liệu nhạy cảm trở nên có thể tìm kiếm được trên Google .

Quy mô của Sự cố:

Hơn 100.000 cuộc hội thoại ChatGPT có thể truy cập công khai
Các cuộc hội thoại bao gồm sơ yếu lý lịch, kế hoạch kinh doanh, khóa API và thông tin cá nhân
Nội dung đã được Google lập chỉ mục và lưu trữ bởi Internet Archive
Một số cuộc hội thoại vẫn có thể tìm thấy trên các công cụ tìm kiếm thay thế như DuckDuckGo


Một biểu đồ minh họa sự biến động của lưu lượng truy cập tự nhiên, phản ánh khả năng hiển thị của các cuộc trò chuyện ChatGPT được chia sẻ sau sự cố

Checkbox đã thay đổi tất cả

Gốc rễ của vấn đề nằm ở một yếu tố giao diện đơn giản: một checkbox có nhãn Make this chat discoverable với lời giải thích Allows it to be shown in web searches. Mặc dù điều này có vẻ rõ ràng đối với những người dùng am hiểu công nghệ, nhưng thảo luận cộng đồng cho thấy thực tế phức tạp hơn nhiều. Nhiều người dùng hiểu web searches là chỉ chức năng tìm kiếm nội bộ của ChatGPT , không nhận ra rằng các cuộc trò chuyện của họ sẽ xuất hiện trong kết quả Google cùng với sơ yếu lý lịch, API keys và những lời thú nhận sâu sắc cá nhân.

Cuộc tranh luận về thiết kế giao diện người dùng đã trở nên đặc biệt gay gắt, với một số người cho rằng ngôn ngữ đã đủ rõ ràng, trong khi những người khác chỉ ra rằng với hơn một tỷ người dùng ChatGPT , nền tảng cần phải tính đến các mức độ hiểu biết kỹ thuật khác nhau. Thuật ngữ discoverable bản thân nó đã bị chỉ trích là thuật ngữ chuyên ngành không truyền đạt rõ ràng hậu quả cho người dùng bình thường.

Vấn đề khảo cổ học số

Trong khi OpenAI nhanh chóng phản ứng bằng cách thêm các thẻ kỹ thuật để ngăn chặn việc lập chỉ mục của công cụ tìm kiếm và yêu cầu Google xóa các liên kết, thiệt hại đã lan rộng ngoài tầm kiểm soát của họ. Internet Archive đã ghi lại hơn 100.000 cuộc trò chuyện được chia sẻ này, tạo ra một bản ghi vĩnh viễn vẫn có thể truy cập được ngay cả sau khi kết quả tìm kiếm gốc đã biến mất.

Điều khiến tình huống này đặc biệt đáng lo ngại là OpenAI chưa yêu cầu xóa những cuộc trò chuyện được lưu trữ này. Những người dùng nghĩ rằng họ chỉ đơn giản chia sẻ một liên kết với bạn bè giờ đây thấy các cuộc thảo luận riêng tư của họ được bảo tồn vô thời hạn trong các kho lưu trữ số, không có con đường rõ ràng nào để xóa bỏ.

Ở một mức độ nào đó, tôi không cảm thấy tệ khi nói rằng đây là lỗi PEBKAC phía người dùng, và việc cảnh báo thêm sẽ là lãng phí thời gian.

Lộ trình phản hồi của OpenAI:

Đã thêm thẻ meta noindex và nofollow vào các trang chat được chia sẻ
Đã yêu cầu Google xóa các liên kết đã được lập chỉ mục khỏi kết quả tìm kiếm
Đã loại bỏ hoàn toàn tính năng "discoverable" (có thể khám phá)
Đã cập nhật tệp robots.txt (mặc dù các URL /share/* về mặt kỹ thuật vẫn có thể truy cập được)
Chưa được yêu cầu: Xóa các cuộc trò chuyện đã lưu trữ khỏi Internet Archive


Tệp robotstxt chi tiết các quy tắc trang web cho web crawler, liên quan đến việc lập chỉ mục các cuộc trò chuyện ChatGPT được chia sẻ

Bức tranh lớn hơn về sự đồng ý số

Sự cố này làm nổi bật một thách thức cơ bản trong thiết kế phần mềm hiện đại: làm thế nào để thông báo đúng cách cho người dùng về hậu quả lâu dài của hành động của họ. Thảo luận cộng đồng cho thấy một số công cụ tìm kiếm như DuckDuckGo vẫn hiển thị những liên kết được chia sẻ này, và nhiều liên kết chứa thông tin nhạy cảm bao gồm tài liệu tài chính, thảo luận sức khỏe và sơ yếu lý lịch hoàn chỉnh với thông tin liên lạc cá nhân.

Tranh cãi đã khơi dậy những câu hỏi rộng lớn hơn về sự đồng ý số và trách nhiệm của nền tảng. Liệu các công ty như OpenAI có nên chịu trách nhiệm nhiều hơn trong việc bảo vệ những người dùng không hiểu đầy đủ ý nghĩa của các tính năng chia sẻ? Hay người dùng nên được mong đợi hiểu rằng bất cứ thứ gì được công bố trên web đều có thể trở nên vĩnh viễn và có thể tìm kiếm được?

Cộng đồng kỹ thuật vẫn chia rẽ, với một số người kêu gọi tạo thêm ma sát trong các tính năng chia sẻ - có thể yêu cầu nhiều xác nhận hoặc cảnh báo rõ ràng hơn về khả năng hiển thị vĩnh viễn. Những người khác cho rằng không có cải tiến giao diện nào có thể bảo vệ những người dùng không đọc kỹ hoặc không hiểu các khái niệm web cơ bản.

Sự cố này phục vụ như một lời nhắc nhở rằng trong sự vội vã làm cho các công cụ AI trở nên dễ tiếp cận với mọi người, chúng ta phải cân nhắc cẩn thận về cách các quyết định thiết kế giao diện có thể có hậu quả lâu dài đối với quyền riêng tư của người dùng. Internet, như nhiều người đã học được một cách khó khăn, hiếm khi quên.

Tham khảo: ChatGPT Chats Were Indexed Then Removed From Search but Still Remain Online

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌