Rất lâu trước khi các thuật toán của Spotify và gợi ý của Netflix trở thành một phần trong cuộc sống hàng ngày của chúng ta, một nhóm nhỏ các nhà nghiên cứu đã âm thầm xây dựng nền tảng cho các hệ thống gợi ý được hỗ trợ bởi AI ngày nay. Công việc của họ trong những năm 1990, chỉ sử dụng giao diện email đơn thuần, cuối cùng sẽ trở nên có giá trị hàng triệu đô la khi internet phát triển.
Cuộc thảo luận đã được khơi mào bởi những tiết lộ từ một trong những người tạo ra ban đầu của các công cụ gợi ý sớm này. Một nhà phát triển đã xây dựng The Similarities Engine - một đối thủ cạnh tranh với hệ thống Ringo nổi tiếng từ năm 1994 - gần đây đã chia sẻ về việc anh đã từ bỏ một bằng sáng chế mà sau này sẽ trở nên cực kỳ có giá trị khi collaborative filtering trở thành xương sống của thương mại internet hiện đại.
Những tiền thân chạy bằng Email của AI hiện đại
Vào đầu những năm 1990, khi các biểu mẫu web không đáng tin cậy và truy cập internet còn hạn chế, email đóng vai trò là giao diện phổ quát cho các dịch vụ từ xa. Các nhà nghiên cứu tại MIT, Stanford, và Xerox PARC đã phát triển các hệ thống có thể phân tích sở thích của người dùng và đưa ra gợi ý hoàn toàn thông qua trao đổi email.
Những hệ thống này hoạt động dựa trên một nguyên lý đơn giản nhưng mạnh mẽ: những người đồng ý về một số điều trong quá khứ có khả năng sẽ đồng ý về những điều khác trong tương lai. Người dùng sẽ gửi email đánh giá của họ về phim hoặc nhạc, và hệ thống sẽ tìm những người khác có sở thích tương tự để tạo ra các gợi ý.
Cuộc thảo luận cộng đồng cho thấy cách tiếp cận dựa trên email này đã phổ biến đến mức nào. Một nhà phát triển đã chia sẻ về việc các dịch vụ tồn tại mà bạn có thể gửi email một URL và nhận lại phiên bản văn bản của trang web - điều quan trọng khi việc duyệt web tốn tiền theo từng megabyte. Một người khác nhớ lại các máy chủ phân tích protein sử dụng giao diện email, với các định dạng đầu vào vẫn không thay đổi cho đến ngày nay.
Dòng thời gian của các Hệ thống Gợi ý Sơ khai
- 1992: Tapestry ( Xerox PARC ) - lọc email cộng tác
- 1994: SIFT ( Stanford ) - gợi ý bài viết dựa trên email
- 1994: Movie Recs ( Xerox ) - gợi ý phim qua email
- 1994: Ringo ( MIT ) - gợi ý âm nhạc, ra mắt ngày 1 tháng 7
- 1997: Bằng sáng chế US 5,749,081 được cấp cho thuật toán lọc cộng tác
Từ dự án học thuật đến công nghệ triệu đô la
Người tạo ra The Similarities Engine đã đối mặt với một quyết định quan trọng vào năm 1997: giữ bằng sáng chế collaborative filtering của mình hay bán nó như một phần của việc mua lại startup bởi Firefly (sau này được Microsoft mua lại). Anh đã chọn bán, ưu tiên mối quan hệ và cuộc hôn nhân sắp tới hơn lợi nhuận tiềm năng trong tương lai.
Gần đây tôi đã hỏi ChatGPT và Claude về việc bằng sáng chế của tôi sẽ có giá trị bao nhiêu, nếu tôi đã giữ lại nó. Nếu bạn có hối tiếc trong cuộc đời về các thỏa thuận kinh doanh... hãy để tôi nói với bạn, tôi đã vượt qua bạn rồi.
Bằng sáng chế này mô tả những gì đã trở thành thuật toán collaborative filtering cơ bản được sử dụng trên toàn bộ internet hiện đại. Khi thương mại điện tử bùng nổ và các hệ thống gợi ý trở nên thiết yếu cho các công ty như Amazon, Netflix, và Spotify, công nghệ mà anh đã giúp tiên phong trở nên cực kỳ có giá trị.
Các Hệ Thống Kế Thừa Vẫn Hoạt Động
- Gnoosic.com - Gợi ý âm nhạc (liên tục học hỏi từ những năm 1990)
- Gnovies.com - Gợi ý phim ảnh
- Gnooks.com - Gợi ý sách Cả ba hệ thống đều tiếp tục hoạt động và học hỏi từ đầu vào của người dùng hàng ngày
![]() |
---|
Một bài đăng USENET ban đầu quảng bá Ringo, một hệ thống gợi ý âm nhạc tiêu biểu cho công nghệ lọc cộng tác thời kỳ đầu |
Di sản sống động của sự đổi mới sớm
Thú vị là, một số hệ thống gợi ý sớm này vẫn đang hoạt động ngày nay. Cuộc thảo luận cộng đồng đã nêu bật Gnoosic, Gnovies, và Gnooks - các dịch vụ gợi ý nhạc, phim, và sách đã liên tục học hỏi và cải thiện từ những năm 1990. Người dùng báo cáo vẫn khám phá được các nghệ sĩ và nội dung mới thông qua những hệ thống cổ điển này.
Sự tồn tại bền bỉ của những nền tảng sớm này chứng minh nền tảng vững chắc được đặt bởi những thí nghiệm dựa trên email đó. Trong khi các hệ thống AI hiện đại phức tạp hơn nhiều, chúng vẫn dựa vào cùng nguyên lý cốt lõi của collaborative filtering mà các nhà nghiên cứu đã khám phá ba mươi năm trước.
Câu chuyện này là lời nhắc nhở rằng những đột phá AI ngày nay thường có nguồn gốc sâu xa hơn chúng ta nhận ra. Các thuật toán gợi ý mà chúng ta tương tác hàng ngày có nguồn gốc từ những trao đổi email sớm giữa các nhà nghiên cứu và người dùng, chứng minh rằng đôi khi những ý tưởng cách mạng nhất bắt đầu với những giao diện đơn giản nhất.
Tham khảo: The ChatGPT for music that launched in 1994
![]() |
---|
Một bộ sưu tập đĩa than hoài niệm, tượng trưng cho tác động lâu dài của các hệ thống gợi ý âm nhạc thời kỳ đầu |