Apple gần đây đã công bố hai bài nghiên cứu trình bày công việc của họ với Normalizing Flows để tạo ra hình ảnh, với các cơ quan truyền thông mô tả đây là một kỹ thuật bị lãng quên được khai quật. Tuy nhiên, cộng đồng công nghệ đã phản ứng mạnh mẽ chống lại cách mô tả này, gây ra một cuộc thảo luận rộng hơn về cường điệu marketing AI và thực tế của đổi mới kỹ thuật.
Kỹ thuật bị lãng quên thực chất không hề bị lãng quên
Tranh cãi tập trung vào cách nghiên cứu của Apple được trình bày với công chúng. Các thành viên cộng đồng nhanh chóng chỉ ra rằng Normalizing Flows đã được nghiên cứu và thảo luận tích cực trong nhiều năm, không phải đang nằm im chờ được tái khám phá. Kỹ thuật này đã là chủ đề nóng trong các vòng tròn AI trong năm năm qua, đặc biệt khi kết hợp với Variational Auto-encoders.
Các nhà phê bình cho rằng việc gọi nó là bị lãng quên đã trình bày sai lệch về công việc liên tục đang diễn ra trong lĩnh vực này. Bản thân các bài nghiên cứu có từ năm 2021, cho thấy Apple đã làm việc với phương pháp này trong vài năm thay vì tình cờ tìm thấy một kho báu đã mất.
Normalizing Flows: Một loại mô hình AI học cách biến đổi dữ liệu thế giới thực thành nhiễu có cấu trúc và đảo ngược quá trình để tạo ra các mẫu mới, với ưu điểm có thể tính toán xác suất chính xác.
Chiến lược tập trung xử lý trên thiết bị của Apple
Bất chấp tranh cãi về marketing, phương pháp kỹ thuật của Apple tiết lộ một hướng chiến lược thú vị. Trong khi các công ty như OpenAI xây dựng các hệ thống đám mây khổng lồ, Apple đang tối ưu hóa cho thiết bị di động và xử lý cục bộ. Các mô hình TarFlow và STARFlow của họ được thiết kế để hoạt động trong giới hạn của điện thoại thông minh và máy tính bảng.
Phương pháp này mang lại lợi ích riêng tư rõ ràng, vì dữ liệu không bao giờ rời khỏi thiết bị của người dùng. Tuy nhiên, nó cũng mang đến cho Apple một cơ hội kinh doanh - các tính năng AI đòi hỏi cao hơn cần phần cứng mạnh hơn, có thể thúc đẩy chu kỳ nâng cấp thiết bị.
Sự đánh đổi là đáng kể. Xử lý dựa trên đám mây có thể tận dụng tài nguyên chia sẻ và nâng cấp dễ dàng hơn, trong khi xử lý trên thiết bị phải đối mặt với giới hạn phần cứng nhưng cung cấp quyền riêng tư và chức năng ngoại tuyến.
Sự khác biệt về Phương pháp Kỹ thuật:
- Apple: Phát triển cho thiết bị di động ("trong túi của chúng ta") với xử lý trên thiết bị
- OpenAI: Phát triển cho trung tâm dữ liệu với xử lý dựa trên đám mây
- Phương pháp của Apple: Tạo pixel trực tiếp mà không cần token hóa
- Phương pháp của OpenAI: Tạo token rời rạc, xử lý hình ảnh như chuỗi văn bản
Sự hoài nghi của cộng đồng về chiến lược AI của Apple
Cuộc thảo luận tiết lộ sự hoài nghi sâu sắc hơn về chiến lược AI tổng thể của Apple. Những sai lầm gần đây, chẳng hạn như tính năng tóm tắt thông báo phải bị vô hiệu hóa do hiệu suất kém, đã đặt ra câu hỏi về khả năng AI của Apple.
Việc họ tung ra nó cho thấy họ không biết mình đang làm gì, riêng tư hay không.
Tuy nhiên, những người khác bảo vệ phương pháp của Apple, lưu ý rằng các mô hình thống kê vốn có các chế độ lỗi khó dự đoán, và việc tắt nhanh các tính năng có vấn đề thường là giải pháp thực tế nhất.
So sánh các mô hình AI của Apple:
- TarFlow: Transformer AutoRegressive Flow - tạo ra các giá trị pixel trực tiếp mà không cần tokenization
- STARFlow: Scalable Transformer AutoRegressive Flow - hoạt động trên hình ảnh nén, sau đó nâng cấp lên độ phân giải đầy đủ
- Ưu điểm chính: Có thể tính toán chính xác khả năng xảy ra của hình ảnh được tạo ra (khác với các mô hình khuếch tán)
- Mục tiêu: Xử lý trên thiết bị cho phần cứng di động
Bối cảnh rộng hơn của phát triển AI
Tranh cãi này làm nổi bật một mô hình phổ biến trong báo chí công nghệ và truyền thông doanh nghiệp. Các công ty thường trình bày tiến bộ nghiên cứu từng bước như những khám phá đột phá, trong khi cộng đồng khoa học thực tế thấy sự tiến bộ liên tục, từ từ.
Tình huống này cũng phản ánh sự cạnh tranh gay gắt trong AI, nơi các công ty cảm thấy áp lực phải xuất hiện sáng tạo và tiên tiến. Apple, truyền thống được biết đến với việc hoàn thiện các công nghệ hiện có thay vì phát minh ra những thứ hoàn toàn mới, thấy mình ở vị trí không quen thuộc khi cần chứng minh sự dẫn đầu về AI.
Liệu việc Apple tập trung vào xử lý AI trên thiết bị có thành công hay không vẫn còn phải xem. Phương pháp này đối mặt với những thách thức kỹ thuật đáng kể, nhưng nếu thành công, có thể cung cấp một lựa chọn hấp dẫn cho bối cảnh AI hiện tại bị chi phối bởi đám mây.
Tham khảo: Apple Research just unearthed a forgotten AI technique and is using it to generate images