Spiral đã công bố hệ thống cơ sở dữ liệu được thiết kế cho cái mà họ gọi là Kỷ nguyên thứ ba của các hệ thống dữ liệu, bảo đảm được 22 triệu đô la Mỹ tiền tài trợ. Công ty tuyên bố giải pháp của họ có thể giúp các GPU như NVIDIA H100 thực sự đạt được giới hạn tiêu thụ dữ liệu lý thuyết là 4 triệu hình ảnh mỗi giây, giải quyết những gì họ coi là sự không khớp cơ bản giữa cơ sở hạ tầng dữ liệu hiện tại và nhu cầu khối lượng công việc AI.
Thông báo tập trung xung quanh định dạng tệp Vortex mã nguồn mở của họ, đã được tặng cho Linux Foundation. Spiral định vị điều này như một người kế thừa của Parquet, được thiết kế đặc biệt cho việc tiêu thụ máy móc thay vì đầu ra có thể đọc được bởi con người đã thống trị các kỷ nguyên trước của xử lý dữ liệu.
Tài trợ và Tuyên bố của Spiral:
- Tài trợ: Huy động được 22 triệu USD trong vòng gọi vốn khởi tạo
- Hiệu suất Mục tiêu: Cho phép NVIDIA H100 xử lý 4 triệu hình ảnh 500KB mỗi giây
- Công nghệ Cốt lõi: Định dạng tệp Vortex (mã nguồn mở, được tặng cho Linux Foundation )
- Cải thiện Được tuyên bố: Cải thiện hiệu suất gấp 100 lần so với các định dạng hiện có
- Kích thước Dữ liệu Mục tiêu: "Thung lũng kỳ quái" giữa các tệp từ 1KB đến 25MB
![]() |
---|
Spiral thông báo phát hành Data 30 của mình, nhấn mạnh khoản tài trợ đáng kể 22 triệu đô la để hỗ trợ công nghệ cơ sở dữ liệu sáng tạo của họ |
Các tuyên bố kỹ thuật đối mặt với sự hoài nghi
Lập luận cốt lõi của Spiral xoay quanh việc giải quyết thung lũng kỳ lạ giữa dữ liệu nhỏ (1KB) và dữ liệu cỡ trung bình (25MB) mà các hệ thống AI thường xuyên xử lý. Họ tuyên bố các hệ thống hiện tại buộc phải lựa chọn không hiệu quả giữa việc lưu trữ dữ liệu nội tuyến hoặc sử dụng tham chiếu bên ngoài, cả hai đều tạo ra các nút thắt hiệu suất khi cung cấp dữ liệu cho GPU.
Công ty tuyên bố định dạng Vortex của họ có thể giải mã dữ liệu trực tiếp từ bộ nhớ S3 sang bộ nhớ GPU, bỏ qua hoàn toàn các nút thắt CPU. Tuy nhiên, cộng đồng kỹ thuật đã đặt ra câu hỏi về những tuyên bố này. Một số nhà phát triển chỉ ra rằng băng thông mạng và việc sử dụng GPU thường là các yếu tố hạn chế, không phải sức mạnh xử lý CPU.
Việc so sánh với các giải pháp hiện có như định dạng Lance và DuckDB cũng đã khơi dậy cuộc thảo luận, với các thành viên cộng đồng lưu ý rằng các vấn đề tương tự có thể đã có giải pháp thích hợp mà không cần yêu cầu cơ sở hạ tầng hoàn toàn mới.
Các tuyên bố về kiến trúc kỹ thuật:
- Truyền dữ liệu trực tiếp từ S3 đến GPU, bỏ qua các nút thắt cổ chai của CPU
- Hỗ trợ các bộ mã hóa WebAssembly nhúng
- API thống nhất cho dữ liệu từ embeddings đến các tệp video lớn
- Mô hình bảo mật "phân quyền không ma sát"
- Định dạng lưu trữ theo cột được thiết kế như người kế nhiệm của Parquet
Mối quan ngại của cộng đồng về cách tiếp cận marketing
Thông báo đã tạo ra sự hoài nghi đáng kể trong cộng đồng nhà phát triển, đặc biệt là về cách tiếp cận tập trung vào marketing. Các nhà phê bình đã lưu ý sự thiếu hụt các chi tiết kỹ thuật cụ thể, điểm chuẩn, hoặc tài liệu rõ ràng về những gì sản phẩm thực sự làm.
Đây là một trang web đẹp nhưng thực sự không cung cấp cho chúng ta bất cứ thứ gì để thực sự xem xét, nó chỉ là lời quảng cáo.
Việc công ty sử dụng các thuật ngữ như quy mô AI và so sánh với các hệ thống cơ sở dữ liệu mang tính cách mạng như PostgreSQL đã thu hút sự chỉ trích đặc biệt. Một số thành viên cộng đồng coi điều này như việc theo một mô hình của các startup kỷ nguyên AI được thổi phồng quá mức, ưu tiên marketing hơn là bản chất kỹ thuật.
Các trang web marketing trông đắt tiền cho cả Spiral và Vortex, kết hợp với việc hiển thị nổi bật số tiền tài trợ, đã khiến một số người đặt câu hỏi liệu trọng tâm có phải là giải quyết các vấn đề kỹ thuật thực sự hay thu hút sự chú ý đầu tư.
Mối quan ngại của cộng đồng:
- Thiếu các tiêu chuẩn đánh giá cụ thể hoặc tài liệu kỹ thuật
- Cách tiếp cận thiên về marketing với nội dung hạn chế
- Thiết kế website đắt tiền so với tính minh bạch kỹ thuật
- Mô hình kinh doanh không rõ ràng mặc dù có lõi mã nguồn mở
- So sánh với các chiến dịch marketing "quy mô web" cường điệu trước đây
Chiến lược mã nguồn mở và câu hỏi về mô hình kinh doanh
Quyết định của Spiral tặng định dạng Vortex cho Linux Foundation đã đặt ra câu hỏi về chiến lược kinh doanh dài hạn của họ. Trong khi động thái này cung cấp uy tín và ngăn chặn công ty cấp phép lại công nghệ cốt lõi sau này, nó để lại không rõ ràng về cách Spiral dự định thương mại hóa công việc của họ.
Cộng đồng suy đoán rằng Spiral có thể cung cấp các tiện ích mở rộng độc quyền, dịch vụ thương mại, hoặc tích hợp giúp Vortex dễ sử dụng hơn trong môi trường sản xuất. Tuy nhiên, không có tài liệu kỹ thuật rõ ràng hoặc điểm chuẩn, rất khó để đánh giá liệu công nghệ cơ bản có biện minh cho khoản đầu tư và sự chú ý hay không.
Một số nhà phát triển đã bày tỏ sự quan tâm đến việc thử nghiệm với định dạng Vortex, tách biệt khỏi dịch vụ cơ sở dữ liệu thương mại của Spiral, cho thấy rằng thành phần mã nguồn mở có thể có giá trị ngay cả khi đề xuất kinh doanh rộng lớn hơn vẫn không rõ ràng.
Kết luận
Trong khi Spiral giải quyết các thách thức thực sự trong quy trình xử lý dữ liệu AI, phản ứng của cộng đồng cho thấy sự hoài nghi về việc liệu cách tiếp cận của họ có đại diện cho một bước đột phá thực sự hay chủ yếu là marketing tinh vi. Sự thiếu hụt thông tin kỹ thuật chi tiết, điểm chuẩn cụ thể, và tài liệu sản phẩm rõ ràng đã khiến các nhà phát triển khó đánh giá các ưu điểm thực sự của công nghệ. Khi khối lượng công việc AI tiếp tục tăng trưởng, các giải pháp cho xử lý dữ liệu hiệu quả chắc chắn sẽ được cần đến, nhưng liệu cách tiếp cận của Spiral có chứng minh vượt trội hơn các lựa chọn thay thế hiện có vẫn cần được chứng minh thông qua hiệu suất thế giới thực thay vì các tuyên bố marketing.
Tham khảo: Announcing Spiral