Ứng dụng Whispering đối mặt với cảnh báo bảo mật và tuyên bố "local-first" bị người dùng đặt câu hỏi

Nhóm Cộng đồng BigGo
Ứng dụng Whispering đối mặt với cảnh báo bảo mật và tuyên bố "local-first" bị người dùng đặt câu hỏi

Whispering , một ứng dụng chuyển đổi giọng nói thành văn bản mã nguồn mở hứa hẹn quyền riêng tư local-first, đang thu hút sự giám sát của cộng đồng về các cảnh báo bảo mật và những tuyên bố mâu thuẫn về việc xử lý dữ liệu. Ứng dụng được xây dựng bằng Rust và JavaScript , tự định vị là một giải pháp thay thế tập trung vào quyền riêng tư cho các dịch vụ chuyển đổi giọng nói dựa trên đám mây.

Các Dịch Vụ Phiên Âm Được Hỗ Trợ

  • Cloud APIs: OpenAI , Groq , Anthropic , Google , ElevenLabs , Deepgram
  • Tùy Chọn Cục Bộ: Tích hợp Speaches.ai , Whisper C++ (đang phát triển)
  • Nền Tảng: Desktop ( Windows , macOS , Linux ), Web App
  • Công Nghệ Sử Dụng: Backend Rust , frontend JavaScript / TypeScript , framework Tauri

Windows Defender gắn cờ các tệp cài đặt

Nhiều người dùng báo cáo rằng Windows Defender đang gắn cờ các tệp cài đặt của Whispering là bị nhiễm virus. Các cảnh báo bảo mật dường như xuất phát từ việc ứng dụng sử dụng crate enigo của Rust , cho phép phần mềm viết văn bản trực tiếp vào vị trí con trỏ. Chức năng này, thường được gọi là keyboard wedge, thường kích hoạt các cảnh báo sai từ phần mềm bảo mật vì nó bắt chước hành vi của các keylogger độc hại.

Quét VirusTotal cho thấy kết quả hỗn hợp trên các phiên bản khác nhau. Tệp thực thi 7.3.0 mới nhất hiển thị cờ từ Arctic Wolf (được đánh dấu là Unsafe) và cả AVG và Avast (được phân loại là Potentially Unwanted Program). Tuy nhiên, phiên bản trình cài đặt MSI hiển thị kết quả sạch hơn với ít mối lo ngại về bảo mật hơn.

Lưu ý: Keyboard wedge là phần mềm chặn hoặc mô phỏng đầu vào bàn phím, cho phép các chương trình tự động gõ văn bản.

Kết quả Quét Bảo mật ( VirusTotal )

  • Phiên bản 7.3.0 EXE: Được đánh dấu bởi Arctic Wolf (Không an toàn), AVG & Avast (PUP)
  • Phiên bản 7.3.0 MSI: Kết quả sạch, không có cảnh báo ngay lập tức
  • Phiên bản 7.2.1/7.2.2 MSI: Không phát hiện cảnh báo nào
  • Phiên bản 7.2.1/7.2.2 EXE: 3 cảnh báo ( ArcticWolf Không an toàn, AVG & Avast PUP)

Tuyên bố về quyền riêng tư bị cộng đồng chỉ trích

Mặc dù có marketing rộng rãi về hoạt động local-first, người dùng đang đặt câu hỏi liệu Whispering có thực sự giữ dữ liệu trên thiết bị hay không. Sự nhầm lẫn phát sinh từ video demo của ứng dụng, cho thấy các bước cấu hình cho các dịch vụ API bên ngoài bao gồm Groq , OpenAI , Anthropic , Google và ElevenLabs .

Văn bản ở đây nói rằng tất cả dữ liệu vẫn ở trên thiết bị và nhấn mạnh mức độ bạn có thể tin tưởng vào điều đó... nhưng bước một là cấu hình token truy cập cho các dịch vụ bên ngoài? Các dịch vụ được hiển thị có đang thực hiện chuyển đổi thực tế, lắng nghe mọi thứ tôi nói không?

Sự ngắt kết nối này giữa các tuyên bố marketing và chức năng thực tế đã khiến người dùng tiềm năng không chắc chắn về mô hình quyền riêng tư thực sự của ứng dụng. Trong khi ứng dụng hỗ trợ chuyển đổi cục bộ thông qua tích hợp Speaches.ai , quy trình làm việc chính dường như dựa vào các dịch vụ dựa trên đám mây với khóa API do người dùng cung cấp.

Hỗ trợ chuyển đổi cục bộ vẫn đang phát triển

Nhóm phát triển đang tích cực làm việc để giải quyết các hạn chế chuyển đổi cục bộ. Một bản cập nhật lớn thêm hỗ trợ Whisper C++ hiện đang trong quá trình thực hiện, điều này sẽ cung cấp chức năng ngoại tuyến rộng rãi hơn. Bản cập nhật này đại diện cho một bước tiến đáng kể hướng tới việc thực hiện các lời hứa local-first của ứng dụng.

Các thành viên cộng đồng cũng đang yêu cầu hỗ trợ cho các mô hình mới hơn như Parakeet , cung cấp hiệu suất nhanh hơn đáng kể so với các mô hình Whisper truyền thống. Các báo cáo sớm cho thấy Parakeet có thể đạt tốc độ chuyển đổi 3000x thời gian thực trên phần cứng cao cấp và 5x thời gian thực ngay cả trên CPU laptop, trong khi vẫn duy trì độ chính xác tốt hơn Whisper-large-v3 .

So sánh hiệu suất: Parakeet vs Whisper

  • Parakeet: Nhanh gấp 3000 lần thời gian thực trên GPU A100, nhanh gấp 5 lần thời gian thực trên CPU laptop
  • Whisper: Hiệu suất chuẩn làm mốc so sánh
  • Độ chính xác: Parakeet được báo cáo là chính xác hơn whisper-large-v3
  • Tính khả dụng: Hỗ trợ Parakeet đã được yêu cầu nhưng chưa được triển khai trong Whispering

Cạnh tranh trong không gian mã nguồn mở

Whispering đối mặt với cạnh tranh từ các giải pháp thay thế đã được thiết lập như VoiceInk cho macOS và MacWhisper , cả hai đều cung cấp chức năng tương tự với các cách tiếp cận khác nhau đối với xử lý cục bộ. VoiceInk cung cấp điều khiển phím tắt thuận tiện và phản hồi trực quan, trong khi MacWhisper cung cấp giá mua một lần và cập nhật thường xuyên.

Bối cảnh rộng hơn bao gồm các công cụ dựa trên Whisper khác nhau, mặc dù hầu hết vẫn là các wrapper xung quanh mô hình Whisper cốt lõi thay vì các cách tiếp cận khác biệt cơ bản đối với nhận dạng giọng nói.

Cuộc thảo luận của cộng đồng làm nổi bật nhu cầu ngày càng tăng đối với các công cụ chuyển đổi thực sự local-first có thể sánh ngang với sự tiện lợi của các dịch vụ đám mây trong khi vẫn duy trì quyền riêng tư của người dùng. Khi Whispering tiếp tục phát triển, việc giải quyết cả các mối lo ngại về bảo mật và làm rõ mô hình quyền riêng tư của nó sẽ rất quan trọng để giành được sự tin tưởng của người dùng trong không gian cạnh tranh này.

Tham khảo: Whispering