Công cụ kiểm tra ngữ pháp Harper sử dụng hệ thống dựa trên quy tắc, không phải LLM để đạt hiệu suất siêu nhanh

Nhóm Cộng đồng BigGo
Công cụ kiểm tra ngữ pháp Harper sử dụng hệ thống dựa trên quy tắc, không phải LLM để đạt hiệu suất siêu nhanh

Harper , một công cụ kiểm tra ngữ pháp mã nguồn mở mới được định vị như một giải pháp thay thế cho Grammarly , đã tạo ra cuộc thảo luận trong cộng đồng về công nghệ cơ bản của nó. Trong khi nhiều người dùng ban đầu cho rằng nó sử dụng các mô hình ngôn ngữ lớn (LLM), công cụ này thực sự dựa trên một cách tiếp cận hoàn toàn khác ưu tiên tốc độ và quyền riêng tư.

Chi tiết kỹ thuật:

  • Giấy phép: Apache-2.0 (mã nguồn mở)
  • Kho lưu trữ: Có sẵn trên GitHub dưới Automattic
  • Quyền riêng tư: Xử lý 100% cục bộ, không truyền dữ liệu
  • Các loại quy tắc: Sửa lỗi cụm từ tĩnh và quy tắc ngữ pháp động

Hệ thống dựa trên quy tắc cung cấp khả năng kiểm tra ngữ pháp nhanh chóng

Cộng đồng nhanh chóng phát hiện ra rằng Harper hoạt động dựa trên các quy tắc được mã hóa cứng thay vì các mô hình AI. Người dùng kiểm tra mã nguồn đã tìm thấy các định nghĩa quy tắc rõ ràng cho những lỗi ngữ pháp phổ biến. Hệ thống bao gồm cả việc sửa lỗi cụm từ đơn giản và các quy tắc động phức tạp hơn xử lý các tình huống như lựa chọn giữa your và you're và quản lý việc đặt dấu phẩy Oxford.

Cách tiếp cận dựa trên quy tắc này giải thích cho những tuyên bố hiệu suất ấn tượng của Harper . Công cụ có thể phân tích hầu hết các tài liệu và đưa ra gợi ý trong vòng chưa đến 10 mili giây, một tốc độ không thể đạt được với các công cụ kiểm tra ngữ pháp dựa trên LLM truyền thống đòi hỏi các yêu cầu mạng và tài nguyên tính toán đáng kể.

Thông số kỹ thuật hiệu suất:

  • Thời gian phản hồi: Dưới 10 mili giây cho hầu hết các tài liệu
  • Hoạt động: Hoàn toàn offline, không yêu cầu kết nối mạng
  • Kiến trúc: Hệ thống dựa trên quy tắc với các quy tắc ngữ pháp được mã hóa cứng

Thiết kế ưu tiên quyền riêng tư hoạt động hoàn toàn offline

Kiến trúc của Harper giải quyết những lo ngại ngày càng tăng về quyền riêng tư dữ liệu trong các công cụ viết. Vì mọi thứ đều chạy cục bộ trên thiết bị của người dùng, không có dữ liệu văn bản nào rời khỏi máy tính. Lựa chọn thiết kế này loại bỏ lo lắng về việc các công ty sử dụng văn bản cá nhân để huấn luyện mô hình ngôn ngữ hoặc vi phạm bản quyền thông qua việc thu thập dữ liệu trái phép.

Khả năng offline cũng có nghĩa là Harper hoạt động mà không cần kết nối internet, làm cho nó đáng tin cậy cho người dùng trong các môi trường khác nhau nơi truy cập mạng có thể bị hạn chế hoặc không ổn định.

Khả năng hỗ trợ nền tảng:

  • Tích hợp Language Server Protocol (LSP)
  • Thư viện JavaScript thông qua WebAssembly
  • Rust crate để tích hợp native
  • Hỗ trợ chuyên biệt cho Visual Studio Code , Neovim , Obsidian , và Chrome

Hỗ trợ đa nền tảng thông qua nhiều tùy chọn tích hợp

Harper cung cấp tính linh hoạt thông qua các định dạng triển khai khác nhau. Nó có sẵn dưới dạng language server, thư viện JavaScript thông qua WebAssembly , và Rust crate, cho phép các nhà phát triển tích hợp kiểm tra ngữ pháp vào các ứng dụng và quy trình làm việc khác nhau.

Nhóm phát triển đặc biệt tập trung vào việc tạo ra các tích hợp hoàn thiện cho các công cụ phát triển phổ biến bao gồm Visual Studio Code , Neovim , Obsidian , và các tiện ích mở rộng Chrome , nhận ra rằng tích hợp quy trình làm việc liền mạch là rất quan trọng cho việc áp dụng.

Mặc dù Harper có thể không bắt được mọi sắc thái ngữ pháp mà các công cụ hỗ trợ AI tinh vi hơn có thể xác định, sự kết hợp giữa tốc độ, quyền riêng tư và chức năng offline của nó cung cấp một giải pháp thay thế hấp dẫn cho những người dùng ưu tiên các tính năng này hơn việc phân tích ngữ pháp toàn diện.

Tham khảo: Hi. I'm Harper. Grammar Checking That Fits into Your Workflo