BrowserOS , trình duyệt mã nguồn mở được hỗ trợ bởi AI nhằm thách thức sự thống trị của các gã khổng lồ công nghệ trong lĩnh vực duyệt web, đã tạo ra những cuộc thảo luận kỹ thuật sôi nổi trong cộng đồng nhà phát triển. Dự án này định vị mình như một giải pháp thay thế dựa trên Chromium có thể chạy các tác nhân AI cục bộ, hứa hẹn nâng cao khả năng bảo mật và tự động hóa mà không cần dựa vào các máy chủ bên ngoài.
Thông số kỹ thuật:
- Giấy phép: AGPL-3.0 (100% mã nguồn mở)
- Nền tảng: Phiên bản rẽ nhánh từ Chromium
- Tương thích tiện ích mở rộng: Hỗ trợ đầy đủ các tiện ích mở rộng của Chrome
- Xử lý AI: Thực thi cục bộ với tích hợp Ollama
- Quy mô nhóm: 2 nhà phát triển
Tối ưu hóa hiệu suất ở cấp độ cốt lõi
Nhóm phát triển đã tiết lộ rằng BrowserOS vượt xa một trình bao bọc trình duyệt đơn giản. Không giống như nhiều dự án tương tự dựa vào các giải pháp JavaScript như Playwright , BrowserOS triển khai các thay đổi quan trọng về hiệu suất trực tiếp ở cấp độ mã nguồn C++ của Chromium . Cách tiếp cận này mang lại tốc độ thực thi nhanh hơn 20-40 lần cho các tương tác của tác nhân như nhấp chuột vào các phần tử và nhập văn bản. Nhóm cũng đang xây dựng một cây DOM được làm giàu được thiết kế đặc biệt cho các tương tác của tác nhân, được triển khai nguyên bản trong C++ thay vì thông qua các phương pháp tiêm JavaScript chậm hơn.
Cây DOM: Một giao diện lập trình đại diện cho cấu trúc của các trang web, cho phép các chương trình tương tác với các phần tử của trang
So sánh hiệu suất:
- Tương tác tác nhân BrowserOS : nhanh hơn 20-40 lần so với các giải pháp dựa trên JavaScript
- Triển khai: Sửa đổi ở cấp độ C++ so với việc tiêm JavaScript
- Kiến trúc: Nhánh rẽ Chromium với cây DOM được tăng cường cho tương tác tác nhân
Mô hình bền vững doanh nghiệp
Khi được hỏi về tính bền vững tài chính lâu dài, các người duy trì dự án đã phác thảo một mô hình kinh doanh mã nguồn mở quen thuộc. Họ dự định cung cấp giấy phép doanh nghiệp cho các phiên bản thương mại của trình duyệt, theo con đường của các dự án mã nguồn mở thành công khác. Cách tiếp cận này cho phép trình duyệt cốt lõi vẫn miễn phí và mã nguồn mở dưới giấy phép AGPL-3.0 trong khi tạo ra doanh thu từ các khách hàng doanh nghiệp cần thêm tính năng hoặc hỗ trợ.
Các hạn chế kỹ thuật định hướng quyết định kiến trúc
Quyết định tạo ra một trình duyệt độc lập thay vì một tiện ích mở rộng trình duyệt xuất phát từ các yêu cầu kỹ thuật cần thiết. Nhóm giải thích rằng các tính năng thiết yếu như truy cập vào cây khả năng tiếp cận của Chromium không có sẵn thông qua các API tiện ích mở rộng tiêu chuẩn. Google Chrome cố ý hạn chế khả năng của tiện ích mở rộng để giữ chúng nhẹ nhàng, nhưng các tác nhân AI cần truy cập hệ thống sâu hơn để hoạt động hiệu quả. Trong khi các nhà phát triển bày tỏ sẵn sàng đóng góp những thay đổi này ngược dòng cho Chromium , họ nghi ngờ Google sẽ chấp nhận các API cung cấp cho tiện ích mở rộng quyền truy cập rộng rãi như vậy.
Hỗ trợ nền tảng:
- macOS ( Apple Silicon và Intel )
- Windows
- Linux (sẽ ra mắt vào đầu tuần tới)
Yêu cầu hệ thống:
- Yêu cầu phần cứng tối thiểu, tương tự như Google Chrome
- Chỉ cần thêm tài nguyên khi chạy LLM cục bộ thông qua Ollama
Phát triển nhanh chóng và mở rộng nền tảng
Mặc dù chỉ được phát triển bởi hai người, BrowserOS đang mở rộng nhanh chóng trên các nền tảng. Trình duyệt hiện tại hỗ trợ cả Apple Silicon và Intel Mac , cũng như các hệ thống Windows . Hỗ trợ Linux đang được phát triển tích cực, với nhóm hứa hẹn sẽ có sẵn vào đầu tuần tới. Các yêu cầu phần cứng tối thiểu phù hợp với Google Chrome , giả định người dùng mang theo khóa API của riêng họ và không chạy các mô hình ngôn ngữ lớn cục bộ thông qua hỗ trợ Ollama tích hợp.
Dự án xuất hiện vào một thời điểm đặc biệt thú vị, với những tin đồn cho rằng OpenAI dự định ra mắt trình duyệt riêng của họ vào mùa hè này. Không giống như dự kiến về sản phẩm mã nguồn đóng của OpenAI , BrowserOS duy trì cam kết với việc phát triển mã nguồn mở và xử lý AI cục bộ, thu hút những người dùng quan tâm đến quyền riêng tư dữ liệu và kiểm soát của doanh nghiệp đối với trải nghiệm duyệt web.
Tham khảo: The Open-Source Agentic Browser