Lập trình viên tạo giao diện website theo dõi chuyển động mắt DIY sử dụng WebGazer.js như giải pháp thay thế Apple Vision Pro

Nhóm biên tập BigGo
Lập trình viên tạo giao diện website theo dõi chuyển động mắt DIY sử dụng WebGazer.js như giải pháp thay thế Apple Vision Pro

Một lập trình viên sáng tạo đã xây dựng giao diện website theo dõi chuyển động mắt đột phá có tên Eyesite như một giải pháp thay thế tiết kiệm chi phí cho chiếc tai nghe Vision Pro trị giá 3.500 đô la Mỹ của Apple. Dự án này cho thấy cách người dùng có thể điều hướng các trang web chỉ bằng chuyển động mắt, kết hợp với việc nhấn phím cách để tương tác.

So sánh chi phí:

  • Apple Vision Pro : 3.500 USD
  • Giải pháp tự làm Eyesite : Miễn phí (chỉ cần webcam và trình duyệt web)
  • WebGazer.js : Thư viện JavaScript mã nguồn mở
Dự án  Eyesite : Một giải pháp thay thế tiết kiệm chi phí cho các thiết bị theo dõi chuyển động mắt cao cấp
Dự án Eyesite : Một giải pháp thay thế tiết kiệm chi phí cho các thiết bị theo dõi chuyển động mắt cao cấp

Triển khai công nghệ theo dõi chuyển động mắt

Dự án tận dụng WebGazer.js, một thư viện JavaScript ban đầu được phát triển bởi các nhà nghiên cứu từ Đại học Brown và Georgia Tech vào năm 2016. Hệ thống yêu cầu quy trình hiệu chuẩn 9 điểm, trong đó người dùng nhìn vào các vị trí cụ thể trên màn hình và nhấp chuột để ánh xạ ánh mắt của họ thành tọa độ. Để cải thiện độ chính xác, lập trình viên phát hiện rằng việc thu thập 5 mẫu ánh xạ cho mỗi điểm hiệu chuẩn đã nâng cao đáng kể độ chính xác của việc theo dõi.

WebGazer.js là một thư viện JavaScript sử dụng thị giác máy tính để theo dõi chuyển động mắt thông qua webcam tiêu chuẩn, không yêu cầu phần cứng chuyên dụng.

Quy trình hiệu chuẩn WebGazer.js:

  • Hệ thống hiệu chuẩn 9 điểm (các góc, cạnh bên, trung tâm)
  • 5 mẫu ánh xạ cho mỗi điểm để đạt độ chính xác tối ưu
  • Thời gian do người dùng kiểm soát để phù hợp với việc chớp mắt và nghỉ ngơi
  • Kích hoạt bằng phím cách để tương tác nhấp chuột

Thách thức thiết kế trải nghiệm người dùng

Một trong những quyết định thiết kế thú vị nhất liên quan đến việc làm cho con trỏ theo dõi mắt trở nên vô hình. Ban đầu, người dùng có thể thấy một chấm đỏ cho biết hệ thống phát hiện ánh mắt của họ ở đâu, nhưng điều này tạo ra hai vấn đề lớn. Chấm đó trở nên gây xao nhãng, khiến người dùng vô thức tập trung vào nó thay vì các yếu tố giao diện dự định. Ngoài ra, việc hiển thị theo dõi đã tiết lộ sự thiếu chính xác vốn có của hệ thống, điều này phá vỡ trải nghiệm nhập vai.

Giải pháp bao gồm ẩn cả con trỏ mắt và con trỏ chuột truyền thống, tạo ra cảm giác tự nhiên hơn về việc điều khiển trực tiếp bằng mắt. Phản hồi trực quan đến thông qua các hiệu ứng phát sáng và thu phóng tinh tế khi người dùng nhìn vào các yếu tố tương tác.

Hạn chế kỹ thuật và giải pháp thay thế

Công nghệ theo dõi chuyển động mắt đối mặt với những thách thức về độ chính xác đáng kể, với hiện tượng rung lắc đáng chú ý có thể nhìn thấy trong chế độ gỡ lỗi. Để bù đắp cho hạn chế này, lập trình viên đã triển khai các yếu tố giao diện người dùng có kích thước lớn và hạn chế trang web chỉ dành cho màn hình lớn hơn, khiến các thiết bị di động không tương thích.

Các cuộc thảo luận cộng đồng tiết lộ nghiên cứu đang diễn ra về việc cải thiện phương pháp hiệu chuẩn, với các đề xuất cho quy trình hiệu chuẩn hấp dẫn hơn có cảm giác như trò chơi thay vì nhiệm vụ tẻ nhạt. Một số lập trình viên đang thử nghiệm với hiệu chuẩn động liên tục cải thiện độ chính xác dựa trên tương tác của người dùng.

Yêu cầu kỹ thuật:

  • Hạn chế kích thước màn hình tối thiểu (không tương thích với thiết bị di động)
  • Webcam tiêu chuẩn cho việc theo dõi chuyển động mắt
  • Các thành phần giao diện người dùng lớn để bù đắp cho hiện tượng rung lắc khi theo dõi
  • Hệ thống ẩn con trô chuột để tạo trải nghiệm nhập vai

Mối quan ngại về quyền riêng tư và giám sát

Dự án đã khơi dậy các cuộc trò chuyện rộng lớn hơn về công nghệ theo dõi chuyển động mắt trong không gian công cộng. Người dùng đã lưu ý về sự phổ biến của camera trong màn hình quảng cáo kỹ thuật số, với một số người tích cực dán nhãn dính lên các cảm biến để ngăn chặn việc theo dõi. Cuộc thảo luận làm nổi bật nhận thức ngày càng tăng về công nghệ giám sát phổ biến, ngay cả khi một số người lập luận rằng dữ liệu xem ẩn danh có thể giúp các doanh nghiệp đưa ra quyết định quảng cáo sáng suốt hơn.

Ứng dụng tương lai và khả năng tiếp cận

Công nghệ này cho thấy tiềm năng cho các ứng dụng khả năng tiếp cận và giao diện trò chơi. Trong khi các hạn chế hiện tại ngăn cản việc nhắm mục tiêu chính xác trong trò chơi do các vấn đề về độ trễ và độ chính xác, khái niệm này mở ra khả năng cho người dùng gặp thách thức về khả năng vận động. Cảm giác tự nhiên của điều hướng được điều khiển bằng mắt cuối cùng có thể cho phép trải nghiệm duyệt web và đọc không cần sử dụng tay.

Dự án đại diện cho một minh chứng ấn tượng về những gì có thể thực hiện được với các công nghệ web hiện có, mang đến cái nhìn thoáng qua về các giao diện máy tính dễ tiếp cận và trực quan hơn mà không yêu cầu phần cứng chuyên dụng đắt tiền.

Tham khảo: Making eyesite