Nhà phát triển tạo ra công cụ chuyển đổi video hướng dẫn piano thành bản nhạc có thể đọc được

Nhóm Cộng đồng BigGo
Nhà phát triển tạo ra công cụ chuyển đổi video hướng dẫn piano thành bản nhạc có thể đọc được

Một công cụ web mới có tên PianoReader đang giải quyết một vấn đề phổ biến mà các học viên piano gặp phải khi học qua các video hướng dẫn phổ biến hiển thị các nốt nhạc rơi xuống trên bàn phím ảo. Ứng dụng này sử dụng công nghệ thị giác máy tính để phân tích các video hướng dẫn này và chuyển đổi chúng thành định dạng tablature piano truyền thống.

Vấn đề với các video hướng dẫn piano hiện tại

Hầu hết các video hướng dẫn piano có sẵn trực tuyến đều sử dụng phần mềm như Synthesia để tạo ra màn hình hoạt hình với những giọt mưa rơi xuống làm sáng các phím piano. Mặc dù hấp dẫn về mặt thị giác, những video hướng dẫn này lại tạo ra những thách thức đáng kể cho người học. Nhiều học viên thấy khó khăn trong việc theo kịp các nốt nhạc rơi xuống hoặc xác định các hợp âm cụ thể đang được chơi, vì họ phải liên tục theo dõi các yếu tố thị giác chuyển động thay vì tập trung vào việc học nhạc.

Cộng đồng đã nhận ra vấn đề này từ lâu, với nhiều người học bày tỏ sự thất vọng tương tự về khoảng cách giữa những video hướng dẫn đẹp mắt này và các định dạng học tập thực tế hơn như guitar tabs. Tính chất hoạt hình của những video hướng dẫn này, mặc dù hấp dẫn, thường thiếu sự rõ ràng từng bước mà việc giảng dạy âm nhạc hiệu quả đòi hỏi.

Đổi mới kỹ thuật sử dụng công nghệ trình duyệt

PianoReader hoạt động hoàn toàn trong trình duyệt web bằng công nghệ HTML Canvas , loại bỏ nhu cầu xử lý phía máy chủ. Công cụ này chụp các khung hình video theo thời gian thực và áp dụng các kỹ thuật thị giác máy tính để phát hiện khi các phím piano được nhấn. Người dùng bắt đầu bằng cách đánh dấu thủ công vị trí của các phím C1 và D1 trên video của họ, cho phép hệ thống lập bản đồ toàn bộ bố cục bàn phím.

Quá trình phát hiện hoạt động tương tự như cảm biến photoresistor, lấy mẫu các vùng phím trên mỗi khung hình video để xác định xem các phím có được chiếu sáng hay không. Hệ thống áp dụng các bộ lọc thang xám để cải thiện độ chính xác và sử dụng thư viện tonal.js để xác định các cấu trúc hợp âm từ các tổ hợp phím được phát hiện.

HTML Canvas: Một công nghệ web cho phép vẽ đồ họa và xử lý hình ảnh trực tiếp trong trình duyệt Photoresistor: Một cảm biến phát hiện mức độ ánh sáng, thường được sử dụng trong các dự án điện tử

Thông số kỹ thuật của PianoReader:

  • Nền tảng: Dựa trên web (chỉ hoạt động trên trình duyệt)
  • Xử lý: Phía client sử dụng HTML Canvas
  • Đầu vào: Tệp video đã tải xuống (không hỗ trợ nhập trực tiếp từ YouTube)
  • Đầu ra: Bản nhạc piano với ký hiệu tay trái/tay phải
  • Nhận diện phím: Chỉ các phím trắng
  • Thư viện phụ thuộc: Fabric.js cho giao diện người dùng, tonal.js cho nhận diện hợp âm
  • Tốc độ xử lý: Thời gian thực (phải phát ở tốc độ video bình thường)

Hạn chế hiện tại và tiềm năng tương lai

Công cụ này gặp phải một số ràng buộc kỹ thuật hạn chế khả năng sử dụng ngay lập tức. Việc xử lý yêu cầu tải video xuống cục bộ do các hạn chế bảo mật của trình duyệt ngăn cản việc phân tích nội dung cross-origin từ các nền tảng như YouTube . Ngoài ra, việc phân tích từng khung hình có nghĩa là video phải phát ở tốc độ bình thường để tránh bỏ sót khung hình, khiến quá trình chuyển đổi tốn thời gian.

Hiện tại, PianoReader chỉ hoạt động với các phím piano trắng, vì khoảng cách không đều của các phím đen tạo ra thêm độ phức tạp. Độ chính xác cũng có thể thay đổi tùy thuộc vào chất lượng video và điều kiện ánh sáng, đôi khi yêu cầu điều chỉnh thủ công.

Bất chấp những hạn chế này, phản hồi từ cộng đồng đã tích cực, với các nhà phát triển đã khám phá khả năng tích hợp với các nền tảng học piano hiện có. Một số người dùng đã bày tỏ sự quan tâm đến việc kết hợp công nghệ này với các hệ thống lưu trữ tab dựa trên trình duyệt để tạo ra các công cụ học tập toàn diện hơn.

Dự án này đại diện cho một cách tiếp cận thú vị để giải quyết một vấn đề thực tế trong giáo dục âm nhạc, chứng minh cách thị giác máy tính dựa trên trình duyệt có thể giải quyết những thách thức ảnh hưởng đến nhiều người học. Mặc dù không hoàn hảo, nó cung cấp một giải pháp thực tế để chuyển đổi các video hướng dẫn trực quan thành các định dạng truyền thống, dễ đọc hơn mà nhiều học viên ưa thích.

Tham khảo: Piano Reader