Cuộc tranh luận về đánh dấu dữ liệu có cấu trúc trên web đã bùng phát trở lại khi các nhà phát triển suy ngẫm về tình trạng hiện tại và tương lai của Microformats 2, một công nghệ từng hứa hẹn làm cho nội dung web dễ đọc hơn đối với máy móc và kết nối với nhau.
Hoài Niệm Gặp Gỡ Thực Tế Trong Sự Phát Triển Của Tiêu Chuẩn Web
Nhiều nhà phát triển đang trải qua làn sóng hoài niệm khi gặp phải các cuộc thảo luận về Microformats ngày nay. Công nghệ này xuất hiện trong thời đại Web 2.0 của những năm 2000 như một phần của phong trào semantic web rộng lớn hơn, cùng với những nhà thiết kế có ảnh hưởng như Dan Cederholm của SimpleBits. Tuy nhiên, sự đồng thuận trong cộng đồng thành viên là rõ ràng: bất chấp những nguyên tắc thanh lịch về đánh dấu HTML ngữ nghĩa, Microformats không bao giờ đạt được việc áp dụng đại trà cần thiết để có tác động lâu dài.
Sức hấp dẫn cốt lõi của công nghệ này nằm ở tính đơn giản so với các lựa chọn thay thế phức tạp hơn. Không giống như XML namespaces hoặc RDF vocabularies mà W3C thúc đẩy, Microformats đưa ra một cách tiếp cận đơn giản hoạt động liền mạch với các trình duyệt hiện có, bao gồm cả Internet Explorer. Lợi thế tương thích này khiến nó hấp dẫn đối với các nhà phát triển tìm kiếm đánh dấu ngữ nghĩa mà không có gánh nặng của các tiêu chuẩn phức tạp hơn.
Việc Sử Dụng Hiện Tại Giới Hạn Trong Các Cộng Đồng Ngách
Ngày nay, Microformats 2 tìm thấy ngôi nhà chính của mình trong cộng đồng IndieWeb, nơi nó phục vụ các chức năng cụ thể như hệ thống Webmention cho giao tiếp liên trang web. Mặc dù điều này đại diện cho việc sử dụng thực sự, nhưng nó còn xa với việc áp dụng rộng rãi mà những người ủng hộ ban đầu đã hình dung. Công nghệ này vẫn hoạt động và được hỗ trợ tích cực, với các bộ phân tích có sẵn trong nhiều ngôn ngữ lập trình bao gồm Go, JavaScript, PHP, Python và Ruby.
Một số nhà phát triển bày tỏ sự ưa thích đối với các cách tiếp cận thay thế, đề xuất rằng các thuộc tính dữ liệu có thể phù hợp hơn so với các lớp CSS cho đánh dấu ngữ nghĩa. Điều này phản ánh các cuộc thảo luận đang diễn ra về các phương pháp tốt nhất để nhúng dữ liệu có cấu trúc trong HTML.
Các Parser Microformats 2 Có Sẵn Theo Ngôn Ngữ Lập Trình:
- Go: https://go.microformat.io/
- JavaScript: https://pin13.net/mf2/ (phía client và trình duyệt)
- PHP: https://github.com/indieweb/php-mf2
- Node.js: https://github.com/glennjones/microformat-node
- Python: https://github.com/krainboltgreene/mf2py
- Ruby: https://rubygems.org/gems/mf2
- C: https://github.com/larkinscott/Microformat
Sự Nổi Lên Của Các Tiêu Chuẩn Thay Thế
Bối cảnh semantic web đã phát triển đáng kể kể từ thời hoàng kim của Microformats. Metadata Schema.org, được triển khai thông qua các định dạng microdata, RDFa hoặc JSON-LD, đã đạt được sức hút đáng kể, đặc biệt vì các công cụ tìm kiếm dựa vào nó cho các tính năng kết quả tìm kiếm phong phú. Điều này đại diện cho một cách tiếp cận thành công hơn đối với dữ liệu có cấu trúc, được thúc đẩy bởi các động lực kinh doanh rõ ràng thay vì chỉ là giá trị kỹ thuật thuần túy.
Metadata Schema.org (sử dụng microdata, RDFa hoặc JSON-LD) thực sự khá phổ biến, các công cụ tìm kiếm dựa vào nó cho các tính năng SERP 'phong phú'.
Sự xuất hiện của các mô hình ngôn ngữ lớn thêm một chiều khác vào cuộc thảo luận này. Trong khi một số người lập luận rằng LLM giảm nhu cầu về đánh dấu có cấu trúc bằng cách trích xuất ý nghĩa trực tiếp từ nội dung, những người khác thấy tiềm năng cho RDF và các công nghệ tương tự trong việc tạo dữ liệu tổng hợp và các tác vụ lý luận.
Thách Thức Kỹ Thuật Và Tính Liên Quan Hiện Đại
Thách thức cơ bản mà Microformats và các cách tiếp cận metadata vô hình tương tự phải đối mặt là gánh nặng bảo trì. Các tác giả trang web thường tập trung vào nội dung hiển thị cho khách truy cập con người, thường bỏ qua đánh dấu có thể đọc được bằng máy. Điều này dẫn đến metadata lỗi thời, không hợp lệ hoặc chứa đầy spam làm suy yếu tính hữu ích của công nghệ.
Sự phát triển của HTML5 phản ánh thực tế này, với đặc tả có lập trường rằng metadata vô hình nói chung nên được tránh. Sự ưa thích đã chuyển sang các cách tiếp cận cung cấp giá trị tức thì cho người tạo nội dung, chẳng hạn như cải thiện khả năng hiển thị trên công cụ tìm kiếm thông qua đánh dấu Schema.org.
Bất chấp những thách thức này, Microformats 2 tiếp tục phục vụ các trường hợp sử dụng cụ thể, đặc biệt trong các ứng dụng web phi tập trung nơi giao tiếp liên trang web và tính di động của dữ liệu quan trọng hơn việc áp dụng rộng rãi. Sự tồn tại của công nghệ trong các ứng dụng ngách chứng minh rằng các giải pháp kỹ thuật tốt có thể tồn tại ngay cả khi không có thành công chính thống.
Cuộc thảo luận đang diễn ra tiết lộ một căng thẳng rộng lớn hơn trong phát triển web giữa các tầm nhìn lý tưởng về semantic web và các cân nhắc thực tế về việc áp dụng, bảo trì và giá trị kinh doanh. Mặc dù Microformats 2 có thể không đạt được các mục tiêu tham vọng ban đầu, nó vẫn là minh chứng cho những nỗ lực liên tục của cộng đồng web nhằm làm cho nội dung trực tuyến có cấu trúc và kết nối với nhau hơn.
Tham khảo: How to Consume Microformats 2 Data