Lược đồ XML 8.000 trang của Microsoft gây tranh cãi về độ phức tạp có chủ ý hay yêu cầu tương thích ngược

Nhóm Cộng đồng BigGo
Lược đồ XML 8.000 trang của Microsoft gây tranh cãi về độ phức tạp có chủ ý hay yêu cầu tương thích ngược

Cộng đồng công nghệ đang tham gia vào một cuộc thảo luận sôi nổi về việc liệu định dạng Office Open XML ( OOXML ) của Microsoft có thể hiện sự khóa chặt nhà cung cấp có chủ ý thông qua độ phức tạp giả tạo, hay chỉ đơn giản phản ánh sự phát triển tự nhiên của một tiêu chuẩn tài liệu toàn diện. Cuộc tranh luận tập trung xung quanh tài liệu lược đồ XML của Microsoft , trải dài hơn 8.000 trang và bao gồm các cấu trúc lồng nhau sâu mà các nhà phê bình cho rằng khiến việc triển khai bởi bên thứ ba gần như không thể.

Đặc điểm phức tạp của Microsoft OOXML:

  • Tài liệu: Hơn 8.000 trang
  • Cấu trúc: Hệ thống phân cấp thẻ lồng nhau sâu
  • Thành phần: Hàng trăm thành phần tùy chọn hoặc bị quá tải
  • Tính năng: Điểm mở rộng, ký tự đại diện, nhiều không gian tên
  • Hỗ trợ di sản: Khả năng tương thích với định dạng nhị phân WordPerfect và Office trong nhiều thập kỷ

Tranh cãi về độ phức tạp

Trung tâm của cuộc thảo luận là một câu hỏi cơ bản: Liệu định dạng OOXML của Microsoft có bị làm phức tạp một cách cố ý để ngăn cản các đối thủ cạnh tranh tạo ra phần mềm tương thích? Định dạng này bao gồm các tính năng như cấu trúc thẻ lồng nhau sâu, trừu tượng hóa quá mức, hàng trăm phần tử tùy chọn và hệ thống phân cấp kiểu phức tạp. Các nhà phê bình cho rằng điều này tạo ra một rào cản tương tự như hệ thống đường sắt nơi đường ray mở cho tất cả, nhưng hệ thống điều khiển phức tạp đến mức chỉ có nhà sản xuất ban đầu mới có thể vận hành tàu hiệu quả.

Tuy nhiên, nhiều nhà phát triển phản bác lại những tuyên bố về ý định xấu có chủ ý. Họ chỉ ra rằng OOXML phải nắm bắt hàng thập kỷ các tính năng cũ từ WordPerfect và các định dạng nhị phân Office khác nhau trong khi duy trì khả năng tương thích ngược. Độ phức tạp không phải là giả tạo mà phản ánh các tính năng và đặc điểm tích lũy được xây dựng trong 40 năm phát triển xử lý văn bản.

Thực tế của sự phát triển định dạng tài liệu

Cuộc thảo luận cộng đồng tiết lộ một bức tranh sắc thái hơn về cách các định dạng tài liệu trở nên phức tạp theo thời gian. Các nhà phát triển trong ngành ngân hàng lưu ý rằng lược đồ XML của họ thường có kích thước hàng chục megabyte, với tài liệu vượt xa 8.000 trang của Microsoft . Điều này cho thấy rằng độ phức tạp trong lược đồ XML doanh nghiệp là phổ biến trên các ngành, không riêng gì Microsoft .

Độ phức tạp không phải là giả tạo, nó hoàn toàn hữu cơ và tự nhiên. Đó là độ phức tạp ngẫu nhiên sinh ra từ hàng thập kỷ lịch sử, khả năng tương thích ngược, sự phục vụ hời hợt cho tính mở và việc đánh dấu hộp kiểm tuân thủ quy định.

Thách thức trở nên đặc biệt rõ ràng khi xem xét rằng các định dạng tệp này về cơ bản phục vụ như trạng thái ứng dụng được tuần tự hóa. Mọi tính năng trong Microsoft Office phải có thể được biểu diễn trong định dạng tệp, từ cờ tương thích và nhúng OLE đến macro và ghi chú đánh giá tài liệu.

Các phương pháp tiếp cận và giải pháp thay thế

Cuộc tranh luận đã khơi dậy các thảo luận rộng hơn về triết lý tạo tài liệu. Một số thành viên cộng đồng ủng hộ việc từ bỏ hoàn toàn chỉnh sửa WYSIWYG (What You See Is What You Get) để ủng hộ các định dạng tập trung vào nội dung như Markdown . Những người khác cho rằng cách tiếp cận này bỏ qua nhu cầu của người dùng, vì hầu hết mọi người muốn tài liệu xuất hiện chính xác như dự định khi chia sẻ hoặc in.

Thú vị là LibreOffice đã quản lý để triển khai hỗ trợ OOXML đáng kể bất chấp độ phức tạp, mặc dù các nhà phát triển thừa nhận nó đại diện cho một thách thức đáng kể liên tục. Sự thành công của LibreOffice cho thấy rằng mặc dù định dạng phức tạp, nó không phải là không thể vượt qua đối với các dự án mã nguồn mở được tài trợ tốt.

Các Định Dạng Tài Liệu Thay Thế Được Đề Cập:

  • OpenDocument: Giải pháp thay thế gọn nhẹ hơn cho OOXML, được các cơ quan tương tác của EU ưa chuộng
  • Markdown: Định dạng tập trung vào nội dung, tách biệt cấu trúc khỏi cách trình bày
  • HTML/CSS: Tiêu chuẩn web mở, tuy nhiên cũng phức tạp để triển khai đầy đủ
  • LaTeX: Định dạng xuất bản học thuật với khả năng kiểm soát typography chính xác

Những tác động rộng hơn

Cuộc thảo luận này phản ánh những căng thẳng lớn hơn trong ngành công nghiệp phần mềm giữa tính mở và khả năng tương thích. Mặc dù các định dạng đơn giản hơn như OpenDocument tồn tại, chúng thiếu hỗ trợ di sản rộng rãi mà nhiều tổ chức yêu cầu. Cộng đồng dường như chia rẽ giữa những người xem cách tiếp cận của Microsoft là kỹ thuật thực dụng và những người xem nó như khóa chặt chiến lược.

Cuộc tranh luận cuối cùng làm nổi bật một nguyên tắc chính trong thiết kế công nghệ: độ phức tạp có thể giam cầm người dùng, trong khi sự đơn giản giải phóng họ. Tuy nhiên, đạt được sự đơn giản đó trong khi duy trì khả năng tương thích với hàng thập kỷ tài liệu hiện có vẫn là một trong những vấn đề thách thức nhất trong kỹ thuật phần mềm.

Tham khảo: An artificially complex XML schema as a lock-in tool