Mesh Optimizer Vượt Trội Hơn JPEG-XL và OpenEXR Trong Các Bài Test Nén Ảnh Floating Point

Nhóm Cộng đồng BigGo
Mesh Optimizer Vượt Trội Hơn JPEG-XL và OpenEXR Trong Các Bài Test Nén Ảnh Floating Point

Một phân tích toàn diện gần đây về nén ảnh floating point không mất dữ liệu đã tiết lộ những kết quả đáng ngạc nhiên, thách thức những quan niệm thông thường trong lĩnh vực này. Nghiên cứu đã kiểm tra các phương pháp nén khác nhau cho ảnh đa lớp thường được sử dụng trong quy trình làm phim và VFX, nơi một pixel duy nhất có thể chứa hàng chục kênh ngoài dữ liệu RGB truyền thống.

Thông số kỹ thuật bộ dữ liệu thử nghiệm

  • Tổng dung lượng: 31.22 megapixel trên 10 tệp
  • Phạm vi độ phân giải: 2048x4096 đến 8192x4096 pixel
  • Số lượng kênh: 3 đến 21 kênh trên mỗi hình ảnh
  • Kiểu dữ liệu: FP16 (độ chính xác nửa) và FP32 (độ chính xác đơn) dấu phẩy động
  • Nguồn: Kết xuất từ Blender , hình ảnh HDR từ Polyhaven
  • Tệp lớn nhất: 664.5MB không nén (21 kênh, FP32)
  • Trường hợp sử dụng: Tổng hợp phim, quy trình làm việc VFX , kết xuất đa lớp

JPEG-XL Cho Thấy Tiềm Năng Nhưng Vấn Đề Hiệu Suất Vẫn Tồn Tại

Đánh giá cho thấy rằng JPEG-XL, mặc dù là một định dạng hiện đại được thiết kế để thay thế các tiêu chuẩn cũ, vẫn gặp khó khăn với hiệu suất nén dữ liệu floating point. Các cuộc thảo luận trong cộng đồng nêu bật những lo ngại đang diễn ra về tốc độ nén không mất dữ liệu chậm vốn có của JPEG-XL, đặt ra câu hỏi liệu đây có phải là giới hạn cơ bản của đặc tả hay là vấn đề triển khai có thể được giải quyết trong các phiên bản tương lai.

Ở mức độ nỗ lực nén cao hơn (4+), JPEG-XL thực sự đạt được tỷ lệ nén tốt hơn so với các định dạng OpenEXR truyền thống, với mức 8 đạt tỷ lệ nén 2.4x. Tuy nhiên, điều này đi kèm với chi phí đắt đỏ - tốc độ nén chậm hơn tới 100 lần so với OpenEXR, khiến nó trở nên không thực tế cho nhiều quy trình làm việc thực tế nơi thời gian là yếu tố quan trọng.

So sánh hiệu suất nén

Phương pháp Tỷ lệ nén Tốc độ nén Tốc độ giải nén Trường hợp sử dụng
OpenEXR ZIP ~2.0x Chuẩn Chuẩn Tiêu chuẩn ngành
OpenEXR HTZJK ~2.1x Chậm hơn ZIP Chậm hơn ZIP Cải tiến sắp tới
JPEG-XL Level 4 ~2.0x Chậm hơn 10 lần Chậm hơn 1-7 lần Định dạng hiện đại
JPEG-XL Level 8 ~2.4x Chậm hơn 100 lần Chậm hơn 1-15 lần Nén tối đa
Mesh Optimizer + LZ4 ~2.3x Nhanh hơn 30-100 lần Nhanh hơn 20 lần Phương pháp thử nghiệm

Nhà Vô Địch Bất Ngờ Xuất Hiện Từ Ngành Công Nghiệp Game

Phát hiện đáng ngạc nhiên nhất đến từ việc thử nghiệm Mesh Optimizer, một công cụ ban đầu được thiết kế để nén dữ liệu vertex đồ họa 3D trong các ứng dụng game. Khi được điều chỉnh cho nén ảnh và kết hợp với LZ4, cách tiếp cận không thông thường này đã mang lại kết quả xuất sắc, thu hút sự chú ý của cộng đồng kỹ thuật.

Hiệu suất của Mesh optimizer ở đây là một lời nhắc nhở tốt: công nghệ tiên tiến trong nén đa mục đích rất khó để vượt qua, nhưng mục đích đặc biệt vẫn còn chỗ để cải thiện.

Cách tiếp cận Mesh Optimizer đạt được tỷ lệ nén tương đương với JPEG-XL mức 7-8 trong khi nhanh hơn 30-100 lần khi nén và nhanh hơn 20 lần khi giải nén. Lợi thế hiệu suất đáng kể này xuất phát từ cách tiếp cận chuyên biệt trong xử lý dữ liệu có cấu trúc, ban đầu được tối ưu hóa cho các vertex mesh 3D nhưng lại hiệu quả đáng ngạc nhiên đối với dữ liệu ảnh đa kênh.

Chi tiết triển khai kỹ thuật

Phương pháp Mesh Optimizer:

  • Hình ảnh được chia thành các khối 128x128 pixel
  • Mỗi khối được nén độc lập và song song
  • Kích thước đỉnh được đệm thành bội số của 4 byte khi cần thiết
  • Xử lý hậu kỳ LZ4 tùy chọn để nén bổ sung
  • Tác động kích thước tệp thực thi: 26KB ( Mesh Optimizer ) + 48KB ( LZ4 )

Hạn chế của JPEG-XL:

  • Yêu cầu các kênh màu được xen kẽ, các kênh khác phẳng
  • Giá trị subnormal FP16 không hoàn toàn lossless (vấn đề 1381)
  • Giá trị không hữu hạn (vô cực/NaN) có thể không roundtrip chính xác
  • Tác động kích thước tệp thực thi: 6,017KB
  • Độ phức tạp API: 550 dòng so với 150 cho OpenEXR
Hình ảnh này trình bày một trang web thảo luận về các kỹ thuật nén ảnh tiên tiến liên quan đến những phát hiện gần đây, bao gồm công cụ đổi mới Mesh Optimizer
Hình ảnh này trình bày một trang web thảo luận về các kỹ thuật nén ảnh tiên tiến liên quan đến những phát hiện gần đây, bao gồm công cụ đổi mới Mesh Optimizer

OpenEXR Vẫn Là Tiêu Chuẩn Ngành Mặc Dù Có Các Lựa Chọn Mới

OpenEXR tiếp tục giữ vị trí là định dạng được ưa chuộng cho các quy trình làm việc chuyên nghiệp, với chế độ nén HTZJK sắp tới mang lại những cải thiện khiêm tốn. Chế độ mới cung cấp tỷ lệ nén tốt hơn một chút nhưng với cái giá là hiệu suất giảm, tạo ra sự đánh đổi có thể hạn chế việc áp dụng trong các môi trường sản xuất nhạy cảm về thời gian.

Phương pháp thử nghiệm bao gồm một bộ dữ liệu đa dạng gồm 10 tệp với tổng cộng 31.22 triệu pixel, bao gồm các render đa lớp phức tạp với tới 21 kênh mỗi pixel. Cách tiếp cận toàn diện này cung cấp những hiểu biết có giá trị cho các chuyên gia làm việc với hình ảnh dải động cao và đa kênh trong các pipeline phát triển phim, VFX và game.

Kết quả cho thấy rằng trong khi các định dạng đã được thiết lập như OpenEXR vẫn là những lựa chọn đáng tin cậy, các cách tiếp cận sáng tạo từ các lĩnh vực liền kề có thể mang lại những giải pháp bất ngờ cho các thách thức nén lâu đời. Thành công của Mesh Optimizer chứng minh cách thụ phấn chéo giữa các lĩnh vực kỹ thuật khác nhau có thể dẫn đến những cải thiện hiệu suất đột phá.

Tham khảo: Lossless Float Image Compression