Các nhà phát triển Go tranh luận về rủi ro bảo mật trong việc phân tích cú pháp JSON, XML và YAML sau báo cáo lỗ hổng

Nhóm Cộng đồng BigGo

Các nhà phát triển Go tranh luận về rủi ro bảo mật trong việc phân tích cú pháp JSON, XML và YAML sau báo cáo lỗ hổng

Một phân tích bảo mật gần đây làm nổi bật các lỗ hổng trong các trình phân tích cú pháp thư viện chuẩn của Go đã gây ra cuộc tranh luận sôi nổi giữa các nhà phát triển về các thực hành xử lý dữ liệu phù hợp và các lựa chọn thiết kế ngôn ngữ. Báo cáo này chứng minh cách các thao tác phân tích cú pháp có vẻ vô hại có thể dẫn đến các lỗ hổng bảo mật nghiêm trọng, nhưng phản ứng của cộng đồng cho thấy những bất đồng sâu sắc hơn về việc trách nhiệm thuộc về ai.

Kiến trúc so với việc đổ lỗi cho trình phân tích cú pháp

Cuộc thảo luận sôi nổi nhất tập trung vào việc liệu những vấn đề này có đại diện cho các vấn đề thực sự của trình phân tích cú pháp hay thiết kế ứng dụng kém. Nhiều nhà phát triển có kinh nghiệm cho rằng nguyên nhân gốc rễ không phải là các thư viện phân tích cú pháp của Go, mà là những sai lầm kiến trúc cơ bản. Mối quan tâm chính liên quan đến việc các nhà phát triển sử dụng cùng một cấu trúc dữ liệu cho cả hoạt động cơ sở dữ liệu và các điểm cuối API, tạo ra cơ hội cho việc tiết lộ dữ liệu không mong muốn.

IsAdmin đang làm gì trong yêu cầu tạo người dùng DTO ngay từ đầu? Các ví dụ dường như chỉ ra việc tái sử dụng không phù hợp các mô hình dữ liệu.

Lời phê bình kiến trúc này làm nổi bật một anti-pattern phổ biến nơi các nhà phát triển tạo ra các cấu trúc dữ liệu đơn lẻ phục vụ nhiều mục đích, từ bản ghi cơ sở dữ liệu đến phản hồi API. Khi các cấu trúc này được tự động serialize mà không có kiểm soát trường cẩn thận, thông tin nhạy cảm có thể bị rò rỉ hoặc dữ liệu độc hại có thể bị tiêm vào.

Các Thực Hành Bảo Mật Được Khuyến Nghị:

• Tách biệt cấu trúc dữ liệu - Sử dụng các kiểu dữ liệu riêng biệt cho các yêu cầu API, mô hình cơ sở dữ liệu và logic nghiệp vụ • Xác minh Content-Type - Kiểm tra rõ ràng các header yêu cầu để ngăn chặn các cuộc tấn công nhầm lẫn định dạng • Xác thực đầu vào - Triển khai các lớp xác thực không phụ thuộc vào hành vi của parser để đảm bảo bảo mật • Ánh xạ trường rõ ràng - Tránh việc tự động serialize tất cả các trường của struct • Giới hạn độ sâu phân tích - Đặt các hạn chế để ngăn chặn các cuộc tấn công từ chối dịch vụ


Sơ đồ minh họa tương tác giữa đầu vào của người dùng và quá trình xử lý backend, nhấn mạnh các vấn đề có thể phát sinh từ việc tái sử dụng cấu trúc dữ liệu không phù hợp

Các lựa chọn thiết kế của Go bị chỉ trích

Một số quyết định thiết kế của Go đang thu hút sự chỉ trích từ cộng đồng nhà phát triển. Việc khớp khóa JSON không phân biệt chữ hoa chữ thường của ngôn ngữ nổi bật như đặc biệt gây tranh cãi, với các nhà phát triển lưu ý rằng hành vi này khác với hầu như mọi triển khai JSON của ngôn ngữ lập trình khác. Sự không nhất quán này có thể tạo ra các lỗ hổng bảo mật khi các hệ thống sử dụng các ngôn ngữ khác nhau xử lý cùng một dữ liệu khác nhau.

Việc sử dụng các thẻ struct dựa trên chuỗi cho metadata trường cũng phải đối mặt với sự giám sát. Không giống như các hệ thống chú thích có cấu trúc hơn trong các ngôn ngữ như Java hoặc Rust, cách tiếp cận của Go yêu cầu phân tích cú pháp chuỗi để trích xuất các tùy chọn cấu hình, dẫn đến các lỗi tinh vi khi các nhà phát triển mắc lỗi chính tả trong cú pháp thẻ.

Các Vấn Đề Bảo Mật Thường Gặp Của Go Parser:

• Khóa JSON không phân biệt chữ hoa thường - Trình phân tích JSON của Go khớp các trường struct bất kể chữ hoa hay thường, khác với hầu hết các ngôn ngữ khác • Chấp nhận dữ liệu rác ở cuối - Trình phân tích XML xử lý các tài liệu có nội dung thừa mà không báo lỗi • Tuần tự hóa trường tự động - Tất cả các trường struct công khai đều được tuần tự hóa theo mặc định trừ khi được loại trừ một cách rõ ràng • Metadata dựa trên chuỗi - Các thẻ struct sử dụng phân tích chuỗi có thể dẫn đến lỗi cấu hình • Polyglot payloads - Các chuỗi dữ liệu đơn có thể hợp lệ trên nhiều định dạng JSON , XML và YAML


Hình ảnh này cho thấy cách phân tích JSON trong ngôn ngữ Go có thể dẫn đến những bất nhất, làm nổi bật các lựa chọn thiết kế cụ thể đang bị chỉ trích trong cộng đồng

Vấn đề Polyglot Payload

Một trong những khám phá đáng ngạc nhiên nhất liên quan đến dữ liệu có thể được phân tích cú pháp đồng thời như JSON, XML và YAML hợp lệ. Điều này tạo ra cơ hội cho kẻ tấn công tạo ra các payload hoạt động khác nhau tùy thuộc vào trình phân tích cú pháp nào xử lý chúng. Vấn đề trở nên đặc biệt nguy hiểm khi các dịch vụ khác nhau trong một hệ thống sử dụng các thư viện phân tích cú pháp khác nhau, có khả năng cho phép dữ liệu độc hại bỏ qua các kiểm tra bảo mật.

Giải pháp cộng đồng và thực hành tốt nhất

Bất chấp cuộc tranh luận sôi nổi về việc đổ lỗi, cộng đồng đã tập hợp xung quanh một số giải pháp thực tế. Cách tiếp cận được ủng hộ rộng rãi nhất liên quan đến việc tạo ra các cấu trúc dữ liệu riêng biệt cho các lớp ứng dụng khác nhau - các loại ribiệt cho yêu cầu API, hoạt động cơ sở dữ liệu và logic kinh doanh nội bộ. Mặc dù điều này yêu cầu nhiều mã hơn, nó cung cấp các ranh giới rõ ràng và ngăn chặn việc tiết lộ dữ liệu tình cờ.

Nhiều nhà phát triển cũng ủng hộ các bước xác thực rõ ràng thay vì dựa vào các trình phân tích cú pháp cho bảo mật. Triết lý parse, don't validate này gợi ý rằng các ứng dụng nên ngay lập tức chuyển đổi dữ liệu đã phân tích cú pháp thành các biểu diễn nội bộ có kiểu mạnh, loại bỏ bất kỳ trường nào không được mong đợi một cách rõ ràng.

Cuộc thảo luận tiết lộ một căng thẳng cơ bản trong phát triển phần mềm hiện đại giữa sự tiện lợi và bảo mật. Triết lý thiết kế của Go nhấn mạnh sự đơn giản và dễ sử dụng, nhưng điều này đôi khi có thể xung đột với các thực hành bảo mật tốt nhất. Như một nhà phát triển đã lưu ý, sự tiện lợi của serialization tự động về cơ bản trái ngược với bảo mật vì nó khuyến khích các nhà phát triển đi tắt có thể có hậu quả nghiêm trọng.

Trong khi báo cáo bảo mật ban đầu tập trung vào các hành vi trình phân tích cú pháp cụ thể, phản ứng của cộng đồng cho thấy rằng giải pháp thực sự nằm ở kiến trúc phần mềm tốt hơn và các thực hành phát triển có kỷ luật hơn, bất kể ngôn ngữ lập trình hoặc thư viện phân tích cú pháp nào được sử dụng.

Tham khảo: Unexpected security footguns in Go's parsers


Việc so sánh cách các định dạng tuần tự hóa dữ liệu khác nhau xử lý các khóa không xác định làm nổi bật tầm quan trọng của việc thiết kế để đảm bảo bảo mật trong phân tích cú pháp dữ liệu

Tin tức liên quan

‌

‌
‌

‌

‌
‌

‌