Sự cố GitHub làm dấy lên sự thất vọng trong cộng đồng và cuộc tranh luận về tự lưu trữ

Nhóm Cộng đồng BigGo
Sự cố GitHub làm dấy lên sự thất vọng trong cộng đồng và cuộc tranh luận về tự lưu trữ

Người dùng GitHub đã trải qua tình trạng gián đoạn dịch vụ trên diện rộng vào ngày 9 tháng 10 năm 2025, ảnh hưởng đến nhiều tính năng cốt lõi của nền tảng bao gồm pull request, actions và webhooks. Sự cố, bắt đầu vào khoảng 14:45 UTC và kéo dài trong vài giờ, đã thúc đẩy một cuộc thảo luận đáng kể trong giới lập trình viên về độ tin cậy của nền tảng và các giải pháp thay thế. Trong khi trang trạng thái của GitHub cho thấy dấu hiệu phục hồi dần, những trải nghiệm thực tế theo thời gian thực của cộng đồng đã tiết lộ tác động cụ thể đến quy trình làm việc phát triển và châm ngòi cho những cuộc trò chuyện rộng hơn về sự phụ thuộc vào hạ tầng.

Dòng thời gian Tình trạng Dịch vụ GitHub (Ngày 9 tháng 10 năm 2025)

  • 14:45 UTC: Bắt đầu điều tra sự cố suy giảm của Webhooks
  • 15:09 UTC: Nhiều dịch vụ (API Requests, Pages, Issues) báo cáo hiệu suất bị suy giảm
  • 15:20 UTC: Git Operations và Pull Requests gặp sự cố
  • 15:25 UTC: Xác định và loại bỏ thành phần mạng bị lỗi
  • 15:43 UTC: Webhooks khôi phục hoạt động bình thường
  • 16:04 UTC: Git Operations hoạt động bình thường, nhưng Actions và Notifications vẫn bị trзадержка

Gián đoạn Dịch vụ Ảnh hưởng đến Quy trình Phát triển

Các lập trình viên báo cáo nhiều vấn đề ảnh hưởng đến công việc hàng ngày của họ, trong đó chức năng pull request có vấn đề đặc biệt nghiêm trọng. Người dùng không thể hợp nhất các thay đổi mã, với một bình luận ghi nhận rằng pull request của họ bị kẹt ở trạng thái 'Đang kiểm tra khả năng hợp nhất tự động...' Nút thắt cổ chai này trong quy trình phát triển đã làm nổi bật mức độ phụ thuộc của các nhóm phần mềm hiện đại vào các tính năng cộng tác của GitHub. Ngoài pull request, người dùng còn gặp phải tình trạng đẩy mã lên thất bại, không thể tạo pull request và các đường ống CI bị hỏng, tạo ra những sự chậm trễ dây chuyền trên các nhóm phát triển. Thời điểm xảy ra sự cố này, trùng với giờ làm việc cao điểm của nhiều nhóm, đã làm khuếch đại tác động của sự gián đoạn đến năng suất.

Các Dịch Vụ GitHub Bị Ảnh Hưởng Trong Thời Gian Gián Đoạn

  • Pull Requests (chức năng merge bị chặn)
  • Actions (các pipeline CI/CD bị lỗi)
  • Webhooks (kích hoạt bị trễ)
  • API Requests (hiệu suất suy giảm)
  • Git Operations (vấn đề với push/pull)
  • Pages (triển khai bị trễ)
  • Notifications (vấn đề về gửi thông báo)

Sự khác biệt Theo khu vực và Sự nhầm lẫn trên Trang Trạng thái

Sự cố ngừng hoạt động đã tiết lộ những biến thể địa lý thú vị về khả năng khả dụng của dịch vụ, khi một số người dùng báo cáo mất kết nối hoàn toàn trong khi những người khác chỉ gặp gián đoạn tối thiểu. Một người dùng từ Canada ghi nhận một sự cố ngừng hoạt động trước đó vào ngày 7 tháng 10 chỉ ảnh hưởng đến khu vực của họ, với bình luận: Tôi cũng đã trải qua điều đó! Ở Canada. Thật khó hiểu, không ai trong số đồng đội của tôi gặp sự cố. Sự không nhất quán về mặt địa lý này đã thúc đẩy các cuộc thảo luận về sự phân bổ hạ tầng của GitHub và liệu các bản sao khu vực có được đồng bộ hóa đúng cách hay không. Ngoài ra, người dùng phát hiện ra sự khác biệt giữa các trang trạng thái khác nhau, khi trang trạng thái GitHub Enterprise Cloud hiển thị mọi hệ thống đang hoạt động trong khi các dịch vụ GitHub.com chính đang gặp tình trạng suy giảm.

Thật thú vị — hiểu biết của tôi là Github Enterprise Cloud là một phần của cùng một cơ sở hạ tầng với Github.com, vì vậy trang trạng thái này có vẻ như không chính xác? Có lẽ có một bước bị thiếu trong runbook để cập nhật cả hai trang này cùng một lúc.

Hình ảnh mô tả một môi trường làm việc cộng tác, phản ánh các cuộc thảo luận về cơ sở hạ tầng của GitHub và tác động dịch vụ theo khu vực
Hình ảnh mô tả một môi trường làm việc cộng tác, phản ánh các cuộc thảo luận về cơ sở hạ tầng của GitHub và tác động dịch vụ theo khu vực

Cuộc Tranh luận về Tự lưu trữ Lại Nổi lên

Sự gián đoạn dịch vụ một cách tự nhiên đã dẫn đến các cuộc thảo luận về các giải pháp thay thế tự lưu trữ, khi một số thành viên cộng đồng đặt câu hỏi liệu các công ty có nên quay trở lại việc tự lưu trữ máy chủ Git của riêng họ hay không. Lập luận tập trung vào sự đánh đổi giữa quyền kiểm soát và sự tiện lợi, với một bình luận hỏi: Bao lâu nữa thì các công ty có quy mô vừa phải bắt đầu tự lưu trữ máy chủ git của họ trở lại? Tuy nhiên, các lập luận phản bác lại nhấn mạnh rằng các giải pháp tự lưu trữ đi kèm với gánh nặng bảo trì riêng và nguy cơ thời gian ngừng hoạt động tiềm tàng. Như một người dùng chỉ ra, các môi trường tự lưu trữ phải đối mặt với những thách thức về độ tin cậy tương tự: sau đó bạn cần thêm một máy chủ nữa vào gánh nặng bảo trì của nhóm hạ tầng / netops / công cụ và rồi họ tắt nó để nâng cấp và nó không khởi động lại được, vân vân.

Các Vấn đề Cơ bản Ngoài Sự cố Ngừng hoạt động Trước mắt

Ngoài sự gián đoạn dịch vụ trước mắt, người dùng nêu bật các vấn đề nền tảng dai dẳng đã và đang ảnh hưởng đến trải nghiệm của họ. Một số bình luận đề cập đến các vấn đề thông báo liên tục, bao gồm một thông báo luôn bật, nhưng trang thông báo của tôi không hiển thị thông báo nào chưa đọc. Cộng đồng đã xác định điều này có khả năng liên quan đến các kho lưu trữ riêng tư đã bị xóa hoặc làn sóng gần đây của các bot lừa đảo tiền điện tử gắn thẻ hàng loạt người dùng. Những vấn đề thứ cấp này, kết hợp với sự cố ngừng hoạt động lớn, đã góp phần vào mối lo ngại ngày càng tăng về sự ổn định và bảo trì nền tảng.

Sự cố ngừng hoạt động của GitHub vào ngày 9 tháng 10 đã đóng vai trò như một lời nhắc nhở về bản chất tập trung của cơ sở hạ tầng phát triển phần mềm hiện đại và những rủi ro đi kèm với sự phụ thuộc vào các dịch vụ đám mây. Trong khi các kỹ sư của GitHub đã thành công trong việc xác định và loại bỏ một thành phần mạng bị lỗi để bắt đầu khôi phục, sự cố đã châm ngòi cho những cuộc trò chuyện quan trọng về các chiến lược dự phòng, sự phân bổ hạ tầng khu vực và sự cân bằng giữa tiện lợi và kiểm soát trong các công cụ phát triển. Tính đến UTC+0 2025-10-09T19:16:34Z, các dịch vụ đang dần trở lại bình thường, nhưng cuộc thảo luận trong cộng đồng vẫn tiếp tục về các giải pháp dài hạn nhằm đảm bảo khả năng phục hồi cho quy trình làm việc phát triển.

Tham khảo: Sự cố với Webhooks Báo cáo Sự cố cho GitHub

Hình ảnh truyền tải các chủ đề công nghệ liên quan đến hoạt động của GitHub, nhấn mạnh sự tập trung vào cơ sở hạ tầng và độ tin cậy trong phát triển phần mềm
Hình ảnh truyền tải các chủ đề công nghệ liên quan đến hoạt động của GitHub, nhấn mạnh sự tập trung vào cơ sở hạ tầng và độ tin cậy trong phát triển phần mềm