全球性服务中断
2025 年 7 月 28 日,GitHub 发生大规模服务中断,影响全球数百万依赖该平台的开发者和组织。此次事件波及 API 请求、问题跟踪和拉取请求等核心功能,暴露出全球软件开发所依赖的云端协作工具的脆弱性。中断始于协调世界时 7 月 28 日 22:40,GitHub 状态页面随即报告这些核心功能性能下降。
影响范围与用户反馈
从独立开发者到企业团队,全球用户均遭遇代码仓库访问、代码变更提交和项目管理等问题。此次中断正值关键时期——GitHub 支撑着从开源项目到科技巨头专有软件管道的各类业务。根据事件时间线,GitHub 工程团队在收到报告后立即展开调查,并于协调世界时 22:42 确认问题存在,开始排查潜在原因。
事件处理过程
初步更新显示部分服务性能下降,团队认为网络问题可能是主要原因。随着时间进入 7 月 29 日,情况持续恶化。协调世界时 23:18 的更新指出性能仍在下降,至午夜时分,缓解工作聚焦于基础设施相关问题。虽然影响显著但有限——高峰期约4% 的请求出现错误,导致间歇性故障而非完全瘫痪。这种部分中断仍引发广泛不满,社交媒体上充斥着关于部署延迟和工作流中断的讨论。
北美、欧洲和亚洲等地区的开发者在高峰时段均报告了服务降级,凸显 GitHub 作为全球技术生态系统支柱的地位。例如,使用 GitHub 持续集成与部署(CI/CD)管道的团队遭遇瓶颈,可能影响产品发布和更新进度。
问题解决与后续措施
GitHub 响应迅速,协调世界时 7 月 29 日 00:51,团队通报了正在实施的缓解措施,强调仅小部分流量受影响。解决进度随后加快:01:52 部署修复方案,监测显示所有受影响区域开始恢复。问题跟踪功能于 02:03 恢复正常,拉取请求功能于 02:05 恢复,02:06 宣布完全解决,GitHub 承诺将尽快发布详细根本原因分析。
此次事件让人想起 GitHub 过往的中断经历,提醒用户即使拥有强大基础设施,平台仍可能出现偶发故障。自 2018 年被微软收购以来,GitHub 托管着超过 1 亿个代码仓库,为谷歌和 NASA 等企业提供协作编码支持。此次持续约三个半小时的中断虽影响全球用户,但在多数时区的核心工作时间前得以解决。
专家建议与平台状态
事件后续,专家建议通过工具多样化或实施本地备份来降低此类风险。GitHub 尚未公布根本原因,但事件报告指出网络问题是关键因素。建议用户访问地区状态页面(如欧洲 eu.githubstatus.com、澳大利亚 au.githubstatus.com 和美国 us.githubstatus.com)获取本地化更新。截至 2025 年 7 月 29 日,平台未报告新问题,已恢复正常运营。
参考来源: