GitHub3月障害報告、Copilotなど4件で性能劣化

4件の障害概要

キャッシュ障害で広範影響
Actions起動95%遅延
Copilot Agent認証障害
Teams連携通知不達

原因と対応策

キャッシュにkillswitch
Redis構成変更凍結
認証情報自動監視
詳細を読む

GitHubは4月9日、2026年3月の可用性レポートを公開しました。同社は月内に4件の障害が発生し、github.com本体やAPI、Actions、CopilotMicrosoft Teams連携など主要サービスで性能が劣化したと明らかにしました。開発者ワークフローを混乱させたと認め、長期的な構造改修と短期的な緊急対応の双方を進める方針です。

3月3日の障害ではユーザー設定キャッシュ機構への修正展開が逆に全ユーザーのキャッシュを一斉失効させ、再計算の集中でレプリケーション遅延が連鎖しました。github.comのリクエスト失敗率は約40%、APIは約43%、Copilotも約21%に達しました。同社はロールバックで復旧させ、キャッシュ機構に緊急停止スイッチと監視を追加し、専用ホストへの移設を進めるとしています。

3月5日にはActionsのワークフロー起動が最大95%が5分以内に始まらず、平均30分遅延する障害が2時間55分続きました。原因は回復力強化のために投入したRedisロードバランサーの設定ミスで、内部通信が誤ったホストへ転送されました。同社はロールバック後に該当領域の変更を凍結し、設定伝播の自動検査や監視強化に取り組むとしています。

3月19日と20日にはCopilot Coding Agentが2度連続で停止し、認証情報の問題でデータストアに接続できなくなりました。ピーク時のエラー率は100%近くに達し、新規セッションの開始も既存セッションの閲覧もできない状態となりました。資格情報のローテーションで復旧しましたが、初回の是正が不完全で再発したため、自動監視と運用改善を実装しています。

3月24日には上流依存先の障害によってMicrosoft TeamsとTeams Copilot連携が劣化し、GitHubイベント通知が平均37.4%、ピーク90.1%で失敗しました。全Teams連携インストール先の約19%が通知を受け取れず、約2時間52分にわたって影響が続きました。同社は上流復旧まで待機する形で対応し、可観測性とランブックを更新して将来の復旧時間短縮を図るとしています。

一連の報告からは、共有基盤であるキャッシュやRedis、資格情報といった内部インフラの脆さが複数サービスに同時影響する構図が浮き彫りとなりました。GitHubは長期的なアーキテクチャ改修を継続しつつ、短期の監視強化やkillswitch整備で再発防止を急ぐ方針です。AI支援を含む開発基盤の安定性は利用企業の生産性にも直結するだけに、運用改善の進捗が注目されます。