Incident Slogan: Gebruikers konden geen oproepen plaatsen of ontvangen
Impact: Major
Prioriteit: Hoog
Starttijd: 10 december 2025, 11:37
Eindtijd: 10 december 2025, 12:13
Op 10 december 2025, tussen 11:37 en 12:13, konden een deel van de ConnectMe-gebruikers geen oproepen plaatsen of ontvangen. Het probleem ontstond na een stroomonderbreking in een van onze datacenters, waardoor een core-netwerkrouter onverwacht opnieuw opstartte. Dit kortstondige verlies van connectiviteit veroorzaakte een ongebruikelijke toestand op een van de servers, waardoor deze niet meer correct reageerde. Het incident werd om 12:13 opgelost na handmatige interventie om de getroffen service opnieuw te starten.
Een kortstondige netwerkonderbreking, afkomstig van een core-router in het datacenter, creëerde een zeldzame fouttoestand op één server. Toen de server werd getroffen door het tijdelijke verlies van connectiviteit, kwam deze in een ongezonde toestand terecht en probeerde opnieuw op te starten. Echter, een afsluitproces dat bedoeld was voor gecontroleerde onderhoudsacties werd onterecht geactiveerd en bleef hangen. Dit verhinderde dat de server zijn normale herstelprocedure kon voltooien en hield deze in een onbruikbare toestand.
De eerste herstelpogingen richtten zich op het opnieuw opstarten van de defecte server, maar dit mislukte omdat de server werd geblokkeerd door een vastgelopen afsluitproces. Engineers hebben vervolgens verbinding gemaakt met de onderliggende serverhost en het proces dat herstel verhinderde handmatig verwijderd. Nadat dit was gedaan, heeft het platform de service automatisch opnieuw uitgerold, waardoor de oproepfunctionaliteit voor alle getroffen gebruikers werd hersteld.
De netwerkconnectiviteit was al hersteld nadat de datacenterrouter opnieuw was opgestart, dus er waren op dat moment geen verdere acties nodig aan de netwerkzijde.