[RISOLTO] Problema al Mix - 11/05/2025

Matwolf · 2025-05-11T22:16:55+00:00

Qualcuno sa cosa è successo al Mix? alle 23.52 circa ho visto diverse destinazioni raggiungibili tramite Mix andare offline.... Ed effettivamente anche dallo...

ag23900

hmorandell ho visto circolare la mail di apertura dell’incident, da allora non credo ci siano state altre comunicazioni

giusgius

ag23900 confermo, ancora nulla

hmorandell

OK se qualcuno sarebbe così gentile di mettere qui anche un aggiornamento ufficiale se lo vede arrivare dal MIX sarebbe molto gradito!

dontknowcris

al minap il traffico si sta incrementando non poco, sembra che chi può stia ridirottando lì per quanto possibile

hmorandell

ma può essere che il traffco al MIX sia completamente fermo in questo momento?

current throughput 0 Gbit/s e infatti i grafici non si aggiornano proprio?
tutto il traffico che di solito gira sul MIX è dirottato su altre vie? è possibile?

Robertos

hmorandell tutto il traffico che di solito gira sul MIX è dirottato su altre vie? è possibile?

Molto possibile. Dirottato su altri IX o transito.

Matwolf

hmorandell Le statistiche globali sembrano essere ferme alle 7.25.
Quelle su IPv6 invece sembra siano ancora aggiornate...
Non che ci sia molto di diverso da vedere....

morris2003

Ci possono essere problemi anche di autenticazione PPPoE per le consegne traffico al MIX?

hmorandell

morris2003

direi proprio di si..... se il traffico è 0 vuol dire che non va niente quello che è instradato tuttora al MIX

lucamonte

morris2003 consegne traffico al MIX?

va beh ma sono consegne in Caldera, nello stesso edificio di MIX, ma non transitano dalla LAN di peering... dovrebbero andare

Robertos

hmorandell rete aziendale, vari siti e i site2site VPN con partner nostri in Italia ma soprattutto verso AWS down.
Impatto anche su altri SAAS come Salesforce, Jira, Confluence.

Molto strano, Retelit ha vari PNI con tante aziende che hai menzionato... Dovrebbero continuare a funzionare.

hmorandell

Robertos
anche a me sembra strano, ora mi hanno informato che hanno fatto un "rerouting manuale" (non chiedermi cosa vuol dire in dettaglio) intorno le ore 09.30 e infatti io da li ho i servizi stabili. speriamo che resta così. Non capisco però che c'è bisogno di configurazioni manuali in questo caso, i BGP non vengono calcolati automaticament? bah....

Robertos

hmorandell ok hanno disattivato MIX da Retelit. In questo caso, bgp riceve e perde frequentemente le rotte da MIX

danny20091989

Buongiorno, questa è la comunicazione del 15/04
Il guasto di sta notte è identico a quello del 15/04, di seguito un riassunto di quello che è successo:

Dear Peers,
following RFO for this incident.

Around 01:00AM UTC+2 on Apr 15th we started recording some high CPU usage on vteps, this was due to traffic flooded from member port to the infrastructure which was causing control plane disruption.

Around 02:30AM UTC+2 thanks to friendly peers who we were communicating with us during the incident we discovered they were experiencing spotty connections, the prolonged high CPU usage caused mac table sync problems, after some brief investigation we decided to start forcing resync on all vteps which was completed around 03:20AM UTC+2.

At that time functionality was restored correctly but we were noticing vteps flooding a large amount of traffic to all interfaces.

After some extensive investigation we isolated a pair of multihoming devices causing the flood, restarted FRR and around 06:20AM UTC+2 the network was back to its fully operational state.

We developed a config change which will avoid the issue in the future. We're currently ending testing on the new features involved and will apply on infrastructure ASAP.

with my Best Regards,

Anche noi per ora abbiamo disattivato tutte le sessioni BGP sulla LAN di MIX

hmorandell

Robertos

infatti è quello che pensavo che avessero fatto.
ora da 20 minuti ho di nuovo flapping, mi chiedo se hanno spento il BGP al MIX perché succede? hanno problemi o sovraccarichi con gli altri peer?

qualcuno ha altre informazioni cosa sta succedendo e una MTTR?

r00t

Robertos coincidenza alle 10:21:09 un servizio monitorato che è su rete Irideos/Retelit è risultato non raggiungibile per alcuni minuti 🤔

SuperKali

hmorandell ora da 20 minuti ho di nuovo flapping

Potresti mostrare questi flapping che hai almeno per capire? e verso che rotte e se ci vuoi anche aggiungere un bel MTR 🙂

danny20091989

hmorandell

Come scritto sopra hanno problemi sulle VTEPS che causano saturazione sulle CPU

Al momento quasi tutti gli afferenti hanno disattivato le sessioni BGP, ecco perchè non sta più passando niente da MIX

Giann

Quando torno a casa mi devo scusare con il firewall e tutta la rete di casa a cui stamattina ho tirato i peggio santi e Madonne pensando fosse colpa loro😅

SuperKali

Giann Quando torno a casa mi devo scusare con il firewall e tutta la rete di casa a cui stamattina ho tirato i peggio santi e Madonne pensando fosse colpa loro😅

Io ieri sera le ho tirate al server off site da mio padre che ha iliad, essendo che è crollato il tunnel e le rotte statiche annunciate sul mio router, ero tranquillo a guardare netflix finche vedo che arrivavano alert dal sistema di monitoraggio, na serata passata a capire che stava succedendo hahahah per poi scoprire questo 🤣

hmorandell

danny20091989

quindi se non capisco male, la questione è un problema di configurazione e nemmeno un hardware failure?
Non hanno ancora pubblicato alcun tempo di ripristino?

Per il momento siamo fortunati che ora ho i collegamenti funzionanti stabili, ma non vorrei che una volta che riattivano il BGP pensando i problemi fossero risolti i casini iniziano da capo

« Pagina precedente Pagina successiva »

Informativa privacy - Informativa cookie - Termini e condizioni - Regolamento - Disclaimer - 🏳️‍🌈 🇵🇸
P.I. IT16712091004 - info@fibraclick.it

♻️ Il server di questo sito è alimentato al 100% con energia rinnovabile