itsmatteomanf E' uno snapshot delle 11:48 di stamattina, non può essere questo il problema
Servizi Facebook Down 04/10/2021
Mi sa che, una volta trovato e risolto il problema, qualche responsabile si dovra' cercare un altro lavoro...
mark129 Probabilmente, ma la pagina è corretta... non so bene come hanno fatto a pubblicarla.
mark129 Anch'io ho pensato la stessa cosa
- Modificato
[cancellato] Per me no, il vero problema è che le infrastrutture e le architetture sono diventate talmente tanto modulari (con la moda dei microservizi poi...)
/OT
Come darti torto... io li amavo all'inizio i ms, ora li sto iniziando ad odiare, viva i monoliti.
157.240.9.35 è raggiungibile
Qualcosa sta andando, dai
fede00 E' uno snapshot delle 11:48 di stamattina, non può essere questo il problema
È un post-mortem del 23 settembre 2010...
https://www.zdnet.com/article/facebook-hit-with-outages-office-managers-everywhere-rejoice/
[cancellato]
- Modificato
mark129 vuoi un secchio di popcorn anche tu?
Magari! Booooneee
Folletto3000 Facebook si è progettato i suoi router in collaborazione con Arista (che poi li ha venduti anche a suo nome), delle piccole bestie modulari costruite attorno ai Broadcom Tomahawk... robette da 12.8Tbps di capacity in 3U mi sembra. Appena torna online il blog ve lo ritrovo.
EDIT: come non detto, già online. Quelle pagine possono dare una leggera idea sul cosa ci stia dietro alle foto dei gattini (o delle gattine...) e ai buongiornissimocaffé.
matteocontrini sorry ahah non trovavo la data sul post...
matteocontrini Ah ecco...ho pure visto male haha, scusate
mark129 Dici che dobbiamo brasare tutti i nostri "proxmox" iperconvergenti domestici e smetterla di "imitare i grandi"?
Secondo me tocca tenerseli stretti ma soprattutto tocca tenersi stretta la gente che ci lavora con continuità.
Intendo: L'illusione che portare tutto su sistemi cloud, dati in mano a gente che ruota continuamente (magari outsourcer) e senza qualcuno che tenga davvero le fila di tutto considerando questi sistemi immortali è un rischio enorme.
Capisco che in "hyperscale" non sia possibile avere una o più persone che conoscono "tutto il giro" dall'inizio alla fine ma ci deve qualcuno (magari un team di persone) che tiene le fila di tutti i servizi davvero fondamentali, che mettendosi seduto con un attimo di calma (ovviamente scalando in proporzione) sia in grado di far ripartire tutto da zero perchè sa "come funzionano le cose".
Un esempio di questo discorso a mio parere è la piattaforma Kubernetes che è una di quelle più di moda adesso: non la conosco davvero operativamente, ho potuto vederla solo un po' di recente grazie ad un corso che ci hanno fatto in azienda, ma l'idea che mi sono fatto è che renda impossibile tenere traccia di come funzionano tutti i sistemi in esercizio perchè "by design" è costruita perchè non ce ne si debba preoccupare.
Finchè non va tutto storto, ovviamente.
ErnyTech Ho notato che l'IP instagram proviene dagli USA: 157.240.229.174
BrianFurious Bisogna lasciare tempo ai DNS dopo un down così lungo
- Telco Data company
- Modificato
Instragram da segni di vita. FB anche.
WhatsApp ha ripreso a funzionare
[cancellato]
ErnyTech Più che altro se hanno applicato una configurazione errata nei router di frontiera con gli altri AS, bisogna lasciare il tempo agli ingegneri di passarseli tutti e fare rollback mettendoli di nuovo in esercizio.
Evidentemente son partiti da quelli vicini a casa, ora che il core ha ripreso un minimo di connettività verso l'esterno facile che a macchia d'olio riescano a riconfigurare anche il resto dell'infrastruttura globale.
WA inizia a girare