Disservizio email Libero e Virgilio 23/01/2023

nexus · 2023-01-23T16:49:29+00:00

poco fa vado per loggarmi sul client web della posta libero (un account secondario che comunque controllo quotidianamente) e sorpresa messaggio ovviamente...

x-point

rumors parlano di una migrazione su un nuovo storage fallita quando erano oltre il 50% (ma sono rumors e comunque, senza avere dettagli, inutili per capire l'incidente).

I problemi capitano a tutti, ma un problema che dura così tanto fa pensare a scarsa progettazione di ridondanza e disaster recovery (o di una procedura di migrazione carente sul piano del roll-back).

quello che trovo davvero fallimentare è la comunicazione e la trasparenza.

PS "il problema è dovuto ad un disservizio" pare una battuta di un comico (anche perchè di solito al massimo sono i disservizi causati dai problemi)

PPS che in 25 anni non abbiano mai avuto problemi è quantomeno discutibilie (chi gestisce mail server sa che MOLTO SPESSO negli ultimi 10 anni si è trovato ad avere migliaia di mail in coda in uscita verso libero a causa di loro server down)

[cancellato]

nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

nexus Benissimo, se è così potevano inventarsi qualcosa temporaneamente e ritornare operativi con le caselle "vuote", sempre meglio di niente. O con lo storage vecchio senza i dati degli ultimi giorni... Segno che il livello della gestione lascia parecchio a desiderare.
Ma d'altronde parliamo di Italiaonline...

x-point

[cancellato] nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

non risponde nemmeno, sono tutte accodate sugli smtp server di partenza:

$ telnet smtp-in.libero.it 25
Trying 213.209.1.129...
telnet: Unable to connect to remote host: Connection refused

NicoInve

[cancellato] nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

si, ma c'è un limit di tentativi e sicuramente questo limit è stato superato in questi 3 giorni di down...

[cancellato] Ma d'altronde parliamo di Italiaonline...

è proprio questo il centro di tutto...

nexus

[cancellato] Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

interessante

[cancellato] Segno che il livello della gestione lascia parecchio a desiderare.

io sono una bestia ignorante e non posso fare ipotesi...magari è così grande il problema che anche il gestore più fido del mondo sarebbe ancora in alto mare, da esterni non possiamo saperlo...comunque al di là dei motivi e delle competenze rimane il fatto che io al primo disservizio dal mio punto di vista grave abbandono, se possibile, un servizio quindi adios mail libero

[cancellato]

x-point Ah a posto siamo... l'hanno tirato giù per evitare di essere sommersi di tentativi forse.

NicoInve si, ma c'è un limit di tentativi e sicuramente questo limit è stato superato in questi 3 giorni di down...

He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

NicoInve

[cancellato] He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

di solito il retry di consegna dei principali server di posta si aggira in un massimo di 2/3 tentativi nel giro di qualche ora....

assurdo come questa situazione continui ad andare avanti senza nessun comunicato ufficiale sensato....

x-point

[cancellato] He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

una volta esisteva una sorta di uso comune di mandare un warning dopo 6 ore e il failed dopo 5 giorni.
oggi quasi più nessuno manda il warning e il failed tende ad arrivare dopo 2 giorni (ma ogni smtp server configura timeout diversi, è solo una media)

xblitz

nexus da esterni possiamo fare tutte le illazioni che vogliamo

Ok ma io sarei interessato alle illazioni di quelli che "in italiaonline non ci lavorano degli sprovveduti"... perché visto l'andazzo non si direbbe.

[cancellato]

x-point ma ogni smtp server configura timeout diversi, è solo una media

Probabilmente dipende anche dal volume di mail che un MTA si trova a dover gestire, quello di uno studio con alle spalle 10 persone vedrà un carico e quindi una coda di mail sospese da riprovare ben diversa di un gmail di turno usato da milioni di persone ogni giorno... ci sta!

[cancellato]

nexus magari è così grande il problema che anche il gestore più fido del mondo sarebbe ancora in alto mare

Guarda, nessuno sano di mente tiene tutte le uova in un paniere solo... segno che del cloud degli ultimi 20 anni non hanno imparato niente. Sono ancora fermi al concetto di azienda di 30 anni fa dove esisteva un solo SAN centrale e tutto era al suo interno.

x-point

[cancellato] Sono ancora fermi al concetto di azienda di 30 anni fa dove esisteva un solo SAN centrale e tutto era al suo interno

da quanto ho capito hanno 9 milioni di caselle di posta centralizzate con NFS (quindi NAS, non SAN)

nexus

[cancellato] io non so come siano strutturati mica lavoro da loro e manco mi interessa, giudicare in terza persona è sempre sbagliato punto

Lionardo

Ciao, ci sono novità riguardo i tempi di risoluzione? Avevo fatto un biglietto Trenitalia sull'app e avevo inserito come mail di ricezione del biglietto la mia mail di libero, non sapendo dei problemi in corso.

matteoc

Lionardo ci sono novità riguardo i tempi di risoluzione?

No.

Lionardo Avevo fatto un biglietto Trenitalia sull'app

Dal sito web puoi scaricare il PDF dei biglietti acquistati, altrimenti puoi mostrare al controllore il QR dall'app o da uno screenshot (se non hai una connessione a Internet).

[cancellato]

x-point Peggio ancora!

xblitz

nexus giudicare in terza persona è sempre sbagliato punto

Basta con questa ipocrisia. Quello che è sbagliato è dire ad altri come fare il loro lavoro. Dire che un fermo del genere - viste anche le esperienze cloud da 20 anni a questa parte - è limitarsi alla fredda cronaca dei fatti.

od1n0

nexus pero' si puo' giudicare il risultato e non mi sembra proprio lusinghiero.Quantomeno sembra trasparire un deficit nel disaster recovery plan perche' i problemi chiaramente ci possono sempre essere ma i tempi di ripristino devono essere proporzionati all'importanza del servizio.Sopratutto perche' alla fine stanno avendo un danno di immagine in primis loro non da poco.

x-point

[cancellato] Peggio ancora!

si, fare ridondanza di un mail server con NFS è una scelta da ponderare con attenzione... da una parte NFS è un sistema semplice e comodo (e le cose semplici tendono a rompersi meno di quelle complesse), ma dall'altra non riesci a ridondare davvero tutto. Mettere 9 milioni di caselle tutte insieme sullo stesso solo storage NFS, per quanto tu scegla il NAS migliore per affidabilità (Si, @v8star, proprio quello), beh, è un altra scelta coraggiosa... io, quando mi sono trovato in situazioni simili, non ho mai avuto tanto coraggio quanto ne hanno avuto loro ;-)

nexus

xblitz modera i toni perche non sono tuo padre, se non ti è chiaro il concetto passa pure dai moderatori
per il resto ribadisco che la storia si giudica alla fine e con tutti i dati disponibili, chi si sente ferito nel proprio italico orgoglio se ne faccia una ragione

Devidah

od1n0 i tempi di ripristino devono essere proporzionati all'importanza del servizio

I tempi di ripristino dovrebbero essere inversamente proporzionali al costo del servizio e direttamente proporzionali al danno di immagine tollerabile.

My 2 cents.

Orione

Tre giorni offline però e proprio troppo... Anche se hai tutto su un singolo server e singola nas e hai distrutto tutto devi riuscire a ripartire con un backup. Sempre che il backup esista a questo punto...

Il più grande disastro che abbiamo avuto in azienda da noi è stato un blocco di otto ore perché il tecnico che doveva sostituire la "testa" di una san guasta invece di spegnere quella fallata è riuscito a spegnere quella buona facendo un bel disastro. Ovviamente la san conteneva db vm e dati... Una volta sistemato il guasto il sistema non voleva ripartire perché aveva perso il controllo dell'integrità. Ore concitate con i super tecnici IBM per fare ripartire tutto. Non volevamo ripartire dal sito di disaster recovery perché purtroppo era impattante anche quello. Ma se si perdeva la speranza di ripartire col nas ovviamente lo avremmo fatto. Formattone, passatemi il termine, e ripartire dai backup anche se possibile non ci piaceva visto che i dati erano lì solo bloccati "logicamente"

MiloZ

Onestamente la faccenda sta diventando grottesca, al terzo giorno di down senza comunicati chiari e senza una qualche previsione di risoluzione quanto meno indicativa a livello di tempistiche…

« Pagina precedente Pagina successiva »

Informativa privacy - Informativa cookie - Termini e condizioni - Regolamento - Disclaimer - 🏳️‍🌈 🇵🇸
P.I. IT16712091004 - info@fibraclick.it

♻️ Il server di questo sito è alimentato al 100% con energia rinnovabile