• Off-topic
  • Disservizio email Libero e Virgilio 23/01/2023

rumors parlano di una migrazione su un nuovo storage fallita quando erano oltre il 50% (ma sono rumors e comunque, senza avere dettagli, inutili per capire l'incidente).

I problemi capitano a tutti, ma un problema che dura così tanto fa pensare a scarsa progettazione di ridondanza e disaster recovery (o di una procedura di migrazione carente sul piano del roll-back).

quello che trovo davvero fallimentare è la comunicazione e la trasparenza.

PS "il problema è dovuto ad un disservizio" pare una battuta di un comico (anche perchè di solito al massimo sono i disservizi causati dai problemi)

PPS che in 25 anni non abbiano mai avuto problemi è quantomeno discutibilie (chi gestisce mail server sa che MOLTO SPESSO negli ultimi 10 anni si è trovato ad avere migliaia di mail in coda in uscita verso libero a causa di loro server down)

  • [cancellato]

nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

nexus Benissimo, se è così potevano inventarsi qualcosa temporaneamente e ritornare operativi con le caselle "vuote", sempre meglio di niente. O con lo storage vecchio senza i dati degli ultimi giorni... Segno che il livello della gestione lascia parecchio a desiderare.
Ma d'altronde parliamo di Italiaonline...

    [cancellato] nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

    non risponde nemmeno, sono tutte accodate sugli smtp server di partenza:

    $ telnet smtp-in.libero.it 25
    Trying 213.209.1.129...
    telnet: Unable to connect to remote host: Connection refused

      • System Engineer - WeAreProject

      [cancellato] nexus Dipende dalla risposta del server destinatario. Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

      si, ma c'è un limit di tentativi e sicuramente questo limit è stato superato in questi 3 giorni di down...

      [cancellato] Ma d'altronde parliamo di Italiaonline...

      è proprio questo il centro di tutto...

        • [cancellato]

        x-point Ah a posto siamo... l'hanno tirato giù per evitare di essere sommersi di tentativi forse.

        NicoInve si, ma c'è un limit di tentativi e sicuramente questo limit è stato superato in questi 3 giorni di down...

        He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

          • System Engineer - WeAreProject

          [cancellato] He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

          di solito il retry di consegna dei principali server di posta si aggira in un massimo di 2/3 tentativi nel giro di qualche ora....

          assurdo come questa situazione continui ad andare avanti senza nessun comunicato ufficiale sensato....

          nexus da esterni possiamo fare tutte le illazioni che vogliamo

          Ok ma io sarei interessato alle illazioni di quelli che "in italiaonline non ci lavorano degli sprovveduti"... perché visto l'andazzo non si direbbe.

          [cancellato] He qui mi cogli in fallo, non saprei quanti giorni in media i server accodino i messaggi, ma direi un 5gg/una settimana potrebbe essere una buona stima. Che ci siano state perdite di messaggi e dati comunque in questo frangente è scontato. 😉

          una volta esisteva una sorta di uso comune di mandare un warning dopo 6 ore e il failed dopo 5 giorni.
          oggi quasi più nessuno manda il warning e il failed tende ad arrivare dopo 2 giorni (ma ogni smtp server configura timeout diversi, è solo una media)

            • [cancellato]

            x-point ma ogni smtp server configura timeout diversi, è solo una media

            Probabilmente dipende anche dal volume di mail che un MTA si trova a dover gestire, quello di uno studio con alle spalle 10 persone vedrà un carico e quindi una coda di mail sospese da riprovare ben diversa di un gmail di turno usato da milioni di persone ogni giorno... ci sta!

            [cancellato] Se ritorna errori 4xx permanenti il messaggio va in bounce diretto, se invece comunica errori temporanei vengono accodati e ci si riprova.

            interessante

            [cancellato] Segno che il livello della gestione lascia parecchio a desiderare.

            io sono una bestia ignorante e non posso fare ipotesi...magari è così grande il problema che anche il gestore più fido del mondo sarebbe ancora in alto mare, da esterni non possiamo saperlo...comunque al di là dei motivi e delle competenze rimane il fatto che io al primo disservizio dal mio punto di vista grave abbandono, se possibile, un servizio quindi adios mail libero

              • [cancellato]

              nexus magari è così grande il problema che anche il gestore più fido del mondo sarebbe ancora in alto mare

              Guarda, nessuno sano di mente tiene tutte le uova in un paniere solo... segno che del cloud degli ultimi 20 anni non hanno imparato niente. Sono ancora fermi al concetto di azienda di 30 anni fa dove esisteva un solo SAN centrale e tutto era al suo interno.

                Ciao, ci sono novità riguardo i tempi di risoluzione? Avevo fatto un biglietto Trenitalia sull'app e avevo inserito come mail di ricezione del biglietto la mia mail di libero, non sapendo dei problemi in corso.

                • matteoc ha risposto a questo messaggio

                  [cancellato] Sono ancora fermi al concetto di azienda di 30 anni fa dove esisteva un solo SAN centrale e tutto era al suo interno

                  da quanto ho capito hanno 9 milioni di caselle di posta centralizzate con NFS (quindi NAS, non SAN)

                    Lionardo ci sono novità riguardo i tempi di risoluzione?

                    No.

                    Lionardo Avevo fatto un biglietto Trenitalia sull'app

                    Dal sito web puoi scaricare il PDF dei biglietti acquistati, altrimenti puoi mostrare al controllore il QR dall'app o da uno screenshot (se non hai una connessione a Internet).

                    [cancellato] io non so come siano strutturati mica lavoro da loro e manco mi interessa, giudicare in terza persona è sempre sbagliato punto

                      • [cancellato]

                      x-point Peggio ancora!

                      • x-point ha risposto a questo messaggio

                        nexus giudicare in terza persona è sempre sbagliato punto

                        Basta con questa ipocrisia. Quello che è sbagliato è dire ad altri come fare il loro lavoro. Dire che un fermo del genere - viste anche le esperienze cloud da 20 anni a questa parte - è limitarsi alla fredda cronaca dei fatti.

                        • nexus ha risposto a questo messaggio

                          nexus pero' si puo' giudicare il risultato e non mi sembra proprio lusinghiero.Quantomeno sembra trasparire un deficit nel disaster recovery plan perche' i problemi chiaramente ci possono sempre essere ma i tempi di ripristino devono essere proporzionati all'importanza del servizio.Sopratutto perche' alla fine stanno avendo un danno di immagine in primis loro non da poco.

                          • Devidah ha risposto a questo messaggio

                            Tre giorni offline però e proprio troppo... Anche se hai tutto su un singolo server e singola nas e hai distrutto tutto devi riuscire a ripartire con un backup. Sempre che il backup esista a questo punto...

                            Il più grande disastro che abbiamo avuto in azienda da noi è stato un blocco di otto ore perché il tecnico che doveva sostituire la "testa" di una san guasta invece di spegnere quella fallata è riuscito a spegnere quella buona facendo un bel disastro. Ovviamente la san conteneva db vm e dati... Una volta sistemato il guasto il sistema non voleva ripartire perché aveva perso il controllo dell'integrità. Ore concitate con i super tecnici IBM per fare ripartire tutto. Non volevamo ripartire dal sito di disaster recovery perché purtroppo era impattante anche quello. Ma se si perdeva la speranza di ripartire col nas ovviamente lo avremmo fatto. Formattone, passatemi il termine, e ripartire dai backup anche se possibile non ci piaceva visto che i dati erano lì solo bloccati "logicamente"

                            Onestamente la faccenda sta diventando grottesca, al terzo giorno di down senza comunicati chiari e senza una qualche previsione di risoluzione quanto meno indicativa a livello di tempistiche…

                            Informativa privacy - Informativa cookie - Termini e condizioni - Regolamento - Disclaimer - 🏳️‍🌈
                            P.I. IT16712091004 - info@fibraclick.it

                            ♻️ Il server di questo sito è alimentato al 100% con energia rinnovabile