Con la partecipazione della più celebre coppia di Hollywood in veste di mascotte.

giovedì 23 aprile 2020

Matematica e Coronavirus - Terza puntata

In un post precedente ho esposto i risultati della regressione matematica (curve-fitting) applicata ai dati della protezione civile sull'epidemia di Covid-19, che forse oggi non terrorizza più l'Italia come poche settimane fa, ma continua a tener bloccato il nostro paese. Sono passati 20 giorni, e i dati, come avevamo paventato, hanno seguito un andamento un po' meno confortante di quello previsto dalla matematica. Possiamo aggiornare il modello e correggere il tiro? Ci proviamo in questo articolo… Ma dato che si conferma che il dato più significativo è quello dei decessi, qui si tratta di continuare ad andar su e giù lungo le curve statistiche a bordo di una bara… Non posso farne a meno: sono un matematico, e i numeri e le funzioni sono il mio pane, e anche la mia maledizione. Ma non è un gioco allegro, per cui non so se in futuro farò nuovi aggiornamenti di questo tipo.




Cosa aveva previsto la matematica?

Nell'articolo precedente, sulla base dell'andamento della stessa epidemia che si era registrato in Cina, e di quello tipico delle epidemie virali in genere, siamo partiti dall'ipotesi che la somma dei decessi dovesse seguire una curva ad esse (logistica), e quello dei nuovi decessi giorno per giorno una curva a campana (gaussiana). 
Andamento epidemia Covid-19 in Cina. A sinistra: decessi giorno per giorno. A destra: totale decessi. Giorni contati a partire dal 28 gennaio 2020 (giorno in cui la Cina ha iniziato a diffondere i dati ufficiali).

Abbiamo quindi fornito i dati della protezione civile, aggiornati al 4 aprile, a un apposito motore di calcolo disponibile online e abbiamo selezionato il tipo di curva teorica; il sistema ha calcolato per noi quale curva del tipo voluto era mediamente meno distante dai dati misurati. Se volete fare anche voi di questi calcoli, cliccate QUI: è facilissimo, ma... bisogna sapere cosa si sta facendo! Inoltre bisogna dire che per elaborare gruppi di dati un po' corposi occorre pagare un abbonamento, niente di che, ma comunque non è gratis. Ebbene la matematica in quel momento prevedeva un totale di decessi compreso tra 23000 e 27000, e come data in cui i decessi quotidiani sarebbero scesi sotto la decina, i primi di maggio. 

Cosa sta succedendo, in effetti?

Che fosse probabile che questo tipo di previsioni fossero ottimistiche ve lo avevo già detto, perché, ammesso che il modello teorico sia giusto, per prevedere un andamento futuro per mezzo di funzioni ben note in statistica, bisogna che tutte le condizioni ambientali e sociali rimangano costanti, e nell'articolo precedente ho spiegato perché ciò è improbabile. Inoltre può anche darsi che il modello adottato non sia del tutto adeguato, cioè che quest'epidemia abbia caratteristiche intrinsecamente diverse da quelle con cui l'abbiamo confrontata. In particolare in Italia, anche se la curva della somma totale dei contagi e di quella dei decessi continuano a mostrare un andamento ad esse, quelle dei nuovi casi e dei nuovi decessi quotidiani mostrano un andamento assai più lento a calare di quanto fu veloce a salire. 
Andamento epidemia Covid-19 in Italia, dati della protezione civile. A sinistra: nuovi decessi giorno per giorno. A destra: totale dei decessi. Giorni contati a partire dal 1 febbraio 2020 (data del primo decesso)


Caratteristiche peculiari, queste, che però non emergevano dalla summa dei dati ufficiali cinesi… Certo, l'Italia non è mica la Cina. Beh, in ogni caso ormai anche gli stessi cinesi cominciano a considerare quei dati quantomeno dubbi!

Perché far la conta dei morti?

E' un dato più che affidabile: il conto dei positivi, invece, dipende da quanti tamponi vengono effettuati e come. Inoltre non do molto retta a chi obietta che bisogna vedere se i morti CON Coronavirus sono morti PER coronavirus. L'osservatorio SISMG sulla mortalità, anche nell'ultimo aggiornamento evidenza un grosso scostamento dalla normalità, e proprio concentrato sul Nord Italia, come l'epidemia di Covid:


per me questo è la conferma del fatto che i morti con Coronavirus sono per lo più morti per Coronavirus: quelli che sarebbero morti comunque non produrrebbero nessuno scostamento dalla media, mentre invece guardate lì sopra a sinistra cosa c'è.

Ci sarà l'immunità di gregge?

Speriamo di sì: è bello pensare che abbiano ragione gli eminenti infettivologi inglesi che hanno calcolato che in realtà milioni di italiani siano già entrati in contatto con il virus, vivendo l'infezione in modo lieve o asintomatico, e sviluppando, si spera, un'immunità. Ma se ciò fosse vero, a mio parere, una parte di loro, forse decine o centinaia di migliaia, avrebbe dovuto avere sintomi simili all'influenza, e questo effetto avrebbe dovuto essere visibile sui grafici dell'andamento dell'influenza stagionale, che avrebbe dovuto mostrare un secondo picco, cosa che invece non è avvenuta:

Magari sbaglio, ma per ora non ci farei molto affidamento. 

Quando finirà?

In ogni caso, che cosa ci dice la matematica oggi? Se ripetiamo il procedimento con i dati aggiornati a ieri, 22 aprile, quali risultati otteniamo? 

Torniamo su MyCurveFit e carichiamo i dati aggiornati dei decessi giornalieri sul sistema, con l'obiettivo di fargli calcolare la gaussiana più vicina all'andamento registrato. Sorpresa: la prima soluzione che, autonomamente, il sistema ci propone, come miglior curve-fitting, non è affatto una gaussiana, ma una sigmoide, che prevede uno scenario da incubo in cui i morti quotidiani oscillano eternamente attorno al valor medio di 575!


Scartiamo subito questo macabro ma per fortuna non troppo realistico scherzo della matematica. Nessuno si aspetta davvero che l'attuale trend discendente, seppur lento, sia solo un'oscillazione momentanea e che i morti giornalieri ricomincino a salire, tanto più che anche il numero di ricoveri è in discesa. Si tratta comunque di un indizio del fatto che il tipico andamento gaussiano non è perfettamente rispettato. Ma noi non demordiamo e selezioniamo a mano: "gaussiana", ecco cosa otteniamo:










ovvero, in termini analitici:
Questa curva tutto sommato rassicurante prevede che non più a inizio maggio, come avevamo ipotizzato nella puntata precedente, ma poco dopo il 20 maggio, il conto quotidiano dei decessi sarà sceso sotto il 10. Sempre se i dati si decideranno una buona volta a seguire la cara, vecchia, curva gaussiana! Ma giorni fa ho sentito più di un esperto confermare l'impressione che la decrescita sia più lenta di quanto prevederebbe la famosa curva a campana. Andiamo allora a selezionare i dati successivi al picco, e facciamo il curve-fitting solo su quelli, proviamo cioè a scorporare la fase di decrescita da quella di crescita, che nel modello gaussiano, dovrebbero essere invece perfettamente simmetriche. La proposta del motore di calcolo non è così allegra:
 Si tratta di un ramo di una curva la cui espressione analitica è la seguente:
la quale ha un asintoto orizzontale intorno al valore 40:
Come dire: non ti aspettare che l'epidemia se ne vada: ci saranno comunque circa 40 morti al giorno, per sempre. Secondo questa stima, quindi, virtualmente l'epidemia non finirà mai e bisognerà conviverci, almeno fino all'arrivo dei sospirati vaccini. Beh, se dev'essere per sempre, meglio 40 morti al giorno che 575! Ma per fortuna mi sento di dire che si tratta ancora di una soluzione matematicamente corretta ma non troppo realistica: tutte le fasi epidemiche finiscono presto o tardi, e anche se i virus diventano endemici, riducono la loro mortalità. E poi l'estate dove la mettiamo? Prima o poi arriverà, e sperabilmente renderà la vita un po' più difficile al virus. Inoltre l'aspetto del grafico dei dati nella fase di decrescita ricorda quello di una retta; allora forziamo di nuovo la mano al sistema e selezioniamo "linear" ovvero cerchiamo la retta di regressione: 




Otteniamo una decrescita lineare che prevede il raggiungimento di quota 10 circa 54 giorni dopo il picco (ovvero in pratica, di nuovo intorno al 20 maggio) e l'azzeramento del fenomeno pochi giorni dopo. Magari! Io ci metterei la firma. 

Quanti morti ci saranno, in tutto?

Chiediamo di nuovo al sistema di calcolare la curva logistica più vicina ai dati misurati:




Ebbene, la curva calcolata, nell'ipotesi che sia simmetrica, ha questa espressione analitica:

che prevede un valore limite del totale dei decessi pari a circa 30000 morti. Peggiore di un 10% rispetto alla stima dell'articolo precedente.

Ma è ancora realistico richiedere che la curva sia simmetrica? La stima di cui sopra si riferisce a un fenomeno in cui di fatto i giornalieri seguono una gaussiana, ma abbiamo appena visto che non è esattamente così. Nell'ipotesi, ahimè, un po' più verosimile, dato l'aspetto dei grafici, che si tratti di una curva ad esse non simmetrica, dalla decrescita lenta, il sistema ci propone:
Il limite finale che ne risulta è parti purtroppo a... 60000 morti! Spaventoso! Speriamo che la verità stia nel mezzo, e magari un po' più vicino a 30000 che a 60000!

Ecco, l'ho fatto di nuovo: ho giocato coi numeri. Solo che questi non sono solo numeri, sono persone rimaste vittime di un'infezione incurabile. Speriamo che arrivino presto migliori cure e vaccini, e che questi calcoli siano inutili. La matematica parte da ipotesi ben precise, e non si cura né di necessità politiche e sociali, che possano cambiare le carte in tavola, né di altri imprevisti, favorevoli o sfavorevoli. Quindi incrociamo le dita, e se qualcuno di voi va (online) a giocarsi questi numeri coi bookmakers, non mi deve nulla se vince, ma non venga da me a lamentarsi se perde.




7 commenti:

  1. E' un articolo veramente interessante, Prof.
    Forse quel sigmoide, che prevede 40 vittime al giorno a tempo indeterminato, vuol dire che in Italia c'è un'alta percentuale di anziani, per cui il virus troverebbe sempre terreno fertile, così come troverebbero sempre terreno fertile i gabbiani e i piccioni. In queste curve forse manca la variabile "tempo":
    le 60.000 vittime potrebbero essere raggiunte nell'arco di venti anni, non nell'immediato. Si tratta comunque di dati astratti,
    che forse non tengono conto dell'aspetto darwinistico dei virus
    e della loro naturale evoluzione ed estinzione. Giusto ?

    RispondiElimina
  2. Forse il tempo indeterminato non deve spaventare più di tanto.
    Tutte le malattie sono a tempo indeterminato:
    oggi ci sono milioni di vittime di infarto ed ictus,
    e questi numeri non saranno mai completamente azzerati,
    ci sarà sempre qualcuno che morirà di infarto ed ictus,
    in base alle previsioni attuali.

    RispondiElimina
  3. Quello che fai è interessante e ho capito che esistono anche schersi della MATEMATICA...OK...

    RispondiElimina
  4. Quello che fai è interessante e ho capito che esistono gli schersi della MATEMATICA...OK...

    RispondiElimina
  5. Uno studio in mano al governo che è stato rivelato oggi diceva proprio fino a un massimo di 60000 morti, come hai detto tu in questo articolo. Vedere https://rep.repubblica.it/pwa/generale/2020/08/29/news/covid_governo_dossier_febbraio-265798190/?ref=RHPPTP-BH-I265483598-C12-P3-S1.8-T1

    RispondiElimina
    Risposte
    1. Non riesco a leggere tutto l'articolo perché non ho l'abbonamento, comunque gli esperti del governo ci sono arrivati a febbraio, io ad aprile!

      Elimina
  6. Loro sono esperti pagati, e ci sono arrivati prima di te, ma lo hanno detto solo adesso

    RispondiElimina