Podrobnejši pregled poročanih številk Coronavirusa v perspektivi

Analize številk primerov glede na velikost države

Izjava o omejitvi odgovornosti: Proti Data Science je srednja publikacija, ki temelji predvsem na preučevanju podatkov o znanosti in strojnem učenju. Nismo zdravstveni delavci ali epidemiologi in mnenja tega članka ne bi smeli razlagati kot strokovni nasvet. Če želite izvedeti več o pandemiji koronavirusa, lahko kliknete tukaj.

V samo nekaj mesecih se je koronavirus (COVID-19) razširil po vsem svetu, kar je privedlo do dejanske globalne pandemije. V mnogih državah in regijah potrjeni primeri še vedno eksponentno rastejo. Po poročanih potrjenih številkah primerov dnevno me zelo skrbi, kako virus vpliva na življenje ljudi, trg in svetovno gospodarstvo. Splošno iz Pekinga na Kitajskem ostaja spomin na izbruh SARS leta 2003 svež. Vendar sem bil presenečen, ko sem ugotovil, da je toliko ljudi na Zahodu tako ravnodušno glede resnosti COVID-19: "To je samo gripa", "prizadene samo stare ljudi", "medijska propaganda", "imuniteto črede" ... Te višine širše javnosti me spremljajo ponoči.

Morda nekateri niso navdušeni nad prijavljenim številom primerov in mislijo, da je večina okuženih primerov daleč na drugem koncu sveta. Strinjam se, da so te potrjene številke primerov res abstraktne. Tu sem naredil nekaj zapletov, da sem te številke postavil v perspektive.

Caveats: model je dober le kot vir podatkov. Vse potrjene primere COVID-19 zagotavlja Univerzitetni center Johns Hopkins Center za sistemsko znanost in inženiring (JHU CSSE), ki je sestavil uradno poročane številke WHO in vlad po vsem svetu. Brez dvoma je večino držav premalo poročanje zaradi pomanjkanja diagnostičnih testov, nepreglednosti vlad in ljudi, ki zaradi nevednosti ne opravijo preizkusa.

Vsi spodnji podatki temeljijo na potrjenih primerih COVID-19 od 15. marca 2020.

Zbrani primeri na ravni regije

Najbolje prizadete države / regije po skupnem potrjenem primeru COVID-19

Veliko vizualizacij (kot je ta) prikazuje samo statistiko na ravni države. Od zaplete na ravni regije lahko ločimo različne pokrajine Kitajske in države v ZDA. Hubei, ki je bil nekoč epicenter COVID-19, skupaj s skoraj vsemi drugimi provincami na Kitajskem, se je v številu potrjenih primerov sploščil. Iran, Južna Koreja in Italija so skupaj s številnimi evropskimi državami presegli številne Guangdong, 2. najbolj prizadeto kitajsko provinco.

Opremljanje eksponentne rasti

Nato poglejmo, kako hitro se je COVID-19 razširil po regijah. Kumulativno potrjene primere sem opremil z eksponentno funkcijo, y = exp (a + bx). Tu sem uporabil navadni najmanjši kvadrat (OLS) za določitev parametrov a in b, naklon b ustreza strmini eksponentne krivulje.

V resnici skoraj nič ne sledi eksponentni rasti v nedogled. Vendar se lahko začetni izbruh nalezljive bolezni modelira z eksponentno funkcijo. Za različne regije sem v tem začetnem obdobju opremil skupno število potrjenih primerov COVID-19, opredeljeno s 50 primerov v vsaj 5 do 10 dneh. Če razvrščam vgrajena pobočja (b) od eksponentnih funkcij, sem ob zaklepanju 01/23 našel presenetljiv seznam držav s stopnjami rasti, ki so večje od Hubejev, vključno z Iranom, Finsko, Portugalsko, Italijo, Južno Korejo, Dansko, Slovenijo in Španijo od katerih mnogi zdaj doživljajo eksponentno rast (od 15. marca). Poleg tega sta se država New York in Washington v ZDA uvrstila tudi na 15. in 19. mesto med najhitreje razširjenimi regijami na svetu.

Najhitreje razširjene regije / države. Legenda kaže b v eksponentni funkciji in datumskem obdobju, ki se uporablja za prilagoditev krivulje rasti.

Na drugi strani lahko odkrijemo tudi regije in države z najpočasnejšim širjenjem COVID-19. Prvih 20 je skoraj izključno v Aziji, od katerih so številne oddaljene in manj poseljene pokrajine na Kitajskem, kot so Ningxia, Notranja Mongolija in Xinjiang. Omeniti velja, da primeri COVID-19 obstajajo v Singapurju in na Japonskem od sredine februarja, vendar se širijo precej počasneje, verjetno zaradi zgodnjega in učinkovitega izvajanja socialne distanciranja.

Počasi se širijo regije / države.

Normaliziramo na prebivalstvo

Eden od načinov za prikaz števila okuženih ljudi je normalizacija glede na velikost prebivalstva v regiji ali državi. Spodaj navajam prvih 20 regij / držav z največjim odstotkom prebivalstva, okuženih s COVID-19. San Marino, mikroglavlje, obkroženo z Italijo, je zasedlo 1. mesto po gostoti COVID-19 po številu prebivalstva. Druge države z nizkim prebivalstvom, kot je Islandija, so na vrhu seznama.

Normalizira na območje

Drug način za razumevanje števila okuženih je normalizacija glede na območje regije / države, da se ugotovi gostota primerov v smislu zemljepisa. Ponovno je San Marino na vrhu seznama zaradi majhne površine. Mnoga mesta in mestne zvezne države so tudi med vrhunskimi: Macao, Singapur in Washington DC.

Normaliziramo v bolnišnične zmogljivosti

Učinkovitejši način za prikaz števila primerov COVID-19 je količinsko opredelitev njihovega bremena za bolnišnice v regijah. To je mogoče storiti z normalizacijo glede na zmogljivost bolnišnice, ki se meri s predvidenim številom bolniških postelj.

Trenutno bolnikov, okuženih s COVID-19, je dovolj, da zasedejo 72% bolniških postelj v San Marinu, ki ima samo eno bolnišnico. Druge države z zelo velikim bremenom so Islandija, Iran, Italija in Katar, bolniki s COVID-19 pa prevzamejo 10% bolniških postelj. Upoštevajte, da je to predpostavka za najboljši primer, ko so pacienti sorazmerno razporejeni po bolnišnicah, tako da ne bodo poplavili v isti bolnišnici.

Upoštevati je treba tudi število postelj v ICU in število razpoložljivih mehanskih prezračevalcev, ki sta ključnega pomena za reševanje bolnikov s hudimi simptomi. Po podatkih Ameriškega bolnišničnega združenja leži v ICD približno 5% vseh bolniških postelj. Ob predpostavki, da bodo vsi pacienti potrebovali bivanje na oddelku za odkrivanje, postanejo ~ 10% bolniških postelj strašljive ~ 200% zmogljivosti ICU.

Posodobljeno bolniško breme na podlagi potrjenih primerov do 21. marca

S pomočjo podatkov sem lahko ocenil bolniške postelje za države v ZDA. Kot lahko vidite na ploskvi, so potrjeni primeri v San Marinu že presegli število bolniških postelj. Bolnišnična obremenitev Italije je poskočila na ~ 23%. Tri države v ZDA, New York, Washington in New Jersey so se prav tako uvrstile med najboljših 20, in sicer s 16%, 12% in 4% vseh bolnišničnih postelj, ki bi jih potencialno zasedali potrjeni primeri COVID-19, ob predpostavki, da vsi potrebujejo hospitalizacijo.

Kode:

https://github.com/wangz10/covid_19_analyses