Autorka: Anna Ochab-Marcinek
Dane pochodzą z Twittera Ministerstwa Zdrowia. Surowe dane (CSV)
Statystyki na dziś (08.04.2020).
Ministerstwo Zdrowia podchodzi do sprawy niepoważnie i nie publikuje danych w ludzkim formacie.
Na stronie Ministerstwa Zdrowia tabela zachorowań pokazuje tylko stan na bieżący dzień i tylko w dwóch kategoriach: Liczba wykrytych przypadków i liczba zgonów.
Na Twitterze Ministerstwa Zdrowia pokazują dane w 7 kategoriach na 3 sposoby:
Dziś zautomatyzowałam ściąganie danych z Twittera. Za pomocą skryptów w Pythonie ściągam wszystkie wyżej wymienione dane.
Do odczytywania liczb z bitmap użyłam pakietów w Pythonie do rozpoznawania obrazów(!).
Nawiasem mówiąc, obrazki wrzucane przez Ministerstwo Zdrowia zachowują się tak, jakby chciały utrudnić automatyczne odczytywanie z nich liczb. Liczby występują na tle kółek i podkreśleń.
Ktoś z większym doświadczeniem pewnie poradziłby sobie z tym, używając jakichś wzorców kroju pisma. Ja użyłam jedynie prostych narzędzi. Przez to przy odczytywaniu liczb z niektórych obrazków od czasu do czasu zamiast liczby wyskakują krzaki, które trzeba korygować ręcznie.
Kod w Pythonie udostępnię wkrótce - gdy go uporządkuję i jeszcze trochę ulepszę.
Co rzuca się w oczy:
Zaznaczyłam na wykresach daty kolejnych ograniczeń wprowadzanych w Polsce.
Przez ostatni tydzień liczba hospitalizowanych waha się pomiędzy 2000 i 2500. Natomiast liczba zmarłych cały czas rośnie.
(w skali liniowej)
(w procentach) Stosunek liczby wykrytych zakażeń do liczby wykonanych testów rósł, ale teraz zatrzymał się przy ok. 5 proc.
(w procentach)
(w procentach)
(w procentach)
Rośnie coraz mocniej. A pamiętajmy, że liczba hospitalizowanych w ciągu ostatniego tygodnia właściwie nie przyrastała - wahała się pomiędzy 2000 a 2500.
Przez pierwsze 2.5 tygodnia stosunek liczby zgonów do liczby hospitalizowanych rósł słabo. To może wskazywać na typowy odstęp czasu pomiędzy hospitalizacją a ewentualną śmiercią pacjenta. Czy teraz zaczęli umierać pacjenci hospitalizowani na początku?