2020年06月09日

COVID-19 地図やGISでできること。

3月末に書かれたかなり前の記事で恐縮だがこんな記事を発見した。

5 ways maps can help communities respond to COVID-19
https://statescoop.com/5-ways-maps-can-help-communities-respond-to-covid-19/

(このトップの画像は東京だよね。)

今回はこの記事の項目にそって、どんなふうにGISや地図が使われていたか、何が大切かを私なりに確認しようと思う。たぶん3年もすると私は細かいことは忘れてしまうので、備忘録的メモにしたい。今回は、「1.症例を地図にする」のサイトの例と、地図を作る際のデータソースのゲット方法についてメモする。

前述の記事は「COVID-19対応で地図ができるコミュニティ支援の5つの方法」というタイトルで以下が挙げられている。
1.症例を地図にする
2.症例の広がりを地図にする
3.病気に対して脆弱な人(が多く住む地域)を地図にする
4.キャパシティ(収容可能人数)を地図にする
5.地図をもとにコミュニケーションする

1.症例を地図にする
これは多くのサイトでやられている通り、その日、あるいはリアルタイムに近い状態で感染者についての報告数を地図にしたものだ。有名どころでは、

ジョンズ・ホプキンス大学 Coronaviurs COVID-19 (2019-nCOV) ダッシュボード 
https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

日本であれば、

ジャッグジャパン株式会社
都道府県別新型コロナウイルス感染者数マップ Coronaviurs COVID-19 Japan Case (2019-nCOV)
https://gis.jag-japan.com/covid19jp/

東洋経済ONLINE
新型コロナウイルス 国内感染の状況
https://toyokeizai.net/sp/visual/tko/covid19/

などがある。地図にすると、空間的な症例の広がりがわかりやすい。地図とともに、グラフや注目すべき数値自体も示されていてわかりやすい。これを毎日維持しているのも素晴らしい。閲覧する側からすると当たり前に見えてしまうかもしれないけどそれは結構なお仕事のはずだ。

さてここで、その地図やグラフ、数字の裏で元となる症例数のデータをどう取ってくるかがとても大切だと思うのだ。

日本であれば、厚生労働省や各都道府県発表がこの情報元になりうる。のだが、私が見ている限り今回の新型コロナウイルスの陽性者数に関する報告は、まことにデータにしにくい状態のものだった。

まず、私が見ていた厚労省の発表は報告の形式がほぼ一か月で変わってしまっていた。自分が地図を作るときにはできる限り楽にデータを作りたいので発表の形式に沿ってデータを作っていたのがあだとなり、この形式変更にずいぶんと振り回された気がする。

発表の中身は手作業感の感じられる様子で、感染者だったり感染例だったりのような表記ゆれがあったり、なぜか特定の県名の前にだけスペースが入っていたりする。いや、これぐらいなら一つ一つこちらも直すからいいんだけど、厚労省でこの報道発表の文面を作る人自身が大変だったろうなぁと思うのである。

あと、これは仕方がないのかもしれないが、保健所から市区町村や都道府県を経て厚労省に報告が挙がるっぽい(確実ではない、そう見える)ので、発表のタイミングにタイムラグがある。だから「○○県で初の患者発生」というような記事が地元の新聞社や放送局などのページで報告されていても、それが厚労省の発表に反映されるのは次の日だったりする。

地図は作った瞬間から過去を示す地図になっていくものではあるが、あまりにタイムラグがあると「症例を地図にして今の広がりを確認する」という目的に沿わなくなってしまう。

4月ごろだったかに、医療機関から保健所に出すコロナ発生届が実はFAXだったということを風のうわさに聞いた。このFAXを元に厚労省まで報告をあげていたのだとしたら大変な手間だったに違いない。今では発生届はオンライン化されたようなので、少しは報告、集計、発表にかかる手間が減ったのだろうか。そうであってほしいと、一市民として思う。

最近では、厚労省は都道府県の届出ベースではなく、都道府県が公式に発表した情報をベースに感染者数を報告しているようである。それであれば、手間は若干かかるけど都道府県のウエブページや公式情報を自分で確認する方が確実だと思う。

ここで、海外ではどうしているんだろう。先ほどあげたジョンズ・ホプキンス大学のサイトのデータソースのページを確認してみると…

COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
https://github.com/CSSEGISandData/COVID-19/blob/master/README.md

1つのデータソースだけを使っているわけではなく、複数の機関から公開されているデータを使っていることがわかる。WHO、ECDC、アメリカのCDCぐらいは聞いたことがあるけれど、知らないなぁというところもある。アメリカ国内だと、州の保健福祉部門のページも参照しているようである。

ここで私がすんごいと思ったのは、ジョンズ・ホプキンス大学のサイトも使っているECDCのデータである。ECDC(European Centre for Disease Prevention and Control)はEUの機関の一つで、欧州疾病予防管理センターと日本語訳されるらしい。

COVID-19 situation update worldwide
https://www.ecdc.europa.eu/en/geographical-distribution-2019-ncov-cases

ここからまことに処理のしやすい美しいデータがダウンロードできる。このデータソースについても説明がある。

How ECDC collects and processes COVID-19 data
https://www.ecdc.europa.eu/en/covid-19/data-collection

これによると、毎日6時から10時(CET、中央ヨーロッパ時間)にepidemiologists(疫学の専門家?)が196か国、500ほどあるデータソースを確認し、データを作っているらしい。内訳は、保健福祉を担当する省のウエブサイト(全体の43%)、公衆衛生関係機関のウエブサイト(9%)、その他国の機関のウエブサイト(6%)、WHOのウエブサイトとシチュエーションレポート(2%)、国や国際機関の公のダッシュボードやインタラクティブマップ、その他公の組織のツイッターやフェイスブックなどなど。

すごいなぁ。自分達でデータを集めて、(おそらく)その整合性を確認して、データの形にまとめ上げているんだ。私ならWHOのシチュエーションレポートを見ておけばOKでしょ、と思ってしまうが、そうではないんだなぁ。研究者の人たちだろうから、当たり前なんだろうけど、分析の出発点となるデータを大切にしているんだなぁと思う。データがいまいちだとその後の分析も信頼できなくなっていくし、その分析にかけた時間も無駄になるから。

そしてそのデータを公開してくれているというのもありがたい。このデータがあるから公開できているダッシュボードもあるんじゃないだろうか。

地図やGISに限ったことではないが最初(データ)が肝心、と今回は痛感したのでした。
タグ:COVID-19
posted by たかはし at 10:14| Comment(0) | 日記