2021年05月22日

来週の更新

来週一週間の更新ですが、更新が遅れたり場合によってはお休みするかもしれません。

実家の片づけをするんですけどね、一週間で終わるんだろうか…。
posted by たかはし at 10:33| Comment(0) | 日記

2020年06月11日

COVID-19 地図やGISでできること。その2

前回の続きのお話。以下の記事の2番目の項目についてのメモです。

5 ways maps can help communities respond to COVID-19
https://statescoop.com/5-ways-maps-can-help-communities-respond-to-covid-19/

2.症例の広がりを地図にする

地図に時間の情報を持たせておいて、アニメーションで見せたり、スライダーバーを動かすと任意の時点の症例数などの地図が表示できるというような地図がこれにあたるのだと思う。

例えば、日経電子版のページ内にある「新型コロナウイルス感染 世界マップ」では、日付を選ぶとその日の感染者数などの世界地図が表示される。

新型コロナウイルス感染 世界マップ
https://vdata.nikkei.com/newsgraphics/coronavirus-world-map/

日経ビジュアルデータサイトのキャプチャ

日経電子版 日経ビジュアルデータ チャートで見る世界の感染状況 新型コロナウイルス よりキャプチャ
図をクリックすると拡大します

日付を動かすと時期によって円の大きさが変化する国とさほど変化しない国があることがわかる。感染者数でいえば2月ごろは中国でだんだんと円が大きくなっていくのだが、2月下旬から3月ぐらいになるとヨーロッパ、アフリカなどでも円が出現し大きくなっていく。4月に入るとヨーロッパ、アメリカやロシアなどで円が大きくなり感染者数が増えていったことがわかる。最近ではブラジルの円がかなり大きくなっているようだ。

(これが死者数だとまた異なる傾向で円の大きさが変化する)

このサイトは操作がシンプルでわかりやすい、配色が直観的だけどどぎつくない、ネットがプアーな環境でもさくっと地図を読み込んでくれるというのが嬉しいところだ。(地図の題材はコロナで歓迎するものではないけど、)それを表現するやり方が素敵だなぁと思う。

次に紹介するのは、NEXTSTRAINというサイトの地図だ。コロナウイルスのゲノム解析をして、その変異の状態から地点Aで見つかったコロナと地点Bで見つかったコロナは似た系統のコロナだとか、地点Aと地点Cのコロナは系統が違うというようなことがわかるらしい。それでコロナの拡散状況がわかるらしい。(らしいばっかりですいません。私はゲノムの知識ゼロです。間違っていたらごめんなさい。)

Genomic epidemiology of novel coronavirus - Global subsampling
https://nextstrain.org/ncov/global?c=country

Capture from NEXTSTRAIN site

NEXTRAINのサイトからのキャプチャ
図をクリックすると拡大します


このサイトはコロナウイルスの系統樹(というのだろうか?)が表示される。一つ一つの点をクリックすると、サンプルの国名、取得年月日、Divergence(分岐度?変異度?)などが表示される。

ここで、ページを下の方にスクロールすると、今度は地図があってサンプルが取得された国ごとに、サンプルの情報がプロットされている。デフォルトでは色合いは国ごとで大体アジアは濃い紫色、ヨーロッパは黄緑とか緑系、北米が赤系で示されている。
#円の大きさは感染者数ではなく、サンプル数であることに注意
Capture from NEXTSTRAIN site

NEXTSTRAINのサイトからのキャプチャ 地図部分
図をクリックすると拡大します

ここで、画面の左側のパネルにある「Color By」から「Clade」(系統群)を選ぶと、地図上にその国から送られてきたサンプルの系統の割合が表示される。
Capture from NEXTSTRAIN site

NEXTSTRAINのサイトからのキャプチャ Cladeの地図
図をクリックすると拡大します

日本の場合だと、19Aと19B、20Aと20Bの系統のゲノムが報告されているようだ。ここで地図の左上にある「PLAY」をクリックすると、左側パネルの「Date Range」で指定された期間の範囲で、(2週間内の)ゲノム系統群の割合の変化を確認できる。これを見ていると日本では最初は、19Aと19Bが多いが、2月下旬に入ると20Bが報告されるようになる。同じころ他の地域(例えば台湾やシンガポール、ヨーロッパ)では20Cも報告されている。その後、日本では20Aも見られるようになって、4月の下旬には20Bだけが報告されている。

4月ぐらいだと、アメリカでは20A,B,Cが優勢で、特に20Cはパッと目で7割ぐらいを占めている。
Capture from NEXTSTRAIN site

NEXTSTRAINのサイトからのキャプチャ Cladeの地図 4月16日〜30日
図をクリックすると拡大します

同じコロナと言っても注目する時期や地域によって違うものを見ているのかもしれない、ということが素人でもわかったような気がする。
#この系統の違いが、どのくらい症状に影響しているのか知らないのだが。

この地図では確認されているすべての人の新型コロナウイルスのゲノム解析結果を表しているわけではないことに注意は必要だと思う。それであっても時間と位置(国)にさらにウイルスに関する情報が足されると、新型コロナウイルスに対してまた違った見方ができるのかもしれないと思うのだ。
posted by たかはし at 12:03| Comment(0) | 日記

2020年06月09日

COVID-19 地図やGISでできること。

3月末に書かれたかなり前の記事で恐縮だがこんな記事を発見した。

5 ways maps can help communities respond to COVID-19
https://statescoop.com/5-ways-maps-can-help-communities-respond-to-covid-19/

(このトップの画像は東京だよね。)

今回はこの記事の項目にそって、どんなふうにGISや地図が使われていたか、何が大切かを私なりに確認しようと思う。たぶん3年もすると私は細かいことは忘れてしまうので、備忘録的メモにしたい。今回は、「1.症例を地図にする」のサイトの例と、地図を作る際のデータソースのゲット方法についてメモする。

前述の記事は「COVID-19対応で地図ができるコミュニティ支援の5つの方法」というタイトルで以下が挙げられている。
1.症例を地図にする
2.症例の広がりを地図にする
3.病気に対して脆弱な人(が多く住む地域)を地図にする
4.キャパシティ(収容可能人数)を地図にする
5.地図をもとにコミュニケーションする

1.症例を地図にする
これは多くのサイトでやられている通り、その日、あるいはリアルタイムに近い状態で感染者についての報告数を地図にしたものだ。有名どころでは、

ジョンズ・ホプキンス大学 Coronaviurs COVID-19 (2019-nCOV) ダッシュボード 
https://gisanddata.maps.arcgis.com/apps/opsdashboard/index.html#/bda7594740fd40299423467b48e9ecf6

日本であれば、

ジャッグジャパン株式会社
都道府県別新型コロナウイルス感染者数マップ Coronaviurs COVID-19 Japan Case (2019-nCOV)
https://gis.jag-japan.com/covid19jp/

東洋経済ONLINE
新型コロナウイルス 国内感染の状況
https://toyokeizai.net/sp/visual/tko/covid19/

などがある。地図にすると、空間的な症例の広がりがわかりやすい。地図とともに、グラフや注目すべき数値自体も示されていてわかりやすい。これを毎日維持しているのも素晴らしい。閲覧する側からすると当たり前に見えてしまうかもしれないけどそれは結構なお仕事のはずだ。

さてここで、その地図やグラフ、数字の裏で元となる症例数のデータをどう取ってくるかがとても大切だと思うのだ。

日本であれば、厚生労働省や各都道府県発表がこの情報元になりうる。のだが、私が見ている限り今回の新型コロナウイルスの陽性者数に関する報告は、まことにデータにしにくい状態のものだった。

まず、私が見ていた厚労省の発表は報告の形式がほぼ一か月で変わってしまっていた。自分が地図を作るときにはできる限り楽にデータを作りたいので発表の形式に沿ってデータを作っていたのがあだとなり、この形式変更にずいぶんと振り回された気がする。

発表の中身は手作業感の感じられる様子で、感染者だったり感染例だったりのような表記ゆれがあったり、なぜか特定の県名の前にだけスペースが入っていたりする。いや、これぐらいなら一つ一つこちらも直すからいいんだけど、厚労省でこの報道発表の文面を作る人自身が大変だったろうなぁと思うのである。

あと、これは仕方がないのかもしれないが、保健所から市区町村や都道府県を経て厚労省に報告が挙がるっぽい(確実ではない、そう見える)ので、発表のタイミングにタイムラグがある。だから「○○県で初の患者発生」というような記事が地元の新聞社や放送局などのページで報告されていても、それが厚労省の発表に反映されるのは次の日だったりする。

地図は作った瞬間から過去を示す地図になっていくものではあるが、あまりにタイムラグがあると「症例を地図にして今の広がりを確認する」という目的に沿わなくなってしまう。

4月ごろだったかに、医療機関から保健所に出すコロナ発生届が実はFAXだったということを風のうわさに聞いた。このFAXを元に厚労省まで報告をあげていたのだとしたら大変な手間だったに違いない。今では発生届はオンライン化されたようなので、少しは報告、集計、発表にかかる手間が減ったのだろうか。そうであってほしいと、一市民として思う。

最近では、厚労省は都道府県の届出ベースではなく、都道府県が公式に発表した情報をベースに感染者数を報告しているようである。それであれば、手間は若干かかるけど都道府県のウエブページや公式情報を自分で確認する方が確実だと思う。

ここで、海外ではどうしているんだろう。先ほどあげたジョンズ・ホプキンス大学のサイトのデータソースのページを確認してみると…

COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
https://github.com/CSSEGISandData/COVID-19/blob/master/README.md

1つのデータソースだけを使っているわけではなく、複数の機関から公開されているデータを使っていることがわかる。WHO、ECDC、アメリカのCDCぐらいは聞いたことがあるけれど、知らないなぁというところもある。アメリカ国内だと、州の保健福祉部門のページも参照しているようである。

ここで私がすんごいと思ったのは、ジョンズ・ホプキンス大学のサイトも使っているECDCのデータである。ECDC(European Centre for Disease Prevention and Control)はEUの機関の一つで、欧州疾病予防管理センターと日本語訳されるらしい。

COVID-19 situation update worldwide
https://www.ecdc.europa.eu/en/geographical-distribution-2019-ncov-cases

ここからまことに処理のしやすい美しいデータがダウンロードできる。このデータソースについても説明がある。

How ECDC collects and processes COVID-19 data
https://www.ecdc.europa.eu/en/covid-19/data-collection

これによると、毎日6時から10時(CET、中央ヨーロッパ時間)にepidemiologists(疫学の専門家?)が196か国、500ほどあるデータソースを確認し、データを作っているらしい。内訳は、保健福祉を担当する省のウエブサイト(全体の43%)、公衆衛生関係機関のウエブサイト(9%)、その他国の機関のウエブサイト(6%)、WHOのウエブサイトとシチュエーションレポート(2%)、国や国際機関の公のダッシュボードやインタラクティブマップ、その他公の組織のツイッターやフェイスブックなどなど。

すごいなぁ。自分達でデータを集めて、(おそらく)その整合性を確認して、データの形にまとめ上げているんだ。私ならWHOのシチュエーションレポートを見ておけばOKでしょ、と思ってしまうが、そうではないんだなぁ。研究者の人たちだろうから、当たり前なんだろうけど、分析の出発点となるデータを大切にしているんだなぁと思う。データがいまいちだとその後の分析も信頼できなくなっていくし、その分析にかけた時間も無駄になるから。

そしてそのデータを公開してくれているというのもありがたい。このデータがあるから公開できているダッシュボードもあるんじゃないだろうか。

地図やGISに限ったことではないが最初(データ)が肝心、と今回は痛感したのでした。
タグ:COVID-19
posted by たかはし at 10:14| Comment(0) | 日記