カテゴリー
データ可視化

世界各国の一番多い「生まれ月」を表示した世界地図

日本の月別の出生数で一番多いのは、年度によっても違いますが7-9月だそうです、これは出産に40週間かかることと、クリスマスや年末年始近辺に子供を作る人が多いことの組み合わせなんでしょうね。

しかし、何月生まれの人が一番多いかというのは国によって違っているそうです。国連が国別・月別の出生数のデータを公開していて、最長で50年ぐらい前からのデータを入手することができます。

The Most Common Birth Months (もっとも一般的な出産月)は、Vivid Maps の手になる、各国で一番出生数が多い月はいつかで世界地図を塗り分けた地図です。

日本の色がいきなり間違ってる(5月になってるが、データを見ると5月がトップの年度はない)のですが、緯度による傾向が見て取れます。

北半球の高緯度から南極近くまで、緯度ごとに国と出生数をプロットしたヒートマップを見ると、北半球ではほとんどの国は7-9月がトップの国がほとんどだが、赤道近くの熱帯に降りていくと10-12月が増え、南半球では3-5月が多くなっています。

地図で特に興味深いのは韓国で、ここだけ他のどの国とも違い1月が最も人数が多いのですが、Reddit のコメント によるとこれは両親が子供が12月生まれになるのを忌避し、(計画的に妊娠しているのか、出産を遅らせているのか、届出を遅らせているのかまではわかりませんが)1月生まれにずらしたがるからだそうです。

なぜ1月が良いかというと、数え年がまだまだ使われているからということ。数え年だと、もしも12月31日に生まれたら翌1月1日の時点で2歳になるわけですが、これを避けるために1月生まれを望んでいるらしいです。ある研究では、同じ数え年の子が同じ学年になるため、脳や体の成長が遅れたまま学校が始まることを避けて1月にしたがるのが原因の一つではということでした。

カテゴリー
データ可視化

ギレンホール実験 – 有名人のミススペルの傾向を分析

ギレンホール実験(Gyllenhaal experiment)は、スペルが難しい有名人の一人である俳優のジェイク・ギレンホール氏の名前を冠した、面白い調査結果です。

著者のラッセル・ゴールデンバーグ氏(Russell Goldenberg)とマット・ダニエルズ氏(Matt Daniels)はまず、2011年頃にグーグルが公開した、「ブリトニー・スピアーズのグーグル検索60万回のデータ」から、人々がどのように彼女のファーストネームを間違えているかを可視化します。

7文字ですが、正しく入力できた人の割合は8割強。2割弱の人はスペルを間違っているということです。

このようなスペルが怪しい可能性のある有名人を、巨大掲示板 reddit の書き込みデータから (sp?) = 「スペル違うかも」と添えられた単語を探すことで特定するという手法が最近提案されていて、それらを参考にした「よくスペルを間違えられている有名人」の名前クイズを遊ぶことができます。

ホームラン記録で日本でも有名になったマーク・マグワイヤ氏のスペルをうろ覚えで入れてみたのがこちら。

最大8種類の「正解」および「よくある間違い」、そして、”Your Path”として、自分が入れたものも表示されます。

クイズで出てくるその他の難しいスペルの有名人としては、マシュー・「マコノヒー」、スカーレット・「ヨハンセン」
、「マコーレ」・カルキン、コリン・「キャパニック」らが挙げられています。

中には、正解率が2割を切っているものや、正しい綴りよりも多くの人が答えている間違っている綴り、なんていうものもあります。

これらのデータは、JSON形式でこちらからダウンロードすることもできます。

名前のスペルについては、間違われようが気にしない、というか実害もそれほど無いかもしれませんが、大量のデータの間違いを分析することで面白い結果が取れるというのはいろいろ他にも実験できそうですね。

カテゴリー
情報共有ツール

Aileen – 周囲のWiFiデバイスをカウントしてその場の人数を記録するツール

Aileen は、WiFi の電波から周囲にあるスマートフォンなどのデバイスを数え、記録するためのツールです。

WiFi がオンになっているデバイスのMACアドレスを使って、周囲にあるデバイスの数を記録し、時系列データなどをダッシュボードでまとめて表示します。(MACアドレスはハッシュ値のみ保存されます)

Aileen は、利用者として NGO による人道的な活動を想定しているということ。たとえば、難民キャンプでの人の出入りや活動を見守る、といった使い方です。キャンプの中にいる難民の数の変化をより正確に計ることで、サービス提供側の人員計画などを立てやすくすることができるのだとか。

先月にはコードがオープンソースで公開されており、WiFi 情報を収集して利用するというセンシティブな目的に対し、正体不明の第三者のツールに頼らずに済むのが利点だということです。

また、難民キャンプなどでは常に安定したインターネット接続が使えるとは限りません。そのような利用シーンを考え、Aileen を動かすPC自体はインターネット接続が無くても動けるようになっています。複数台を設置してデータ収集している場合は、ネットに接続した時点で情報を送信するそうです。(ハッシュ化された個々のMACアドレスを送信するのではなく、集計した結果のみを送るそうです)

今月には、ギリシアのレスボス島にある実際の難民キャンプで、2セットが試験運用を開始しているそう。

難民といえども、今は普通にスマートフォンを持っているのだろうと思います。むしろ情報収集等のために無いと困るぐらいかもしれません。デバイスを持たない人もいますが、スマートフォンの存在から人数を計るというのは、人手を掛けずにすむ効率的な方法なのかもしれないですね。

日本に今難民キャンプはありませんが、プライバシーへの配慮がされていることや、オープンソースとして動作の仕組みが公開されていることから、NGO などで他の人道的な運営に転用したりすることもできるかもしれません。