Category Archives: データ可視化

オートコンプリート世界地図 – 「日本は」「死にかけてる」?

Autocomplete は、グーグル検索の自動補完を使って世界各国を表した、少しヤバいオンライン地図です。

グーグルの検索ボックスで”Japan is “(日本は)と入れると、「あなたはこれを検索したいんじゃないですか?」と続く一文がいくつか出てきますよね。この地図は、ここで提案された文章が、多くの人が持つその国のイメージなのだろう、と仮定し、国の特徴として地図に書き入れているのです。

検索のサジェストはグーグルの利用者がよく探すフレーズを出しているため、本当にその国を表す言葉が出るとは限りません。

[北朝鮮は最高の朝鮮] これ、自国を地上の楽園的に宣伝すること過剰な独裁国に対する皮肉として有名なネットミームだそうです。

image credit: NASA

「ロシアは冥王星より大きい(Russia is bigger than pluto)」 これもネットミームだったそうですが、2015年の探査機ホライズンの調査で偽であるとわかったそうです(= 表面積比較で、冥王星の方が少し大きい)。

「日本は死にかけている(Japan is Dying)」 検索のサジェストにここまで言われてしまうとは… 検索サジェストの内容は利用者によっても変わりますが、自分の環境でも上位にこの Dying は出てきました。日本といえば衰退の代名詞みたいに思われているんでしょうか

「デンマークは刑務所」「スコットランドは本当は国じゃない」「ミャンマーはインドにある(違います)」「ニジェールはナイジェリア(違います)」など、コンピューターが統計の結果出した、という言い訳を添えないと危険なものもいろいろ出ていますね。

via Maps Mania

ムーアの法則と歴代のCPU・GPUの性能を比較した動画

インテルの共同創業者ゴードン・ムーア氏が1965年に提唱したムーアの法則、「18カ月で半導体の集積率は倍増していくだろう」という予言でした。

実際にこれまで開発・発売されたCPU・GPU の性能と、ムーアの法則の伸びを時系列で比較して見せてくれる動画がこちら Moore's Law graphed vs real CPUs & GPUs 1965 – 2019

Wikipedia によれば、ムーア氏の予言も「この先10年ぐらいは」という留保つきの予言だったそうです。そのあと何十年もムーアの法則を達成するCPUが出続けてきたのは業界の競争のたまものですね。

以前から「そろそろムーアの法則についていくのも限界では」という話が何度も出てきましたが、それでも追いつく技術が登場するという繰り返し、この動画を見るとわかります。

とはいっても、無限に集積度が上げられるはずもなく、ムーアの法則に置いて行かれる時は早晩やってくるのではと。

via Hacker News

手書き風グラフを描けるライブラリ xkcd.chart

英語圏でエンジニアに人気の線画コミックサイト xkcd には、グラフを使ったジョークネタも頻出します。こんな感じ。

xkcd に出てくるようなグラフは、だいたい手書き風のテイストで描かれているのですが、その手書き風グラフを再現できるグラフ描画ライブラリが xkcd.chart です。


日本語も出ますね。日本語入れると凡例の枠がはみ出てしまうので、ソースの調整が要るかもしれません。xkcd 風のフォントも同梱されていますが、日本語ではデフォルトフォントになるでしょう。

円グラフ、折れ線グラフ、棒グラフ を描くことができます。


ウィンドウズグラフの元ネタ

アメリカ銃乱射地図

Voxメディアが公開している、インタラクティブな銃乱射記録地図です。

2012年のサンディー・フック小学校乱射事件以降の銃乱射事件のデータが使われていて、新しい乱射事件が起こるたびに更新されているようです。今日の時点、2012年からのたった7年弱で、2178件の乱射事件が記録されているということ。

州別に人口比の発生頻度で塗ったもの。マウスカーソルを当てると件数が見られます。ほとんどの州で乱射事件が起こっていることがわかります。

横軸が人口100人あたりの銃の数。アメリカは一人に銃一つなんですね。縦軸は10万人あたりの銃による死亡者数。アメリカは1万人に一人以上。国別でみるとダントツに他の先進諸国を離して右上に君臨しています。日本は左下、ほぼゼロに近いところ。

他にも、乱射事件で亡くなった人数は全体からみるとわずかで、その他の殺人や自殺に銃が使われていること、2012
年から乱射事件のある日に色をつけたカレンダー、など、パッと見るだけで異常な状態がわかる資料がよく可視化され、まとめられています。

銃事件の元データは、銃暴力アーカイブ(Gun Violence Archive)というサイトのものを使っているようです。こちらのサイトでは、今年2019年に銃乱射で亡くなった被害者が既に253名とわかります。

via Maps Mania

🎬Film Map of the World – 地名に関係した映画を配置した「映画世界地図」

🎬 Map of the World は、世界のそれぞれの国について10本、最もウィキペディアで閲覧された映画を抽出し、その都市や地名の場所にプロットした地図です。

日本を拡大したのがこれ。

東京の「キル・ビル」はいいとして、「パール・ハーバー」で福岡、「(七人の侍ではなく)荒野の七人」で神戸、「もののけ姫」は埼玉、と、よくわからないプロットもあります。英語版ウィキペディアの記述の中に地名があったら、それを使っているということなのですが、英語版のもののけ姫の項目、今見ても埼玉とか書いてないんですよね。

最近閲覧数の多い項目で、日本の地名を含むもの、という条件、さらに英語版のウィキペディア、ということで、日本人から見るとよくわからない選定にも見えますけれど、英語版の世界から見ればこれが日本の映画で、その映画に縁の深い場所、ということになってしまうのでしょう。

日本の10選がこんな感じなので、他の国についても推して知るべし、という程度のいい加減さではあるかもしれません。地図の作り方は面白いけれど、データの取り方にもう一工夫必要なのではと思いました。

via Maps Mania

Remember the Fire – ビリージョエルの”We Didn’t Start the Fire”の歴史的事物をグラフ化

Remeber The Fire は、ビリー・ジョエルの1989年のヒット曲 “We Didn’t Start the Fire”(ハートにファイア) の歌詞をグラフにしたものです。

歌詞をグラフに? どういうこと? と思われるかもしれませんが、この曲はとても変わった曲で、メイン部分の歌詞はほとんどが歴史的な事件や有名人などの固有名詞の羅列なのです。時代的には、第二次世界大戦後からベルリンの壁崩壊までの冷戦時代、彼が生まれてからそれまでの世界の歴史を彩った事柄を、若干アメリカ中心ではありますが、並べて歌ったものでした。

今回のグラフは、それらの事件や人物を「ウィキペディアで検索された回数」という観点でグラフにしています。

2019年1月と2014年1月の二つを同時に表示させると、この5年間で検索回数が増えたキーワード・減ったキーワードを見つけることもできます。

それぞれの事件や人物の解説は、ハートにファイア – Wikipedia がやはりわかりやすいでしょう。

ロンドン地下鉄文学地図

Literary Tube map of London (文学ロンドン地下鉄地図)は、In the Book が公開した、ロンドン各地の小説に登場した場所を、地下鉄路線図に書き入れた文学地図です。

中央部をちょっと見ただけでも、「シャーロック・ホームズ」「101匹わんちゃん」「ドラキュラ」「ジキル・アンド・ハイド」「二都物語」「大いなる遺産」など、錚々たる有名小説が並んでいますね。さすがはロンドン。

東京でも似たような路線図を作ると面白いかもしれませんね

metro-clojure – gitリポジトリで地下鉄路線図を作るClojure製ツール

gjhenrique/metro-clojure は、鉄道路線図をgitのコミット/ブランチログで再現するためのオープンソースツールです。

路線と路線に所属する駅名を並べた json ファイルが入力となります。サンプルとしてサンパウロとニューヨークのデータがついてきてるので、それを参考にします。


[
{
"name": "銀座線",
"stations": [
"渋谷",
"表参道",
"外苑前",
"青山一丁目",
"赤坂見附",
"溜池山王",
"虎ノ門",
"新橋",
"銀座",
"京橋",

データをツールに食わせると、git コマンド群を発行するシェルスクリプトを作ってくれます。


$ boot generate-git-commands -c tokyo -f tokyo.sh

大江戸線のような循環があると、git グラフが作れないためツールはエラーで止まります。そりゃそうですね。

都庁前の循環を外して再度挑戦するも、東京のいたるところの乗換駅でエラーが… あちらとこちらで乗り換えができれば、循環だらけにもなりますね。


# 渋谷 銀座線 半蔵門線 副都心線
git checkout --orphan "銀座線"
git commit --allow-empty -m "渋谷"
git branch -f "副都心線" HEAD
git branch -f "半蔵門線" HEAD
# 代々木上原 千代田線
git checkout --orphan "千代田線"
git commit --allow-empty -m "代々木上原"
# 代々木公園 千代田線
git commit --allow-empty -m "代々木公園"
# 明治神宮前 千代田線 副都心線
git merge --strategy=ours --allow-unrelated-histories --no-ff --commit -m "明治神宮前" 副都心線
git branch -f "副都心線" HEAD
# 北参道 副都心線
git checkout "副都心線"
git commit --allow-empty -m "北参道"
# 方南町 丸ノ内線分岐線
git checkout --orphan "丸ノ内線分岐線"
git commit --allow-empty -m "方南町"
# 中野富士見町 丸ノ内線分岐線
git commit --allow-empty -m "中野富士見町"
# 中野新橋 丸ノ内線分岐線

「赤坂見附-永田町」のような別名の乗換駅の同一化を諦め、さらにエラーを起こす乗換駅を同一にしないよう入力データを修正していって、やっとなんとかエラーを出さなくした結果のスクリプトを、新しい git レポジトリに突っ込むことで、部分的には正しいところもあるぐらいの、東京の地下鉄gitグラフ(東京メトロ+都営地下鉄)を作ってみました。

git log で見るとこんな感じ

東京の路線図は循環しすぎなので、使用例としてはあまり良くないかもしれませんね。

もともとパリの路線図をGitHub 上で再現した2015年の作品があり、metro-clojure はこのような作品を簡単に作れることを目指して制作されたようです。

このツールを使えば、地下鉄の路線図以外の何か身近な有向グラフを git グラフで表現することができますね。

via From metro connections to a git graph

トランプ大統領がツイートしてる国を大きく描いた世界地図

World Mapper による、ツイッター大好き大統領ドナルド・トランプ氏のツイッターの発言に登場した国の言及回数を調べ上げて、よりたくさん語られている国を大きく描いた世界地図です。

World Mapper

これまでの彼のつぶやきの総数は42,000近く。そのうち8000個は大統領就任以降のもの。このアメリカ大統領としてのツイートと同期間のリツイートから、アメリカ合衆国以外のすべての登場国をカウントしたそうです。

一度でも登場した国は81個。

トップは21%のロシア。外国について語るとき、その5回に1回はロシアなのですね。まあこれは、大統領選挙にロシアの隠れた支援があったのではという疑惑があることから、外交の件以上に言及してるのかもしれないなとは思いますが。

仲良しの北朝鮮が12%、中国が11%と続きます。日本はイラン、シリアに次ぐ8位の3.1%(43回)。カナダ・フランス・韓国・ドイツよりちょっと多いのは最近の接待の成果でしょうか。

日本やシンガポール(15回)は元々が小さいので、実際の世界地図と比べるとかなり大きく見えますね。

地名に強く関係した有名人で描いたアメリカ地図

アメリカ合衆国人物マップ(A People Map of the US) は、Wikipedia のデータと地名を組み合わせた、アイデアもののインタラクティブ地図です。

作成手順としては、ウィキペディアの膨大なテキストから、都市名を抜き出し、全米のそれぞれの都市に絡んで言及されている人物のページを探します。人物ページの一定期間中のページビューを使って、その都市に関係した、もっとも有名な人物を抽出し、都市名に替えて表示した結果がこの地図ということ。

出身地、現住所、出演した映画の舞台、対戦したスポーツチームのホームやスタジアム、死亡した場所、などなど、いろいろな関係でウィキペディアでは有名人たちが言及されています。それらを総合すると、「この市で有名人と言えば?」というのが大量に出てくると。面白いですね。

たとえば、こちらサンフランシスコ周辺。さすが、スティーブ・ジョブズ氏の名前が付いた都市が多いです。トム・ハンクス氏やドゥエイン・ジョンソン氏(ザ・ロック)らは、出身がその市なんですね。

日本語のWikipediaで同様の地図を作ることもできそうですし、人以外の切り口でも、地名の上に別の関連を表示することで新たな視点を楽しめる地図が作れるかもしれません。

via Maps Mania