カテゴリー
データ可視化

オートコンプリート世界地図 – 「日本は」「死にかけてる」?

Autocomplete は、グーグル検索の自動補完を使って世界各国を表した、少しヤバいオンライン地図です。

グーグルの検索ボックスで”Japan is “(日本は)と入れると、「あなたはこれを検索したいんじゃないですか?」と続く一文がいくつか出てきますよね。この地図は、ここで提案された文章が、多くの人が持つその国のイメージなのだろう、と仮定し、国の特徴として地図に書き入れているのです。

検索のサジェストはグーグルの利用者がよく探すフレーズを出しているため、本当にその国を表す言葉が出るとは限りません。

[北朝鮮は最高の朝鮮] これ、自国を地上の楽園的に宣伝すること過剰な独裁国に対する皮肉として有名なネットミームだそうです。

image credit: NASA

「ロシアは冥王星より大きい(Russia is bigger than pluto)」 これもネットミームだったそうですが、2015年の探査機ホライズンの調査で偽であるとわかったそうです(= 表面積比較で、冥王星の方が少し大きい)。

「日本は死にかけている(Japan is Dying)」 検索のサジェストにここまで言われてしまうとは… 検索サジェストの内容は利用者によっても変わりますが、自分の環境でも上位にこの Dying は出てきました。日本といえば衰退の代名詞みたいに思われているんでしょうか

「デンマークは刑務所」「スコットランドは本当は国じゃない」「ミャンマーはインドにある(違います)」「ニジェールはナイジェリア(違います)」など、コンピューターが統計の結果出した、という言い訳を添えないと危険なものもいろいろ出ていますね。

via Maps Mania

カテゴリー
ネットの事件

イギリスのEU離脱決定後、日本からの「イギリスとは」検索が急増。日本人はイギリスを知らなかった?

国民投票の結果によるbrexit(EU離脱)を受けて、イギリス人が”What is the EU?”(EUって何?)と検索した、という話が、笑い話的に報道されました。

EUからの離脱が何をもたらすのかを多くの英国民が分からないまま投票に臨み、結果を受けて慌ててネットで調べた様子が明らかになった

「EU離脱とは?」「EUとは?」 英での検索順位発表:朝日新聞デジタル

英国内のGoogle検索で最も多かった検索ワードには、「What is the EU?」(EUとは何か)や「What happens if we leave the EU?」(EUを離脱したらどうなるか)などがあった。前者は、国民投票結果が正式に発表された後、英国におけるEUに関する検索ワードで第2位だった。後者は、投票終了後に250%以上増加した。

英国、離脱確定後に「EUとは何か」のグーグル検索が急増 – CNET Japan

例にあげたこれらはまだ抑制的で上品な方で、まとめサイト等では「自分たちが何に投票したか理解していない馬鹿なイギリス人」的な取り上げ方をしているところもありました。

「イギリス」を知らない日本人?

ではその同じ時期に、日本人は何を検索していたのでしょう。同じGoogleトレンドで、「イギリスとは」と検索した人の変化が以下のグラフです。

google-trends-what-is-the-uk

EU離脱の投票結果を受けて、「イギリスとは」との日本からの検索は、30倍ぐらいに増えています。こんなに「イギリス」が何のことか知らなかった人がいるとは驚きですね。「急増した」と言えば、まあそれ自体は嘘とは言えないかもしれません。

では次に、「イギリスとは」と「イギリス」の検索量を並べて見てみましょう

google-trends-what-is-the-uk-and-uk

実は、ほとんどの人は「イギリス(グラフの赤い方)」で検索していたことがわかります。「イギリスとは」が30倍に増えた、と言っても、青いグラフはそれが増えたかどうかもわからないぐらい、微々たる量だということがわかります。

ピークの6月24日でその比率は100:2、50倍。イギリスのニュースが話題の時に、イギリス関連のニュースやブログを見るために「イギリス」だけで検索する人がいることは特に不自然とは言えないでしょう。

いずれにしても、Googleトレンドでは「他の時期に比べてどれぐらい増えたのか/減ったのか」という相対的な量しか出てきません。

絶対量ならGoogle Adwordsを

では「イギリスとは?」と検索した人は実際何人ぐらいいたのでしょうか? Remy Smithさんが提案したのは、GoogleトレンドではなくGoogleアドワーズのキーワードプランナーを使った検証です。

こちらはAdwordsの利用者である必要がありますし、6月のデータはまだ出てこないので一工夫必要です。

「イギリスとは」「イギリス」で先月5月までの日本での検索量を調べます。

google-adwords-what-is-uk

すると、「イギリス」の検索が月間で11万回ぐらい、「イギリスとは」の検索回数は月間320回ぐらい、という結果が出てきました。

比率にして340倍は、Googleトレンドの方で出てきた50倍よりもかなり大きな値です。Google AdWordsのツールは、それを基に実際に広告を買う人のためのツールなので、どちらがより正確を期した数値を出しているかも想像できますが、仮に50倍の方だったとしても、「イギリスとは」で検索している人は多数派とは言えませんね。

そして、先月までの平常時で「イギリスとは」の検索が月間320回ぐらいなら、一日に10回。6月24日に普段の30倍の人が「イギリスとは」と検索したとすると、検索した人数は推定で300回、同一人物の複数回という可能性は無視して、まあ300人というところでしょう。

日本でグーグルを使っている人の300人が「イギリスとは」と検索した日が有ったからと言って、ニュースにするような話でもないですね。今回の国民投票のニュースで初めてイギリスという国を知った小学生あたりなら、そういう検索をするかもしれません。

面白すぎる話に注意

今回のニュースの元ネタは、他ならぬグーグル社の Google Trends 公式アカウントでした。

そのため、メディアの中には「グーグル社の発表によると」と言っているところもありましたが、一サービスのツイッター担当の一つのつぶやきでしかありません。興味深い結果ではありますが、元のつぶやきが注意深く「言っていない」ことが、広まっていくうちに付け加えられていった感じもありますね。

「EUという言葉を含んだ検索キーワードの中で2位」とは書いてありますが、それがどれぐらい多かったのかは、ツイートからは見て取れません。前述のRemy SmithさんのGoogle Adwordsのツールを使った推定では、「イギリス中でせいぜい1000人にも満たないだろう」ということでした。

イギリス人の「多くが」EUを知らなかった、みたいなニュアンスで書いているニュースを見た時に、「さて、本当にそんなことがあり得るんだろうか?」と思えるかどうかは、異国の市井の人を自分と同じような人間だろうと想像するか、自分とは何か違った人間だろうと想像するか、にも影響されるのではないかな、と思います。

参考: Stop Using Google Trends(Googleトレンドを使うな)

カテゴリー
プライバシー

Google検索結果のアドレスを貼り付けると「一回前の検索ワード」が漏れる事がある

ジェレミー・ルービンさんがブログで、グーグル検索した結果を共有した際に一つ前に調べたキーワードが共有先に漏れる場合があると伝えています

再現手順はこんな感じ。

  1. ChromeやFirefoxブラウザのアドレスバーで「最初の検索」で検索
  2. 検索結果のページの検索ボックスで「次の検索」で検索
  3. アドレスバーのURLの中に、「最初の検索」と「次の検索」の両方が入っている

検索キーワードが日本語などの場合は、URL中の表示はエンコードされてそのままでは日本語として読めない場合がありますが、これは変換して戻そうと思えば簡単にできます。

google-search-leaks-previous-keywords

アドレスバーに、「最初の検索」が出ています。

google-search-leaks-previous-keywords-enlarged

簡単に確かめたいならアルファベットや数字だけで上記の再現手順を試してもいいでしょう。URLに出てきた一番目の検索ワードをそのまま目視できます。

このアドレスをメール等にコピー&ペーストして送ってしまうと、「2番目の検索」で検索した結果を送ったつもりが、「最初の検索」という文字列もURLの中に含めて送ってしまうということです。

Internet Explorer でも、アドオンでアドレスバーの検索エンジンをGoogleにすると同じことになりますね。デフォルトのBing検索ではBingに行くので当然再現しませんが。

問題点と影響

ルービン氏の場合は、友人から送られてきた検索結果のアドレスを見てこれに気づいたようですが、その時にURLに含まれていた前の検索ワードは、その友人が文章中に書いているとても一般的な単語だったということ。その友人は、そのとても基本的な単語の意味を調べないとその文章が書けなかったのかもしれない、とルービン氏は推測し、このように関係のない検索ワードが他人に漏れてしまうのは恥ずかしい場合もあるだろう、と述べています。

簡単な単語の意味を調べてたぐらいならまだしも、検索してるのが人に知られたらもっと恥ずかしいキーワードというのもあるでしょうね。

あまりひどいものはご紹介できないのですが、これは2chから見つけたもの

google-search-kindaichi

「金田一一」を検索した同じページで、続けて「金田一二三男」を検索し、それを掲示板に貼り付けたんですね。まあこのケースでは漏れたとしても害はありません。

これまでグーグル検索結果のページのURLを掲示板等に貼り付けたり、メールで他の人に送ったりした人は、もしわかるなら送ったURLに一つ前の検索ワードが含まれていないか、含まれていたとしたらバレて困るキーワードではないか、確認したほうがいいかもしれません。といっても、確認して困っても削除・撤回できない場合も多そうですけど。

完全ではないですが、たとえばGoogle検索で “www.google.co.jp/search?q=” を含めて検索すると、検索結果を貼り付けたページが見つかりますね。site: で限定すれば自分のブログを確認したりもできます。

検索結果を共有する機会、となると、ツイッターやFacebook の過去の書き込み、チャットサービスのログ、などもあるでしょう。

ルービン氏はこの問題についてグーグル社にも伝えたそうですが、「仕様です」「修正しません」という回答を受けたそうです。自分で気をつけないといけないようですね。

via Hacker News