「Google」タグアーカイブ

オートコンプリート世界地図 – 「日本は」「死にかけてる」?

Autocomplete は、グーグル検索の自動補完を使って世界各国を表した、少しヤバいオンライン地図です。

グーグルの検索ボックスで”Japan is “(日本は)と入れると、「あなたはこれを検索したいんじゃないですか?」と続く一文がいくつか出てきますよね。この地図は、ここで提案された文章が、多くの人が持つその国のイメージなのだろう、と仮定し、国の特徴として地図に書き入れているのです。

検索のサジェストはグーグルの利用者がよく探すフレーズを出しているため、本当にその国を表す言葉が出るとは限りません。

[北朝鮮は最高の朝鮮] これ、自国を地上の楽園的に宣伝すること過剰な独裁国に対する皮肉として有名なネットミームだそうです。

image credit: NASA

「ロシアは冥王星より大きい(Russia is bigger than pluto)」 これもネットミームだったそうですが、2015年の探査機ホライズンの調査で偽であるとわかったそうです(= 表面積比較で、冥王星の方が少し大きい)。

「日本は死にかけている(Japan is Dying)」 検索のサジェストにここまで言われてしまうとは… 検索サジェストの内容は利用者によっても変わりますが、自分の環境でも上位にこの Dying は出てきました。日本といえば衰退の代名詞みたいに思われているんでしょうか

「デンマークは刑務所」「スコットランドは本当は国じゃない」「ミャンマーはインドにある(違います)」「ニジェールはナイジェリア(違います)」など、コンピューターが統計の結果出した、という言い訳を添えないと危険なものもいろいろ出ていますね。

via Maps Mania

ランダムなアルファベット4文字x2で、Google画像検索が謎の抽象画を返してくる

グーグル画像検索を乗っ取るサイト?

reddit/whatisthisthing(これは何?)で質問されて話題になった謎の現象がこれ。

グーグル画像検索で”jwsr ljxb”のように、アルファベットで単語になってなさそうなものを2個入れると、出てくる候補が謎の図形画像だらけになります。

どんな4文字でも出るわけではありません。まず辞書にあるような4文字はダメです。その単語に関する画像が出てきます。略語として成立してるものもだめ。子音ばかりを読めないような並びで並べると出やすいように思います。

画像のサイトを開いてみると、どの画像も c0d3.attorney というドメイン上のページにあることがわかります。その内容はというと、

謎の画像二つに、ごく短いプロジェクト紹介、そしてその後ろには長々と、デタラメにも見える読めないテキストが続いています。

難解プログラミング言語 Malbolge を使ったプロジェクト

プロジェクト紹介の内容はこちら

c0d3.attorney は Malbolge, 1998年にベン・オルムステッド氏が作成したパブリックドメインな難解言語, で書かれたプログラムを表示することに特化したプロジェクトです。言語は使うことがほぼできないように設計されています。(しかし)設計上の弱点がこれまでに発見され、使えるプログラムを書くことが可能となりました。これを共有できることは喜ばしいことです

とても短い紹介文で、これ以外には情報がありません。

ページのほとんどを占めるデタラメ風テキストが、そうすると Malbolge 言語のコードだということなのでしょう。

画像もコードも、URLに与えたパラメータに応じて変化しますが、あるページで数えてみると、約5万語、61万文字ありました。

オンラインの Malbolge実行環境(あるんだ…) に最初の一行を食わせてみましたが、エラーとなってしまいました。1行だけ入れても動かないのかもしれません。

ちなみに、サイトにサンプルとしてある Hello, World はこれ

('&%:9]!~}|z2Vxwv-,POqponl$Hjig%eB@@>}=

うん。まったくわからん。

Google は「知らん」と

TheNextWeb が Google にこの現象に関して問い合わせしてくれていますが、これは Google のイースターエッグではないし、同社は c0d3.attorney とは何の関係も無い、という回答が来たそうです。

「一般的な話」として、画像のあるページにある文字で検索したら出るよ、ともコメントにあったということで、ごくごく当たり前のつまらない結論になってしまうのですが、この自動生成っぽい Malbolge 言語のコードの中にアルファベット4文字のセットが大量にでき、その中の2組の4文字をウェブの他のサイトで2つ同時に使ってる他のサイトがほとんど無いために、検索で出てきてしまう、ということでしょうね。

今の時点でも、この謎のサイトを作ったのは誰か、などは判明していません。

純粋なプロジェクトか、意図のあるSEOスパムか?

ドメインの世界では、 .com 以下は、ランダムだろうと意味がなかろうと 4文字のドメイン名はすべて誰かに取得されていることが2013年には報告されています。打ち間違いでもなんでも、4文字.com を入れた人を待ち構えて、広告を見せたりドメインを売りつけたりという商売をしてる人たちがどこかに存在するわけです。

となると、今回のサイトもそういう「迷い込んできた人」を捕まえるために作られた可能性も消し去ることはできません。とはいえ、今のところサイトに来ても、広告があるわけでもなし。単に人が来たからといって得になることなんてあるのかなとも思います。

いろいろな文字列でGoogleから推薦される、と聞くと人によってはたいへん魅力的に感じるかもしれませんが、そのデタラメな文字で迷い込んでくる人が分量としてどれほどのものか、という話もあります。総量としては見つけてやってくる人はそれほど多くないかもしれません。

ですが、今回の件で興味を持った人は、単語になってない日本語の文字の組み合わせを大量に配置するサイトでも作れば、同様の結果を得られたりするかもしれませんね。

via reddit and TheNextWeb

[動画] 現在の人気ネット企業が、もし1980年前後に存在したら

レディット, インスタグラム, グーグル, アマゾン, サウンドクラウド, ユーチューブ, ツイッター, フェイスブックらのネットの人気企業が1970-1990年代にもし存在していたとしたら、こんな企業ロゴを作っていたのでは、という動画です。

作者は、このようなレトロ風デザインを専門に請け負うデザイナーFuture Punk氏。

80年代から持ってきたような作品群ですが、現在作成されているものです。当時はいろんなところでこういうロゴを見たものですが、今の道具でこれを作ろうとすると、却って再現が難しいかもしれませんね。

動画はいい感じににじんだり、ノイズがのったりしています。音楽のほうも、当時のテレビ番組のオープニングにありそうな曲になっています。

via Geekologie

書籍「エラーメッセージでググれ」「Stack Overflowからコピペ」

いつもの動物の写真の表紙なので、本当にオライリーが出してるのかと思いそうになりますが、ウェブに流れているパロディ表紙です。

“Googling the Error Message”(エラーメッセージをグーグル検索する)

出版社のところが “O RLY?”(Oh Really? 本当に?)となっています。

このツイートに対して、「こっちも忘れるなよ」と出されてるのがこちら

“Copying and Pasting from Stack Overflow”(スタック・オーバーフローからコピー&ペースト)

こちらの表紙は”O’Reilly”と書いてあってちょっとやりすぎ感がありますね。

エラーメッセージを検索するのはトラブルシューティングの基本中の基本だと思いますし、いろいろ調べてわからなかったら質問サイトで同じ問題に捕まっている人やそれへの回答を見つけるもの有用なのは間違いないので、パロディですが良いアドバイスですよね。

と思ったら、後者については表紙に触発されてタリク・アリさん(Tariq Ali, GitHub@tra38)が本文を書いちゃってます

そんなに長い電子書籍ではないですが、Stack Overflow などの質問サイトで回答されているコードを利用したい時のライセンスについて、著作権保護の対象外となる「コード片(snippets)」とCC-BY-SA 3.0で保護される「もっと大きなコード」について、この二つの間の境界は曖昧であることや、それぞれを製品等に組み込むとした時にどのようなライセンス上の問題が起こりうるか、安全側に倒したい際の手段(クリーンルーム手法)、などまでを解説しています。

Stack Overflow 上のコードが著作物とされるだけ長い場合でも、CC-BY-SA 3.0 から CC-BY-SA 4.0 への自動アップグレード経由で GPL 3.0 や Aertistic license として扱える、と書いてあり、そんなことになってたのか、と勉強になりました。

他にも、「オリジナルコードの作者への言及を消していい、あるいは消した方がいいのはどれぐらいコードを自分で書き変えた時か」とか「Stack Overflow に書いてあるコードをただ適当にコピーすることの危険性。複数の回答がある中で間違いや質の低いコードをいかに見分けるか」といった実践的なアドバイスがまとめられています。

GoogleのChromebook宣伝動画、YouTube にスパムとしてはねられる

ツイッターにおけるヘイトスピーチ投稿の規制や、プログラムによる自動的なスパム判定がニュースとなっていますね。

そんな中、同じくスパム投稿や違法コピー投稿がなかなかなくならない YouTube で、有名企業によるプロモーション動画が誤判定でスパム扱いされた、と TheNextWeb が伝えています

今回、スパム判定されてしまったのは、新しい Chromebook の宣伝動画(おそらく Pixelbook )、作ったのは Google 社です。YouTube を運営している会社ですね。自社サービスに自社動画がブロックされてしまったと。

スパム判定された状態の動画はすぐに撤回されてしまったようですが、消される前に Android 上の YouTube アプリで撮影された証拠動画というのがこちら

この動画はユーチューブのスパム・不正・詐欺行為に関するポリシーに違反したため削除されました

“This video has been removed for violating YouTube’s policy on spam, deceptive practices, and scams,”

ユーザー投稿がスパムや不正なものでないか、プログラムで機械的に判定するのがいかに困難か、という証拠のようにも思えます。

僕としては、「自社のアカウントは絶対スパム判定されないよう、特別扱いでホワイトリストに入っている」といった管理をしてないのはむしろ好感を持ちましたし、疑陽性で止められる経験によって機械学習等によるより正確なスパム判定をできるようにしなきゃ、と中の人も思ってるのではないかと思いました。

via TheNextWeb

Google Homeがディズニーの新作「美女と野獣」の頼まれない広告を流す

家庭用の音声アシスタントとしてAmazonエコーと競争中のGoogleホームですが、ユーザーが望んでもいない新作映画の宣伝を勝手に始められた、という話がネットに流れて問題となっているようです。

あるユーザーが撮影した動画がツイッターに上がっています。

「OKグーグル、今日の僕の予定は?」と語りかけると、時刻、天気予報、職場までの予想通勤時間、を話した後に、「ところで、ディズニー映画『美女と野獣』は本日公開です。今回は(父親の)モーリスではなくベルが発明家です…」から、ベルについてもっと知りたければ質問して、と続けています。

ユーザーがディズニーや美女と野獣について質問した結果話しているのではなく、今日の予定の後に勝手に宣伝を始めているように見えます。reddit では、これに不快感を覚えた人たちが議論しています。「Amazon Echo とどっちを買うべきかはっきりしてよかった」などというコメントもあります。

ITブログVentureBeatがGoogle社に問い合わせたところ、「これは広告ではありません。我々のパートナーをゲストとして迎え、彼らのお話をシェアしてもらっただけです」という返事が来たのだと。

VentureBeat によれば、現地の午後3時過ぎには今日の予定を聞いても美女と野獣については話されなくなったということ。また、消息筋の話ではグーグルとディズニーの間に今回お金のやりとりは無かったようだとの話も。

「お金が動いてないから広告ではない」とは思いませんが、テキスト検索の横に広告を出して儲けるのが本業の会社ですから、音声アシスタントの会話に広告が混ざってくるのもある意味既定路線なのかもしれません。近未来の家の中は多少なりともこんな感じになっていくのでしょう。

ウェブサイトの横に出てくる広告は無視できても、音声で喋られると無視は難しいし、購買行動に何らかの影響は与えられるかもしれないですね。

Google曰く 「Google.comはちょっと危ないよ」

Hacker News に出てた小ネタ

危ないスクリプトなどを実行させようとするような危険なウェブサイトを見つけたり警告してくれたりするセーフブラウジングの機能で、自分自身のドメイン google.com に「一部のページに不正なコンテンツが含まれています」という警告が出てしまっているようです

google-transparency-report-on-google-com

「このウェブサイトの一部のページが、訪問者のパソコンに不正なソフトウェアをインストールしています。」とか「このウェブサイトの一部のページが、訪問者のパソコンに不正なソフトウェアをインストールする 危険なウェブサイトに訪問者をリダイレクトしています。」とか。

google-transparency-report-on-google-com-enlarged

多数のサービスで膨大なページを提供していますし、ユーザーが作ったコンテンツを公開するようなサービスも多いですから、google.com のどこかでは、怪しいファイルが混入することもあるかもしれないですよね。

それをきちんと見つけて警告しているとしたら、むしろうまく仕組みが動いているのかも。すぐに対策が取られて除去されるのではないでしょうか。

google.co.jpをチェックすると「危険ではない」とでますので、とりあえず .co.jp の方を使えば安全? (違うって)

大学中退を卒業と偽ったためにグーグルに解雇された人の話

Hacker Newsに出ていた話。

Throwaway account Hi HN. I need some help to deal with my mental situation (捨てアカウントです。メンタル的な状況にどう対処するべきかで助けてほしい) という題で、とある第三世界の国から永住権クジに当たってアメリカに来て、その後グーグルで職を得たエンジニアが、夢の仕事だったグーグル社を去る羽目になった理由を告白しています。

自国の大学でソフトウェア工学を学んでいたこの男性は、5年前の卒業間近に、アメリカのくじ引き永住権に当選します。ビザの取得費と片道の航空券だけをなんとか贖えた男性は、妻と一緒にアメリカに来るのですが、ビザの期限との兼ね合いで大学を卒業しないまま国を離れてしまいました。

そういう事情から学士号を取らずにやってきた男性ですが、プログラマとして職を見つけ、5年間のうちに転職でより良い会社への移籍を繰り返します。そしてたどり着いたのがグーグル社。

2回目の面接でついに同社の職を得た男性、同社からの身元確認の調査票に「誤って」卒業(graduated)のところをチェックしてしまいます。学士号みたいなものの有無を訊かれてるのだと思ったけど、高校を出てから4年間、コンピューターの学部に通ったのだし、卒業証書はないけど最後の学期までいたのだから、と。

数週間後、この男性はグーグル社の人事からメールで連絡をうけます。「あなたが持ってると主張している学位の存在を確認できませんでした」、と。

それへの彼の返答はこうです。「学位は実際には持ってないんだ。でも学校に行って、全部のクラスを履修した。ビザの状況で書類の手続きをしなかっただけなんだ。」

この返答で、彼の解雇が決定的となりました。人事の言うには、「この振る舞いはごまかしであり、彼らを馬鹿にしたのだ」と。彼自身は、「どこかの知らない大学を出たかどうかなんて誰が気にするんだ」ぐらいに考えていました。

彼の上司は彼に満足しており、要求されていた以上の仕事がこなせる、と主張し、彼をグーグルに勧誘したリクルーターも保証してくれたそうですが、人事には通用せず、犯罪を犯したかのように扱われた、と。

リクルーターの言うには、この結果は同社に記録され、もう二度とグーグルに採用されることはないだろう、と。

解雇されてからは精神的にまいってしまい、眠れずに解雇を伝えられたミーティングのことを思い出したり、考えてもしょうがないのに過去の判断を公開するばかりだと。

この匿名の投稿に対する反応にも厳しいものがあり、結果かれは元の投稿をすぐに削除してしまいました。

一番支持されているコメントは、この男性がまだ「技術力が十分だった」「仕事の能力に問題はなかった」と書いていることを問題視するものです。「アメリカの社会では、Integrity(誠実さ、一貫性)が非常に重要なんだ」と。「アメリカ人の視点では、もしそこで嘘をつくなら、他の状況でも嘘をついたり倫理的でないことをするだろうと見る。そして、グーグルのような多数の秘密情報を持ちデータアクセスへの特権を信頼する社員に与える企業にとって、それは大きなリスクになる」と。

と同時にこのコメンテーターは、男性の文化的背景ではそのことはそこまで重大な問題ではなかったんだろう、ということには理解を示しています。

実際に学位のないGooglerもいるわけだし、学位と無関係に採用されたと思ったなら、チェックをつけなければそれで何の問題も無かった可能性もあるでしょう。また、クジで永住権を得たために、移住自体には何の学位チェックも不要だったことも背景にあるかもしれません。労働者ビザならそれを取る段階で学位やその種類が厳しくチェックされていたでしょうから、移住自体が無理だったかもしれないけどグーグルに解雇されることもなかった。学位無しでもビザが取れていたとしても、学位をごまかすことの重大さを学んでいたかもしれず、結果嘘は付かなかったかもしれません。

4chanの創設者mootがGoogleへ入社。コミュニティ運営のプロとしてか

さきほど、Tumblr のアカウントで、英語圏の巨大匿名掲示板4chanを創った moot ことクリストファー・プールさんがグーグルにジョインしたと発表しました。

“My Next Chapter”(僕の次の章)というタイトルの短い投稿は以下のとおり。

Today I’m excited to announce that I’ve joined Google.

本日、グーグルに入社したことを発表できることに興奮しています。

When meeting with current and former Googlers, I continually find myself drawn to their intelligence, passion, and enthusiasm — as well as a universal desire to share it with others. I’m also impressed by Google’s commitment to enabling these same talented people to tackle some of the world’s most interesting and important problems.

グーグルの現社員やOBに会ったときはいつも、彼らの知性、情熱、熱意、そしてそれらを他人と共有しようとする普遍的な欲求に惹かれる自分を発見していました。また私は、これらの才能ある人々たちに世界の最も興味深く重要な難問群に取り組ませることができる同社の深い関与にも感銘を受けています。

I can’t wait to contribute my own experience from a dozen years of building online communities, and to begin the next chapter of my career at such an incredible company.

そのような驚くべき企業で次のキャリアを開始し、12年以上にもわたるオンラインコミュニティ構築という私の経験をもって貢献するのを待ちきれません。

こちらはそのTumblrを紹介する本人のツイート

[追記] Google+も担当していたグーグル社副社長のブラッドリー・ホロウィッツ氏が、歓迎のツイートを出しています。

プール氏は、昨年の9月に手塩に掛けた 4chan を、2ちゃんねる創設者のひろゆき氏に売却しています。4chan は、2ちゃんねる(2ch.net)から派生した画像掲示板 ふたばちゃんねる(2chan.net)のプール氏による英語版クローンとして始まっており、先祖サービス(の創設者)への売却でした。

一方のグーグルは、Google+ の不調などコミュニティ運営についてはFacebookなどのライバルに比べて得意とはいえない企業です。一方の4chanはユーザー数も多く影響力もありますが、匿名性などからお行儀の良いサービスでとはいえません。そのような特殊なコミュニティを見てきたプール氏がGoogleのどのサービスに関わるのか、どれぐらいの権限が与えられるのかは要注目でしょう。

[追記 2016-03-09] 中の人がGoogle+ が 4chan のようになるかって? 「悪名高いアジト(a den of infamy)」のようなものにするつもりはまったくないよと言っています。プール氏本人には4chanに跋扈するトロールのようなところは全くない、とも。

住所から、その近くのYouTube動画を検索する

YouTube の API では、動画に関連した座標情報が取得できるようですね。YouTube 本体の検索ではどうやるか見つけられなかったので、API でだけアクセスできる情報なんでしょうか。

Google 自身による API 利用サンプルのデモとして、geoサーチサービスが公開されているのを知りました。座標や住所を入れると、その近くの動画を列挙してくれます。

こちらが、「東京都中央区日本橋」で検索した結果

youtube-geo-search-screenshot

これ、最初見たときはアップロードした動画の中にある情報を使ってるのかと思って驚きましたが、さすがに本人が知らないのに住所と関連づけられたりはしていないでしょう。東京の真ん中で検索してもあまり密度濃く出てこないですし。

YouTube の動画管理ページの方に、位置情報を入れるフィールドがあり、そこで明示的に座標を入れている動画が出てくるようです。

自分で「場所を出しても良い」と判断している投稿者の動画だけがあるなら、まあそんなに危険はないんでしょう。旅行先での動画とか、お店の宣伝動画とかは、むしろ積極的に位置情報を入れていくのが良さそうですね。たまに個人 YouTuber が家で撮ってるような動画も出てくるのはわかりませんが。

YouTube上で東京都中央区日本橋という言葉で検索した場合とは、明らかに異なる結果です。こちらは、住所「名」で検索したら、当然ながらタイトルに「日本橋」とか入っている動画がたくさんでてきます。

Google 自身によるサンプルのデモサイトなので、ソースコードも入手できます。ソース中でなぜか車のメーカーの名前をフィルタしたりしてるんですが、取り除かないと車名が入った動画がたくさん出てくるんでしょうか。

via Hacker News