カテゴリー
ネットの事件

GoogleのCloud Vision API が画像内の男女の性別分類を停止

Cloud Vision API の利用者にメールで告知があったようです

2020年2月19日から、もう過ぎてますね、Vision API はラベルによる分類をした時に画像の中の人物に対して”man”/”woman”といった男女を区別したラベルを返さず、”person”を返すようになったということです。

人の性別は外見からわからないはずなのに、どちらかの性別にしてラベル付けしてしまっていたことが、Google が自ら取り決めて公開している GoogleにおけるAIの原則(Artificial Intelligence at Google: Our Principles)の第2項、「新たな偏見を生み出したり既存の偏見を強化しない」に反している、などが今回の変更の理由だということです。

見た目から性別を特定するのは偏見である、という考え方は良いと思います。Business Insiderの取材に回答したMozillaのフェローは、たいへんポジティブな変更だ、と評価しているよう。

このAPIで男女判定をしている既存のサービスやアプリは慌てているところかもしれませんね。

他社の同様のサービスはまだこのような方針になっていないため、とりあえずは別のAPIを利用するように直すのでしょうけれど。

via Business Insider

カテゴリー
データ可視化

オートコンプリート世界地図 – 「日本は」「死にかけてる」?

Autocomplete は、グーグル検索の自動補完を使って世界各国を表した、少しヤバいオンライン地図です。

グーグルの検索ボックスで”Japan is “(日本は)と入れると、「あなたはこれを検索したいんじゃないですか?」と続く一文がいくつか出てきますよね。この地図は、ここで提案された文章が、多くの人が持つその国のイメージなのだろう、と仮定し、国の特徴として地図に書き入れているのです。

検索のサジェストはグーグルの利用者がよく探すフレーズを出しているため、本当にその国を表す言葉が出るとは限りません。

[北朝鮮は最高の朝鮮] これ、自国を地上の楽園的に宣伝すること過剰な独裁国に対する皮肉として有名なネットミームだそうです。

image credit: NASA

「ロシアは冥王星より大きい(Russia is bigger than pluto)」 これもネットミームだったそうですが、2015年の探査機ホライズンの調査で偽であるとわかったそうです(= 表面積比較で、冥王星の方が少し大きい)。

「日本は死にかけている(Japan is Dying)」 検索のサジェストにここまで言われてしまうとは… 検索サジェストの内容は利用者によっても変わりますが、自分の環境でも上位にこの Dying は出てきました。日本といえば衰退の代名詞みたいに思われているんでしょうか

「デンマークは刑務所」「スコットランドは本当は国じゃない」「ミャンマーはインドにある(違います)」「ニジェールはナイジェリア(違います)」など、コンピューターが統計の結果出した、という言い訳を添えないと危険なものもいろいろ出ていますね。

via Maps Mania

カテゴリー
ネットの事件

ランダムなアルファベット4文字x2で、Google画像検索が謎の抽象画を返してくる

グーグル画像検索を乗っ取るサイト?

reddit/whatisthisthing(これは何?)で質問されて話題になった謎の現象がこれ。

グーグル画像検索で”jwsr ljxb”のように、アルファベットで単語になってなさそうなものを2個入れると、出てくる候補が謎の図形画像だらけになります。

どんな4文字でも出るわけではありません。まず辞書にあるような4文字はダメです。その単語に関する画像が出てきます。略語として成立してるものもだめ。子音ばかりを読めないような並びで並べると出やすいように思います。

画像のサイトを開いてみると、どの画像も c0d3.attorney というドメイン上のページにあることがわかります。その内容はというと、

謎の画像二つに、ごく短いプロジェクト紹介、そしてその後ろには長々と、デタラメにも見える読めないテキストが続いています。

難解プログラミング言語 Malbolge を使ったプロジェクト

プロジェクト紹介の内容はこちら

c0d3.attorney は Malbolge, 1998年にベン・オルムステッド氏が作成したパブリックドメインな難解言語, で書かれたプログラムを表示することに特化したプロジェクトです。言語は使うことがほぼできないように設計されています。(しかし)設計上の弱点がこれまでに発見され、使えるプログラムを書くことが可能となりました。これを共有できることは喜ばしいことです

とても短い紹介文で、これ以外には情報がありません。

ページのほとんどを占めるデタラメ風テキストが、そうすると Malbolge 言語のコードだということなのでしょう。

画像もコードも、URLに与えたパラメータに応じて変化しますが、あるページで数えてみると、約5万語、61万文字ありました。

オンラインの Malbolge実行環境(あるんだ…) に最初の一行を食わせてみましたが、エラーとなってしまいました。1行だけ入れても動かないのかもしれません。

ちなみに、サイトにサンプルとしてある Hello, World はこれ

('&%:9]!~}|z2Vxwv-,POqponl$Hjig%eB@@>}=

うん。まったくわからん。

Google は「知らん」と

TheNextWeb が Google にこの現象に関して問い合わせしてくれていますが、これは Google のイースターエッグではないし、同社は c0d3.attorney とは何の関係も無い、という回答が来たそうです。

「一般的な話」として、画像のあるページにある文字で検索したら出るよ、ともコメントにあったということで、ごくごく当たり前のつまらない結論になってしまうのですが、この自動生成っぽい Malbolge 言語のコードの中にアルファベット4文字のセットが大量にでき、その中の2組の4文字をウェブの他のサイトで2つ同時に使ってる他のサイトがほとんど無いために、検索で出てきてしまう、ということでしょうね。

今の時点でも、この謎のサイトを作ったのは誰か、などは判明していません。

純粋なプロジェクトか、意図のあるSEOスパムか?

ドメインの世界では、 .com 以下は、ランダムだろうと意味がなかろうと 4文字のドメイン名はすべて誰かに取得されていることが2013年には報告されています。打ち間違いでもなんでも、4文字.com を入れた人を待ち構えて、広告を見せたりドメインを売りつけたりという商売をしてる人たちがどこかに存在するわけです。

となると、今回のサイトもそういう「迷い込んできた人」を捕まえるために作られた可能性も消し去ることはできません。とはいえ、今のところサイトに来ても、広告があるわけでもなし。単に人が来たからといって得になることなんてあるのかなとも思います。

いろいろな文字列でGoogleから推薦される、と聞くと人によってはたいへん魅力的に感じるかもしれませんが、そのデタラメな文字で迷い込んでくる人が分量としてどれほどのものか、という話もあります。総量としては見つけてやってくる人はそれほど多くないかもしれません。

ですが、今回の件で興味を持った人は、単語になってない日本語の文字の組み合わせを大量に配置するサイトでも作れば、同様の結果を得られたりするかもしれませんね。

via reddit and TheNextWeb