カテゴリー
Uncategorized ネットの事件

グーグル翻訳が機械学習バイアスで中性主語に性別をつける問題

日本語では”She”/”He”に「彼女」/「彼」が対応するため、あまり気づかないところなのですが、三人称代名詞が中性の言語というのもいろいろあるのですね。

ハンガリー語

ハンガリー語では三人称の代名詞で男女の区別をしないそうです。彼女・彼の両方が”Ő”になります。

ハンガリー語で三人称の様々な文章を作りそれらを英語に翻訳すると英語の三人称単数で中性を表せないため”She”か”He”になるのですが、その決まり方がどうにも偏っているのでは、という話。

日本語をハンガリー語に翻訳して、それをもう一度日本語に戻すと、英語と同じように性別がつくことが確認できました。

マレー語(アニメーションgif)

エストニア語

トルコ語

アルメニア語

フィリピン語

多数の翻訳例を学習して再現するのですから、ナイーブに作った機械翻訳が社会の持っているジェンダーバイアスを再現してしまうのは当然といえば当然ですね。ここは勝手に推論してはいけない箇所のように思います。実際、単文の翻訳では”He or She”などと両案併記で翻訳される場合もあるそう。

三人称単数のtheyという案もありそうですが、これらの言語からの翻訳がtheyになることを利用者が望むかも難しいところ。

via Bored Panda

カテゴリー
ネットの事件

GoogleのCloud Vision API が画像内の男女の性別分類を停止

Cloud Vision API の利用者にメールで告知があったようです

2020年2月19日から、もう過ぎてますね、Vision API はラベルによる分類をした時に画像の中の人物に対して”man”/”woman”といった男女を区別したラベルを返さず、”person”を返すようになったということです。

人の性別は外見からわからないはずなのに、どちらかの性別にしてラベル付けしてしまっていたことが、Google が自ら取り決めて公開している GoogleにおけるAIの原則(Artificial Intelligence at Google: Our Principles)の第2項、「新たな偏見を生み出したり既存の偏見を強化しない」に反している、などが今回の変更の理由だということです。

見た目から性別を特定するのは偏見である、という考え方は良いと思います。Business Insiderの取材に回答したMozillaのフェローは、たいへんポジティブな変更だ、と評価しているよう。

このAPIで男女判定をしている既存のサービスやアプリは慌てているところかもしれませんね。

他社の同様のサービスはまだこのような方針になっていないため、とりあえずは別のAPIを利用するように直すのでしょうけれど。

via Business Insider