カテゴリー
Uncategorized ネットの事件

グーグル翻訳が機械学習バイアスで中性主語に性別をつける問題

日本語では”She”/”He”に「彼女」/「彼」が対応するため、あまり気づかないところなのですが、三人称代名詞が中性の言語というのもいろいろあるのですね。

ハンガリー語

ハンガリー語では三人称の代名詞で男女の区別をしないそうです。彼女・彼の両方が”Ő”になります。

ハンガリー語で三人称の様々な文章を作りそれらを英語に翻訳すると英語の三人称単数で中性を表せないため”She”か”He”になるのですが、その決まり方がどうにも偏っているのでは、という話。

日本語をハンガリー語に翻訳して、それをもう一度日本語に戻すと、英語と同じように性別がつくことが確認できました。

マレー語(アニメーションgif)

エストニア語

トルコ語

アルメニア語

フィリピン語

多数の翻訳例を学習して再現するのですから、ナイーブに作った機械翻訳が社会の持っているジェンダーバイアスを再現してしまうのは当然といえば当然ですね。ここは勝手に推論してはいけない箇所のように思います。実際、単文の翻訳では”He or She”などと両案併記で翻訳される場合もあるそう。

三人称単数のtheyという案もありそうですが、これらの言語からの翻訳がtheyになることを利用者が望むかも難しいところ。

via Bored Panda

カテゴリー
fun

Google翻訳を通した変な訳詞で歌うYouTuber

YouTuber マリンダ・カスリーン・リースさんの人気ネタは、オリジナルの英語歌詞をGoogle翻訳して歌う “Google Translate Sings” シリーズ

Google翻訳で、オリジナルの歌詞を英語⇒他の言語⇒英語⇒他の言語⇒英語… と繰り返し翻訳させることで、元のとは異なる英語の歌詞ができあがります。

最初に注目されたのがディズニーアニメ「アナと雪の女王」から「ありのままで」

サビの”Let it go”(好きにすればいい)が、”Give up”(あきらめろ)になっています。まあ逆の意味というほど違うわけではないんですが、ディズニーで”Give up”を連呼する歌ってのもね。

“A kingdom of isolation, and it looks like I’m the Queen.”(孤立した王国、私はその女王のよう)が、”Discrimination law is probably the Queen.”(反差別法はおそらく女王だ)となったり。

意味が変わってしまうところもあれば、元の歌詞の意味は残しているのに表現がちっとも詩的じゃなくなっていて笑えてしまうというところも。

ミュージカル「オペラ座の怪人」のテーマ

最初の動画ではオリジナル画像をそのまま差し込んでましたが、こちらはミュージカルをちゃんと再現しようとしています。また、画面の上端にオリジナルの歌詞も載せているので、その場でどう変わったかが確認できるようになりました。

サビの「オペラ座の怪人はそこ、心の中に居る」が”Audio Combination of Opera here the ghost”(オペラ座の音声の組み合わせはここ幽霊)に。

クイーンの「ボヘミアン・ラプソディ」

元々わかりにく歌詞だけに翻訳後はおかしな箇所が多いです。

”Anyway the wind blows”(どのみち風は吹く)が”Panda blowing you say”(パンダが爆発するとあなたは言う)に。そのパンダどこから来たん?

そして”Nothing really matters”(どうでもいい)は”Nothing really ATM”に。

ご本人の説明

変になった歌詞はもちろんですが、歌唱力、変な歌を顔色も変えずに歌う点、オリジナル曲の動画再現、なども評価されているようです。日本の歌でも同じようにやると面白いかもしれないですね。

翻訳サービスが更に賢くなれば、英語の歌詞を入れて日本語に翻訳したら、自分で訳さずに公式の日本語訳の歌詞を見つけてきて出すようになるのではないかと思います。そうなってしまうとこの遊びはできなくなってしまいますね。

カテゴリー
fun

英語を話すときは感情表現を大きく!! とGoogle翻訳さんが言ってます

「お誕生日おめでとう!」をGoogle翻訳で英語にするとこうなります。

google-translation-add-more-exclamation

アメリカ人とかの身振り手振りを大仰なものに感じたりすることもあるかと思いますが、翻訳で感嘆符が増えてしまうとは。

via Japanese exclamation points are twice as strong as English exclamation points. – Imgur