日本語では”She”/”He”に「彼女」/「彼」が対応するため、あまり気づかないところなのですが、三人称代名詞が中性の言語というのもいろいろあるのですね。
ハンガリー語
Hungarian is a gender neutral language, it has no gendered pronouns, so Google Translate automatically chooses the gender for you. Here is how everyday sexism is consistently encoded in 2021. Fuck you, Google. pic.twitter.com/EPqkEw5yEQ
— Dora Vargha (@DoraVargha) March 20, 2021
ハンガリー語では三人称の代名詞で男女の区別をしないそうです。彼女・彼の両方が”Ő”になります。
ハンガリー語で三人称の様々な文章を作りそれらを英語に翻訳すると英語の三人称単数で中性を表せないため”She”か”He”になるのですが、その決まり方がどうにも偏っているのでは、という話。
日本語をハンガリー語に翻訳して、それをもう一度日本語に戻すと、英語と同じように性別がつくことが確認できました。
マレー語(アニメーションgif)
hi i made a short film about algorithmic bias through the lens of the malay language 🙃 pic.twitter.com/PLPtfzDULY
— bani haykal (@fdbckfdfwd) February 5, 2021
エストニア語
トルコ語
Turkish is also a gender-neutral language.. Results are mostly similar to others but women is less visible… Man dominated culture shows up even on gender-neutral text translation from Turkish to English translation…🤯 pic.twitter.com/9mdBuFamL1
— Dr. Devrim Kaya (@devkaya) March 20, 2021
アルメニア語
Armenian is also Gender neutral. same general results. pic.twitter.com/xoHSOtJn4e
— Zaven 🇦🇲🇺🇸 (@ZavenH) March 20, 2021
フィリピン語
In Filipino we don't have gendered pronouns.
These translations from our gender-neutral language into English reveal a lot of bias in the world and in tech https://t.co/4zJSMmJgtV pic.twitter.com/cXpdlo0MVg
— //. (@sofimi) March 10, 2021
多数の翻訳例を学習して再現するのですから、ナイーブに作った機械翻訳が社会の持っているジェンダーバイアスを再現してしまうのは当然といえば当然ですね。ここは勝手に推論してはいけない箇所のように思います。実際、単文の翻訳では”He or She”などと両案併記で翻訳される場合もあるそう。
三人称単数のtheyという案もありそうですが、これらの言語からの翻訳がtheyになることを利用者が望むかも難しいところ。
via Bored Panda