カテゴリー
Uncategorized ネットの事件

グーグル翻訳が機械学習バイアスで中性主語に性別をつける問題

日本語では”She”/”He”に「彼女」/「彼」が対応するため、あまり気づかないところなのですが、三人称代名詞が中性の言語というのもいろいろあるのですね。

ハンガリー語

ハンガリー語では三人称の代名詞で男女の区別をしないそうです。彼女・彼の両方が”Ő”になります。

ハンガリー語で三人称の様々な文章を作りそれらを英語に翻訳すると英語の三人称単数で中性を表せないため”She”か”He”になるのですが、その決まり方がどうにも偏っているのでは、という話。

日本語をハンガリー語に翻訳して、それをもう一度日本語に戻すと、英語と同じように性別がつくことが確認できました。

マレー語(アニメーションgif)

エストニア語

トルコ語

アルメニア語

フィリピン語

多数の翻訳例を学習して再現するのですから、ナイーブに作った機械翻訳が社会の持っているジェンダーバイアスを再現してしまうのは当然といえば当然ですね。ここは勝手に推論してはいけない箇所のように思います。実際、単文の翻訳では”He or She”などと両案併記で翻訳される場合もあるそう。

三人称単数のtheyという案もありそうですが、これらの言語からの翻訳がtheyになることを利用者が望むかも難しいところ。

via Bored Panda

カテゴリー
Uncategorized

Treeware – 作者に植林で返すソフトウェアライセンス

ツリーウェアは、ソフトウェア利用者が木を買うことで感謝を示せるタイプのソフトウェア配布の仕組みです。

Treeware のサイトでは、気候危機に対する対策の一つとしての植林プロジェクトを紹介し、

フリーウェアの作者に対して、感謝の気持ちを植林プロジェクトへの寄付として受け取れるよう、ライセンスの提案やツリーウェア化の呼びかけをしています。

Treewareのサイトでは、Treeware形式で配布しているソフトウェアを検索できます。現時点で130個以上のソフトウェアが登録されているようです。

Treeware であることを示すバッジも用意されていて、このようにGitHub 上のプロジェクトリポジトリに表示されているものもありました。

バッジから辿れるEcologiのサイトでは、寄付金額と、金額に応じて何本の植林がされるかが選べるようになっています。

世界各地での植林や森林を守る活動が紹介され、寄付の時に希望すれば名前を寄付したところに表示してもらうことも可能のようです。

via Hacker News

カテゴリー
Uncategorized

1956年のコンピューターのコマーシャルフィルム

1956年のレミントン・ランド社(現ユニシス)のUNIVACコンピューターのコマーシャルをYouTubeで見つけました。

「何千もの過去の嵐の情報を集めて、数百人時間かかる計算を数分で終わらせ、次の嵐を予測できる日も近い」

  • 1秒に1万2000文字を読みこむ時期テープ装置
  • 記憶ユニットは12000個の情報を保持 (これ単位は何なんだろう?)
  • 1秒に2000回の算術計算をこなす中央コンピュータ
  • 1分に600行を打ち出すプリンタ

何よりすごいのはこのUNIVACが正しい答えを出すこと。それを可能にしているのが、独自の自己診断機能

自己チェックができる!

今見ると感慨深い動画ですが、なんといっても1950年代ですからね。当時の人達は驚いたでしょうねえ。

今の最新コンピューターやスマートフォンの広告も、70年後にはこんな感じで見えるのかもしれません。