カテゴリー
ネットの事件

GitHub Copilot は”gender”など特定用語を含むコードで動かなくなる

書いているプログラムコードから次に必要そうなコードを提案してくれる GitHub の Copilot サービスで、「このコードに対して Copilot が何も提案してくれない」というバグが報告されました。

これに対するコミュニティの識者からの回答は、「おそらく、コードの中に “gender” という単語が入ってるからでしょう。」というもの。

Copilot には内蔵されたコンテンツフィルターがあり、フィルターに反応するとコードの提案をしないという作りなのだそう。そして “gender” もそのリストに含まれているらしいのです。

コードの提案が止まる、と言われたコードをCopilotで書いてみた

実際にCopilotで該当部分のコードを書いてみたところ、サジェストされた内容は文にならず途中で止まりました。元のコメント者と同じ結果なのかどうかはわかりませんが。

これを受けてのHacker News の議論では、

ジェンダーという名前の変数があったとして、その変数を boolean 型として提案コードを出せば「ジェンダーは(男女の)2通りじゃない」と怒る人が来てしまい、多値にすれば「ジェンダーは2通りだ」と怒る人が来るからでは、

という推測がトップコメントになっています。この推測が正しい理由かは不明ですが、議論になりそうな単語が含まれていると Copilot が動かなくなるというのは知ってる人は以前から知っていたようです。

今はクライアント側に禁止ワードのリストは無いそうですが、昔ベータだった際にクライアント側に埋め込まれていたリストを保存してた人がいたようで、rot13を掛けるとどんな単語が引っ掛かるかわかります。(このリストが本物として、リストが見えていた時期から変わっていないとして)

人種差別的な単語や罵倒後、卑猥な単語らがたくさん登録されていますが、”gender” も確かに含まれています。それどころか、”boy”, “girl”, “male”, “female” とかも入っているので、人を管理するデータクラスとかを作っただけでも引っ掛かることはありそう。

リストには英単語しか入っていないため、変数を日本語やローマ字で書く分には回避できそうですけどね。Hacker News では、”gender” をラテン語の”genus”に変えたら動いたよ、という報告もあり、これも試したところ本当でした。

“genus”にしたらサジェストが出た

マイクロソフトはAIチャットで意図しない発言が生成されて炎上したことがあったので、コードの提案でも問題を避ける機能を入れたくなるのはわからないでもありません。ただ、単語だけ列挙したリストの作りは雑なように感じるので、やるにしてももう少し改善してほしい気がします。

直近は、Copilot が何も言わなくなり、書いたコードが性別やジェンダーに関する変数名を含んでいたら、変数名をちょっと変えてみる、んですかね?

カテゴリー
Uncategorized ネットの事件

グーグル翻訳が機械学習バイアスで中性主語に性別をつける問題

日本語では”She”/”He”に「彼女」/「彼」が対応するため、あまり気づかないところなのですが、三人称代名詞が中性の言語というのもいろいろあるのですね。

ハンガリー語

ハンガリー語では三人称の代名詞で男女の区別をしないそうです。彼女・彼の両方が”Ő”になります。

ハンガリー語で三人称の様々な文章を作りそれらを英語に翻訳すると英語の三人称単数で中性を表せないため”She”か”He”になるのですが、その決まり方がどうにも偏っているのでは、という話。

日本語をハンガリー語に翻訳して、それをもう一度日本語に戻すと、英語と同じように性別がつくことが確認できました。

マレー語(アニメーションgif)

エストニア語

トルコ語

アルメニア語

フィリピン語

多数の翻訳例を学習して再現するのですから、ナイーブに作った機械翻訳が社会の持っているジェンダーバイアスを再現してしまうのは当然といえば当然ですね。ここは勝手に推論してはいけない箇所のように思います。実際、単文の翻訳では”He or She”などと両案併記で翻訳される場合もあるそう。

三人称単数のtheyという案もありそうですが、これらの言語からの翻訳がtheyになることを利用者が望むかも難しいところ。

via Bored Panda

カテゴリー
ネットの事件

英バーガーキング、国際女性デーにツイート「女性はキッチンがお似合いだ」で炎上

国際女性デーの3月8日、イギリスのバーガーキング公式アカウントが “Women Belong in the Kitchen”(女性はキッチンがお似合いだ) というツイートをし、大炎上しました。

元のツイートは謝罪のあと削除されたのですが、なんで今時こんなことを? 実はバーガーキングの意図はまったく差別とは逆方向にあったらしいのですが。

このツイートにつなげられた続きはこうです。

「もちろん、もし彼女たちがそう望むなら。シェフ業に占める女性の比率はたったの20%にすぎません。私たちは料理というキャリアを追求したい女性従業員を応援し、外食産業におけるジェンダー比率を変えるための計画を実行中です。」

「私たちはここに、バーガーキングの女性従業員が調理の夢をかなえる助けとなる新たな奨学金プログラムを始めることを高らかに宣言します!」

続けて読むと、なるほど国際女性デーの趣旨にあった良い事のようなのですが… 先頭のツイートだけを見ると完全な「釣り」ですねこれは。

先頭の「釣り」ツイートのRTは10万回、イイネは40万回近くまで行ったようですが、この40万回のイイネのうちどれだけがバーガーキングの新奨学金への賞賛なのか、あるいは女性差別への同意なのかは不明です。

謝罪と削除は翌日付け。

業界に女性が少ないことに注意を引きたかった。次はもう少しうまくやる、と言っています。

元ツイートに問題のあるコメントが多数みられるため元ツイートも削除します、とも言っていることから、切り取った女性差別に同意したり上乗せしたりしたツイッターユーザーも多かったのかもしれません。

バーガーキングといえば、ソーシャルメディアも巻き込んだやんちゃな広告活動で知られていますが、今回の「注意を引く」行為は設計があまりにも雑でした。真意が逆であったとしても、注意を引く部分の出来があまりに悪かったし、そこに直球の差別しかないとしたら、切り取られもするでしょう。

ほとんどの人は、続きのツイートがあっても続きまで読まずに反応する、ということの証明にもなった炎上でした。

via Muse