マイクロソフトのリアルタイム音声検閲特許が成立

ars technicaによると、2004年に申請されていたマイクロソフトの特許がアメリカで成立したという。

その内容はというと、リアルタイムで音声の中から特定の音を見つけ出し、そこを無音化したり、別の音を被せるという技術。つまり「ピー」を自動で入れるソフトウェアである。

# 特定の音を見つける、という技術は、エシュロンとかグレートファイアウォールでやってそうな気もする。まあ当然特許とかには出てこない話だけど。

リアルタイム、ということなので、Fワード等の単語が話し終えられる前に、「ピー」を被せられるということだけど、このへんは、それまで出てきた単語の情報などもあわせて、その話し手が問題のある単語を使いそうかどうか、という確率も加味して閾値を動的に変化させる、というようなことが書いてある。

ars technicaによれば、アメリカの場合、FCC(連邦通信委員会)の規定で、毎日朝6時から夜10時までの間、問題のある表現は「ピー」で置き換えないといけないという法律があるそうだ。そこで、生放送の出演者がうっかり問題のある単語を話さないように、ライブであっても7秒間とかずらした映像・音声を放送し、何かあった場合は監視者が7秒のうちに対策を取るようになっているのだと。

このソフトウェアは、もし額面通り動くなら、そういった生放送が必要な業界や、オンラインゲームの音声チャットでネットワーク越しに相手にひどい言葉を使うユーザへの対策として使われるのではと予想されている。

テキストのウェブでは、だいぶ前から、特定の単語(「死ね」とか)をフィルタする掲示板があったりしたけれど、ネットワークの帯域が広くなって音声がより使われるようになってきたのに合わせて、音声でも同様の技術が必要とされてきたということか。

テキストでも「死ね」→「氏ね」とかの言い換え等で単純フィルタが無意味になったように、音声でも攻撃的な単語の言い換えが増えるかもしれない。

できれば、こういう技術は送信側(テレビ局等)で処理するんじゃなくて、受信側が個別にオンオフできるのが望ましいように思う。誰かが「良くない言葉」を決めて一律に押し付けるのに使われるのではなく、「ピー」を被せるかどうかは受信者が切り替えられて、自分の責任で汚い言葉を聴く自由もある、ということならいいのだけれど。過渡期にはソフトウェアの能力や手間から発信側でのフィルタに使われるのだろう。