カテゴリー
ネットのサービス

Phonetic Bad Word Filter – 読むと不適切に聴こえる文章をフィルタしてくれるAPI

Phonetic Bad Word Filter API は、字面では一見問題なさそうに見えるが、声に出して読み上げるとヤバイ単語に聴こえてしまう文章や、スペルをわざと間違えることでテキスト合致によるフィルタをすり抜けようとする侮辱語などを発見してブロックするための API です。

API は RapidAPI のサービスで提供されていて、無料枠の利用でもクレジットカードの登録が必要です。

APIの呼び出しサンプルでは、実際のヘイトな単語を使うわけにはいかないので “car” という単語がまずい単語だと見立てて、”kar” という似たような発音になる綴りで置き換えても”car”を検知できますよ、というものになっています。

実際にはここに、いわゆるNワードなどを検知するように指定するということですね。

APIの使い道

APIの作者はもともと、Talking Banana(話すバナナ)というアイデアで、バナナの形の人形に YouTube や Twitch での中継中に視聴者のコメントを自動読み上げさせていたようです。

しかし、入力した結果が大勢の人に見られているライブ動画ですぐ読み上げられるとなると、出てくるのがイタズラ。特に侮辱後や人種差別にあたる言葉をわざと打ち込むというイタズラが登場してしまいました。

ヘイトスピーチにあたるような単語をブラックリスト登録することで、元の文に問題のある単語が直接含まれている場合は読み上げがされないよう対処できたのですが、イタズラする方に「機械に喋らせたら、問題のある単語に聴こえるような別の単語の組み合わせ」を入れてくる人が現れたんだそう。

単語一つだけでも、機械に合成させたら禁止ワードに聴こえる組み合わせをリスト化するのは大変そうです。さらに、単語単位での置き換えではなく、ひとつながりの複数の単語の並びの中に、喋ってみたら禁止ワードが聴こえてしまう、というようなものについて、事前にブロックリストを作るのはかなり難しいことでしょう。

喋らせてみたらまずいかも、という入力を実際に合成させた音をチェックさせるというアイデア、誤検出もありそうには思いますが前記のような用途であれば、ファンの入れた単語が間違って読み上げられなくてもそこまで大きな問題ではないのでしょう。

ユーザー入力をそのまま使うサービスというのは攻撃の対象になりやすいもので、できれば作らない方が楽だとは思います。しかし参加者のフィードバックが表示されることの価値も多いんでしょうね。今回の話は、技術と工夫で一旦はイタズラに勝った、という話で、いつもこういう勝ち筋があるといいのですが。

via reddit

カテゴリー
ネットのサービス

YouTube の低評価(dislike)を取り戻すブラウザ拡張/スクリプト Return YouTube Dislike Count

Return youtube dislike countは、名前が示すとおり、YouTube 上での動画への低評価情報が今後隠されてていくのに対し、dislike 数の表示を復活させようというプロジェクトです。

評判が悪かったり出来の悪い動画を見分ける方法として使われていたであろう「低評価の数」ですが、嫌がらせで多数押されるケースなどがあり表示しないようにした、というのがYouTube の説明です。

これにより、動画のオーナー以外は dislike の数を知る方法がなくなります。

Return youtube dislike countは、この dislike 数の表示を元通りに復活させるブラウザ拡張になります。

このブラウザ拡張(Chrome, Firefox)や User Script を入れることで、dislike数が隠された動画においても、dislike 数が元通り表示されるようになります。少なくとも今は。

拡張作者はオリジナルの like/dislike 形式だけでなく、棒グラフで like/dislike の比率を見せるような表示形式も考えているとか。YouTube の方針とは異なり、dislike 数をより素早く確認することもできるかもしれませんね。

拡張を入れて実際に dislike を復活表示させてみようとしたのですが、まだ dislike の数字が消えた動画ってないですね。dislike 表示の無効化は地域やユーザー毎に少しずつ行われていくのかもしれません。

このブラウザ拡張の今現在の仕組みは、「YouTube 公式APIを呼ぶ」というもの。

しかし、12月13日からは API でも(動画の所有者以外は)dislike数を取れなくなるということなので、これだけでは1か月後には動かなくなってしまうでしょう。そこで、それまでの間に API 経由で取得した dislike数を自前のAPIサービスでキャッシュしていくのだとか。APIが止まった後の dislike は、まずはこのキャッシュされた数になりそうです。

そしてその後は、この拡張機能自体が dislike が押されたという情報を(YouTube本体にも送ると思いますが、)独自にカウントしていくようにする。拡張機能を使うユーザーがそれなりにいれば、dislike 数については YouTube 公式が集計しているdislike とは独立して dislike のデータベースが出来上がるということですね。

そんなにうまくいくかな、サーバ代も大変そうだし。と思ってしまいますが、拡張ユーザーだけで独自の dislike DB が意味のあるレベルで成立するかは、API で取れなくなるまでの期間にユーザーをどれだけ増やせるかに掛かってるといえるでしょう。

Firefox拡張の方は公式の拡張機能ストアに登録され簡単にインストールできますが、Chrome拡張は自分でダウンロードして設定からインストールする必要があります。拡張の性質上、Chrome Storeの審査は通りにくいかもしれませんね。

via reddit

カテゴリー
ネットのサービス

Icaro – 飛行機旅行での放射線被爆量を計算してくれるサービス

ICAROは、飛行機に乗って旅行した際に、宇宙放射線をどれだけ浴びるかというのを推定してくれるWebサービスです。

計りたい日付と、出発地と到着地の二つの空港を入れます。

肺レントゲンの撮影での被ばくだと何回にあたるか、と、微量の放射能を持つバナナを何十本食べたのと同様か、というわかりやすい指標も同時に表示されます。

1mSv(ミリシーベルト)を1年間の上限としてパーセントが計算されているようですが、この1mSv はパイロットなど日常的に高高度に長時間晒される職種の人が年間に受けられる量としてEUなどで規定している追加被爆量のようです。

アプリはAmentum Aerospace社Cosmic Ray APIを利用しているようです。こちらのAPIは非商用であれば月間10000回まで呼べる無料枠があります。この用途以外の使い道がちょっと思いつきませんが、飛行機移動の