カテゴリー
ネットのサービス

Phonetic Bad Word Filter – 読むと不適切に聴こえる文章をフィルタしてくれるAPI

Phonetic Bad Word Filter API は、字面では一見問題なさそうに見えるが、声に出して読み上げるとヤバイ単語に聴こえてしまう文章や、スペルをわざと間違えることでテキスト合致によるフィルタをすり抜けようとする侮辱語などを発見してブロックするための API です。

API は RapidAPI のサービスで提供されていて、無料枠の利用でもクレジットカードの登録が必要です。

APIの呼び出しサンプルでは、実際のヘイトな単語を使うわけにはいかないので “car” という単語がまずい単語だと見立てて、”kar” という似たような発音になる綴りで置き換えても”car”を検知できますよ、というものになっています。

実際にはここに、いわゆるNワードなどを検知するように指定するということですね。

APIの使い道

APIの作者はもともと、Talking Banana(話すバナナ)というアイデアで、バナナの形の人形に YouTube や Twitch での中継中に視聴者のコメントを自動読み上げさせていたようです。

しかし、入力した結果が大勢の人に見られているライブ動画ですぐ読み上げられるとなると、出てくるのがイタズラ。特に侮辱後や人種差別にあたる言葉をわざと打ち込むというイタズラが登場してしまいました。

ヘイトスピーチにあたるような単語をブラックリスト登録することで、元の文に問題のある単語が直接含まれている場合は読み上げがされないよう対処できたのですが、イタズラする方に「機械に喋らせたら、問題のある単語に聴こえるような別の単語の組み合わせ」を入れてくる人が現れたんだそう。

単語一つだけでも、機械に合成させたら禁止ワードに聴こえる組み合わせをリスト化するのは大変そうです。さらに、単語単位での置き換えではなく、ひとつながりの複数の単語の並びの中に、喋ってみたら禁止ワードが聴こえてしまう、というようなものについて、事前にブロックリストを作るのはかなり難しいことでしょう。

喋らせてみたらまずいかも、という入力を実際に合成させた音をチェックさせるというアイデア、誤検出もありそうには思いますが前記のような用途であれば、ファンの入れた単語が間違って読み上げられなくてもそこまで大きな問題ではないのでしょう。

ユーザー入力をそのまま使うサービスというのは攻撃の対象になりやすいもので、できれば作らない方が楽だとは思います。しかし参加者のフィードバックが表示されることの価値も多いんでしょうね。今回の話は、技術と工夫で一旦はイタズラに勝った、という話で、いつもこういう勝ち筋があるといいのですが。

via reddit

カテゴリー
WordPress

WordPressに喋らせる Amazon Polly プラグイン。読み上げ podcast 開設まで

[更新 2019-02] この記事のためだけにプラグインを入れておくのを止めて、プラグインは無効にします。また、プラグイン名は Amazon Polly から Amazon AI に変更されていたようです。

Amazon 自身が音声合成サービス Amazon Polly のワードプレス用プラグイン Amazon Polly公開したので、早速入れてみました。

インストールと設定

WordPress のプラグインディレクトリから選んでインストールすると、「設定」メニューに Amazon Polly が出てきます。

必要な権限を持たせたAWSのアカウントを用意して、以下の二つを設定。

  • AWS access key
  • AWS secret key

また、Voice Name で言語や話者を選べるので、日本語の女性 Mizuki か男性 Takumi を選んでおきます。

Cloud storage の項目では、合成された音声をローカルではなくAmazon S3に置く指定も可能です。

音声対応の記事を書く

これで新規にブログ記事を書こうとすると、投稿画面に”Enable Amazon Polly”というチェックボックスが出てくるので、喋らせたい記事にチェックを入れます。チェックすると「今回の変換にいくら掛かるか?」を確認するボタンまで出してくれるのは、有料APIだけに安心感があります。

あとは通常と同様に公開するだけ。

記事の先頭(プラグインの設定により末尾に出したり、表示しないことも可能)に、上のように音声再生のウィジェットが表示されました。聴いてみるとかなり良い感じで合成されていますね。

Autoplay という設定で、記事を開くと自動的に喋り始めるようにもできますが、これをオンにするのは読者には煩わしいのではないかと思います。

自動podcastも

管理画面の案内から、ブログの podcast feed が自動で生成されていることもわかります。

このブログの場合はこのURLで、生成された音声記事が podcast として公開されているということです。さらに iTunes で公開する Podcast Connect へ案内までしてくれるので、Apple ID/Store Account を持っていればそのまま iTunes で公開までしてしまいそうです。

今回はこの記事のみ変換するようにしましたが、過去の記事も変換したり、新規記事はデフォルトで音声版を作るようにする設定もあるので、既存のブログ資産から勝手に podcast を作れてしまいます。大量に長文を変換すると、それなりの金額になるかもしれませんが、そこだけ注意すれば、ブログコンテンツの再活用という意味でも面白いかもしれません。

カテゴリー
ネットのサービス

ツイートすると山が喋ってくれる Mountains of Mouthness

スウェーデンのデザイナー Magnus Östergren さんが作った、2つの3D CGで描かれた山が世界中からのツイートを音声合成で話すというインタラクティブ実験が、The Mountains of Mouthness です。

ハッシュタグ #bad を含むツイッターのつぶやきを探してきて、それを仮想空間に描かれた、口のついた山が喋る、というサービス。スマートフォンやタブレットのブラウザで開くと、デバイスの向きにあわせて視点が動きます。ハコスコとかあると没入感も出るでしょう。

mountains-of-mouthness

ハッシュタグ #bad ではなく、 @MoMouthness へのリプライやハッシュタグ #mouthness で直接確実に(とは言っても今のように混んでると全部拾ってるのかわかりませんが)喋らせることができます。

現在、ハッシュタグ #mouthness で検索するといろんなユーザーのツイートが大量に流れているのがわかります

twitter-search-mouthness

こちらはデモ動画。

ユーザーが指定した個別の情報から、CGと音声合成でこういったアニメーションをリアルタイムで作ってみせる、というコンテンツは、これから増えて行きそうですね。

via Potemkin via The Daily What