タグ: 単語

ゲーム

Wikipediaスピードラン – ウィキペディアのリンクでゴールの単語を目指すゲーム

投稿者作成者: akky
投稿日 2022-09-21

ウィキペディア・スピードランズ (Wikipedia Speedruns!)は、英語版Wikipeia に載っているスタートの単語から、与えられたゴールの単語まで何クリックでたどり着けるかというブラウザゲームです。

遊ぶモードは以下の5つ。

スタートとゴールをランダムに、あるいは自分で設定する Quick Play モード
今日のお題 (登録してログインすると連勝記録が残ります)
過去のお題を選べるトレーニングモード
5カ所のチェックポイント(単語)を回るマラソンモード
友達と遊べるパーティーモード (要ログイン)

ゲーム内で表示された Wikipedia のデータは本物を使っていますが、「曖昧さ回避」などいくつかのリンクは(別ジャンルに飛びやすくなるため?)取り除かれているそうです。

また、ブラウザの「戻る」やページ内検索は使うことができません。警告が出ました。

日本語で遊べたとしても難しそうで、英語で目的の単語への順路を見つけるのはたいへんです。

なんとかゴールまでたどり着いたら、何クリックで着いたか、かかった時間、どんな単語を順番にクリックしたかが表示されました。

前に戻れないので、同じ単語に何回も戻ってきていますね。

チュートリアルでは人名から人名へのお題が出ていますが、たとえば”USA”など大きな概念に一旦たどり着くことで、そこからの移動の自由度が高まってうまくいきやすいとのことでした。

Python で書かれたソースコードも公開されています。改造して日本語版を作ることもできるかもしれませんね。

ソルバー

実は Wikipedia上での単語間のリンクを探すサービスというのがいくつも存在し、これを使ってしまうと最短のパスがいくつも見つかったりします。Wordleなどと同じで、他の道具を使えばチートはできますが、この手のゲームでチートしても仕方がないですよね。Wikipediaの迷宮をどうしても抜けられなくなったときは、次の一手のヒントを見るとかに使えますね。

タグ Wikipedia, ゲーム, ハイパーリンク, ブラウザゲーム, 事典, 単語, 英語

ネットのサービス

Phonetic Bad Word Filter – 読むと不適切に聴こえる文章をフィルタしてくれるAPI

投稿者作成者: akky
投稿日 2022-08-05

Phonetic Bad Word Filter API は、字面では一見問題なさそうに見えるが、声に出して読み上げるとヤバイ単語に聴こえてしまう文章や、スペルをわざと間違えることでテキスト合致によるフィルタをすり抜けようとする侮辱語などを発見してブロックするための API です。

API は RapidAPI のサービスで提供されていて、無料枠の利用でもクレジットカードの登録が必要です。

APIの呼び出しサンプルでは、実際のヘイトな単語を使うわけにはいかないので “car” という単語がまずい単語だと見立てて、”kar” という似たような発音になる綴りで置き換えても”car”を検知できますよ、というものになっています。

実際にはここに、いわゆるNワードなどを検知するように指定するということですね。

APIの使い道

APIの作者はもともと、Talking Banana(話すバナナ)というアイデアで、バナナの形の人形に YouTube や Twitch での中継中に視聴者のコメントを自動読み上げさせていたようです。

しかし、入力した結果が大勢の人に見られているライブ動画ですぐ読み上げられるとなると、出てくるのがイタズラ。特に侮辱後や人種差別にあたる言葉をわざと打ち込むというイタズラが登場してしまいました。

ヘイトスピーチにあたるような単語をブラックリスト登録することで、元の文に問題のある単語が直接含まれている場合は読み上げがされないよう対処できたのですが、イタズラする方に「機械に喋らせたら、問題のある単語に聴こえるような別の単語の組み合わせ」を入れてくる人が現れたんだそう。

単語一つだけでも、機械に合成させたら禁止ワードに聴こえる組み合わせをリスト化するのは大変そうです。さらに、単語単位での置き換えではなく、ひとつながりの複数の単語の並びの中に、喋ってみたら禁止ワードが聴こえてしまう、というようなものについて、事前にブロックリストを作るのはかなり難しいことでしょう。

喋らせてみたらまずいかも、という入力を実際に合成させた音をチェックさせるというアイデア、誤検出もありそうには思いますが前記のような用途であれば、ファンの入れた単語が間違って読み上げられなくてもそこまで大きな問題ではないのでしょう。

ユーザー入力をそのまま使うサービスというのは攻撃の対象になりやすいもので、できれば作らない方が楽だとは思います。しかし参加者のフィードバックが表示されることの価値も多いんでしょうね。今回の話は、技術と工夫で一旦はイタズラに勝った、という話で、いつもこういう勝ち筋があるといいのですが。

via reddit

タグ API, ヘイトスピーチ, 単語, 音声合成, 音声認識

英語学習

Alex – 政治的に正しくない英単語の利用をチェックできるツール

投稿者作成者: akky
投稿日 2015-09-11
Alex – 政治的に正しくない英単語の利用をチェックできるツールへの10件のコメント

Catch insensitive, inconsiderate writing (心無く、浅はかな文章を捕らえよう) というキャッチで公開されている Alex は、JavaScript/Node.js ベースで書かれた英文チェックツールです。いわゆるポリティカル・コレクトネス(PC)に反する、政治的や社会的に差別や偏見のある単語が使われていないかを見つけてくれます。

ウェブですぐに動作を試せるデモが公開されているので、それを見てみるのが一番早いでしょう。

「カメラマン」「チェアマン」みたいな男女差別につながる言葉、”he”とか”she”とかの男女を決め打ちで書いた主語、master/slave など人種差別の時に使われる表現、などを見つけ、赤でハイライトしてくれます。

下部には、「ではどんな単語を使えば問題ないのか」も表示してくれます。

# ワンクリックで全部置き換えるボタンもあっても良さそうなものですが

GitHub 上でソースは公開されていて、修正提案や用語の追加なども受け付けています。

JavaScript のソースをローカルでコマンドラインで動かすこともできるし、Atom や Sublime といった著名なテキストエディタや、gulp からマニュアルファイル等のチェックをするために呼び出すためのインテグレーションコードも紹介されています。

話題になっている Hacker News でも、GitHub の Issues でも、「なぜこれがダメなのか」とか「判定がおかしい」という文句が出ていて、問題の難しさが垣間見えます。

機械的に処理しているのだから誤検出も多く、指摘されたことを全部書き換える必要はない(しするべきでもない)ですが、僕ら非ネイティブからしたら「そんな問題があったのか/気にしてる人がいるのか」という情報を簡単に得られるという点で、英文のメールやリリースを書いたときに通してみる意味はあるように思います。

それが配慮なのか、それとも言葉狩りになってしまっているのか、検出結果を見て判断するのもまた非英語話者にはたいへんなことではありますが。

[追記 2022-10] 7年経った今でもツールは更新されているようです。7年間のうちに130個以上の issues がクロースされており、意外にライブラリとしていろいろなところで使われているのかもしれません。

via Hacker News

ソルバー

APIの使い道

関連