lexiconjure - 機械学習で英単語の意味を作り上げるツイッターbot
ロス・グッドウィンさん(Ross Goodwin)の手によるツイッターアカウント@lexiconjure は、それに向けてアルファベットの単語をつぶやくと、その単語の意味を「生成」して返してくれるという新しい自動応答ボットです。
たとえば、Hexidecimated, 「16進数にされた」的な造語を与えられて、こんな定義を生成しています。
Hexidecimated
[形] アメリカ合衆国ヘキシカ島時代に関する/意味する。Hexide は北半球で強調される音節を持ち、イスラム教徒とユダヤ教徒が住んでいた。
[名] Hexidecimateの子孫
19世紀後半: ギリシア語の hexis (健康) + kedimē (種) から
https://twitter.com/lexiconjure/status/701567785688657920
なんかもっともらしいんですが、デタラメです。
この定義、オックスフォード辞書のデータからディープラーニングを使って自動生成しているそうです。
既存の辞書の定義をなぞって、あるはずのない言葉の定義をそれらしい英語と辞書っぽいフォーマットで生成してくれるというわけですね。
PythonのソースコードがGitHubで公開されています。
もう一つ傑作を紹介。このbotが紹介されたHacker Newsのコメント欄より。
[名] 受け入れられる状況に対して騙したり敵意を見せたりするように設計された人物
Y Combinator はHacker Newsの運営元ですね。
辞書風の定義文はTwitterの(今の)文字数では収まらないので、完全版はTumblrの方で記録されています。
多数のツイッターユーザーから辞書にない単語も与えられていますし、"love"のような辞書に既にあるはずの単語も与えられ、それについても新しい「意味」が生成されています。
https://twitter.com/rossgoodwin/status/701507247738920961
AWSの無料枠を使って運営され、90分に一個の定義を返すようになっているそうで、現在はリクエスト殺到のため返答が遅れている状況です。
辞書にない単語の定義をでっちあげるゲームとしては、昔フジテレビで深夜にやっていた「たほいや」がありました。英語圏では「ボルダーダッシュ」(たわごと)とか「フィクショナリー」(フィクション+ディクショナリー)と言うそうです。
http://www.amazon.co.jp/dp/4594012582/
via Hacker News