カテゴリー
データ可視化

ギレンホール実験 – 有名人のミススペルの傾向を分析

ギレンホール実験(Gyllenhaal experiment)は、スペルが難しい有名人の一人である俳優のジェイク・ギレンホール氏の名前を冠した、面白い調査結果です。

著者のラッセル・ゴールデンバーグ氏(Russell Goldenberg)とマット・ダニエルズ氏(Matt Daniels)はまず、2011年頃にグーグルが公開した、「ブリトニー・スピアーズのグーグル検索60万回のデータ」から、人々がどのように彼女のファーストネームを間違えているかを可視化します。

7文字ですが、正しく入力できた人の割合は8割強。2割弱の人はスペルを間違っているということです。

このようなスペルが怪しい可能性のある有名人を、巨大掲示板 reddit の書き込みデータから (sp?) = 「スペル違うかも」と添えられた単語を探すことで特定するという手法が最近提案されていて、それらを参考にした「よくスペルを間違えられている有名人」の名前クイズを遊ぶことができます。

ホームラン記録で日本でも有名になったマーク・マグワイヤ氏のスペルをうろ覚えで入れてみたのがこちら。

最大8種類の「正解」および「よくある間違い」、そして、”Your Path”として、自分が入れたものも表示されます。

クイズで出てくるその他の難しいスペルの有名人としては、マシュー・「マコノヒー」、スカーレット・「ヨハンセン」
、「マコーレ」・カルキン、コリン・「キャパニック」らが挙げられています。

中には、正解率が2割を切っているものや、正しい綴りよりも多くの人が答えている間違っている綴り、なんていうものもあります。

これらのデータは、JSON形式でこちらからダウンロードすることもできます。

名前のスペルについては、間違われようが気にしない、というか実害もそれほど無いかもしれませんが、大量のデータの間違いを分析することで面白い結果が取れるというのはいろいろ他にも実験できそうですね。

カテゴリー
英語学習

アメリカ各州で最もスペルが間違われる英単語 – beautiful や Supercalifragilisticexpialidocious

グーグル検索の検索動向統計を提供する Google Trends が、「これどう綴るんだっけ?」と検索された英単語を、アメリカの各州ごとにまとめています。

グーグルで検索されるから間違う、というのは必ずしも言えないと思いますが、英語ネイティブであっても自信が無い英単語が良く検索されるであろうことも本当でしょう。

beautiful, resume, schedule, sincerely, canceled などが、二つ以上の州でトップに立った、スペルが難しい英単語、ということのようです。

Supercalifragilisticexpialidocious とは?

さて、その中で気になったのが、テキサス州など6つの州でトップの Supercalifragilisticexpialidocious

辞書を引くと「とても素晴らしい」という意味らしいです。とにかく長いということが特徴の単語。映画「メリーポピンズ」(1964)中の楽曲から一般化した単語だそうで。

映画の歌から一般化した単語で、これだけ検索されるということは、使われているんですね。

Google Trendsチームは2017年も同じようにツイッターで発表しています。

2017年には Supercalifragilisticexpialidocious が2つの州でしかトップではないので、この単語の人気が上がったりしてるのでしょうか。

via Spelling Bee 2018: How to spell most misspelled words in America

カテゴリー
技術

誤字を振動で伝えるハイテクペンLernstift

クラウドファンディングサイト Kickstarter に登場した Lernstift は、間違ったスペルを書いたら震えてそれを教えてくれるというペンです。

子供が宿題をしていて、気づかずに次々と間違った綴りの単語を書いているのを見た発案者の妻が、「この子には間違えるたびにすぐに教えてくれるペンが必要ね」と思ったのが発端だったとか。

ペンにはモーションセンサーが内蔵され、ペンの動きにあわせて持ち主がどんな字を書いたかを認識します。

lernstift-inside

ペンには、綴りの間違いを指摘してくれる Orthography(正字法)モードと、筆記体の読みやすさを判定してくれる Calligraphy(書道)モードの二つがあります。また、技術的な延長線上には文法をチェックするモードも考えられ、いずれは追加できるだろうということです。

対応言語は、まずドイツ語と英語、続いてヨーロッパの主要諸語が予定されているということですが、文字認識ソフトウェアのトップ企業から40言語以上のデータをライセンスしているということで、より多くの言語に対応したいということです。

フィードバックを早く得ることで、間違いを早めに正してより早く習得することができそうですね。人類があと何年ペンと書き文字を使い続けるかはわかりませんが、移行が済むまでは、子供たちもまだまだ手書きと綴りの技能を練習しないといけないですし、面白い商品ではないでしょうか。

via Lernstift – A pen that reacts to spelling mistakes | Ufunk.net