Tag Archives: 英語

Counter – 英語でいくつまで数えると何時間(あるいは何十年)かかるか

Counter は、数を(英語で)数える際に実際に何秒(/何時間/何年)かかるかを教えてくれるwebサービスです。

「100」と入れると、「約3分」と出てきます。

これは、英語で one, two, three,… と hundred まで数えると、だいたい3分かかるよ、という意味です。お風呂で100まで数えると3分、ということ。

1万まで数えると14時間、100万まで数えると3か月。実際に数えるのなんて無理だろう、という大きな数列も、かかる時間を推定してくれる優れものです。

数える時間をどうやって推定したかはこちらのブログに書かれています。大きな数は発音するのに何秒もかかるので、ちゃんとそれを加味した計算となっています。

このマイクロサイトの開発はNext.jsTypeScriptNowを使って行われたそう。

子音だけ取り出された英単語から、元の単語を推測するための復元ツールサービス

Missing Vowels は、オンラインで使える英単語推測のためのツールです。

英単語から子音だけを取り出す、というのは、パスワードの作り方などで見かけることがある手法。たとえば、

詳しく → kuwasiku → kwsk

これは英単語じゃないか。こういうものです。

He can not read this. → H cn nt rd ths.

この手法のことを disemvoweling と呼ぶみたいです。英語版Wikipedia によれば、SMSなど文字数が決まっているところで入りきらない文章を打つために使われるケースが今の主流のようです。

母音が抜かれた文章、とても読みづらいし英語に慣れていないほど復元は大変そうです。子音の組からそれになりそうな英単語を検索するのは辞書データから機械的にできそうだ、と思って探してみたら復元を補助してくれるツールとしてこのサイトが見つかりました。

“THS” をフォームに入れ、英語の一般的な単語からだけ探させると、左側に「母音を抜いたらTHSになる単語」のリストが返ってきます。

文章をそのまま復元してくれるともっと楽なんですけどね。

滅多にこれを使いたいシチュエーションになることはないかもしれませんが、ツールがあって検索すれば使えるということは覚えておくといいかもしれません。

このサービス、ドメインも.fr ですが、英語以外にフランス語にも対応しているようです。

「ヒアラブル (hearable)」は英語か?

「目指すのは次世代ヒアラブル」というタイトルの記事を見て「ヒアラブルって何だっけ?」となりました。

本文で「ヒアラブル・デバイス」が「音を聞くための道具」みたいな意味で使われているようなので、hear + able で “hearable” ということですね。それって audible じゃないの、と思い、ちょっと調べることにしました。

まず、手元のFirefox のスペルチェッカは hearable を弾きます。

Google検索でヒット数を調べると、

  • ”hearable device” – 約3240件
  • ”audible device” – 約94000件

1ページ目には NEC の英語リリースとかも出てくるので、日本語がオリジナルな資料もこの中には多いかもしれません。

ある文字列が英語の一般的な単語かどうかを調べる時、Scrabble用の辞書を引くという手があります。英単語を作って点数を競うゲーム Scrabble では、審判のために使える英単語が決まっているので、まあ英語の単語だろう、と認められるかどうかの一つの指針になります。

ありますね。

英単語ではあるし、言われれば何のことか意味もわかるけど、ほとんど使われない、ということでいいのかと思います。

ただ、英語メディアの記事で使っているものもありました。こちらの例だと、元のニュースリリースが hearable を使っているので参照しているニュースもそちらを使っているようです。英語メディアの記事のすべてを英語ネイティブが書いているわけでもないというのもあります。

ニュースに取り上げてもらいたい企業等が、audible と別の言葉をわざと使って新しいジャンルのように見せようとしている可能性もあります。このジャンルの調査をする時は、”audible”, “hearable” 両方で検索した方がよさそうです。

なお、聴覚以外の英単語についても同様に「正しいけど聞きなれない英単語」「普通は使わないけど見ればわかる英単語」の二組あるものが多いようです。(参考: ‘Hearable’ vs. ‘audible’ in English)

(たぶん)元からある (たぶん)後でできた
聴覚 audible hearable
視覚 visible seeable
嗅覚 olfactible (*) smellable (*)
味覚 edible / gustable tastable
触覚 tangible touchable

右側は、要は一番よく使われる動詞に able をつけたものですね。機械的に作れるしわかりやすいですが、元々左側の正しい単語が存在するが、それを知らなかったり思い出さなかったりする人が使っているということでしょうか。

olfactible / smellable は、どちらもScrabble辞書で出てきませんでした。辞書によっては一方あるいは両方とも載ってないこともあり、そもそも「嗅げる」というのを一単語で表したいという場面が非常に少ないのかもしれません。

また、touchable は tangible に比べるとあまり自然な英語では使われないようですが、それを否定する “untouchable” は一般的だし理解される単語というのも面白いです。

ギレンホール実験 – 有名人のミススペルの傾向を分析

ギレンホール実験(Gyllenhaal experiment)は、スペルが難しい有名人の一人である俳優のジェイク・ギレンホール氏の名前を冠した、面白い調査結果です。

著者のラッセル・ゴールデンバーグ氏(Russell Goldenberg)とマット・ダニエルズ氏(Matt Daniels)はまず、2011年頃にグーグルが公開した、「ブリトニー・スピアーズのグーグル検索60万回のデータ」から、人々がどのように彼女のファーストネームを間違えているかを可視化します。

7文字ですが、正しく入力できた人の割合は8割強。2割弱の人はスペルを間違っているということです。

このようなスペルが怪しい可能性のある有名人を、巨大掲示板 reddit の書き込みデータから (sp?) = 「スペル違うかも」と添えられた単語を探すことで特定するという手法が最近提案されていて、それらを参考にした「よくスペルを間違えられている有名人」の名前クイズを遊ぶことができます。

ホームラン記録で日本でも有名になったマーク・マグワイヤ氏のスペルをうろ覚えで入れてみたのがこちら。

最大8種類の「正解」および「よくある間違い」、そして、”Your Path”として、自分が入れたものも表示されます。

クイズで出てくるその他の難しいスペルの有名人としては、マシュー・「マコノヒー」、スカーレット・「ヨハンセン」
、「マコーレ」・カルキン、コリン・「キャパニック」らが挙げられています。

中には、正解率が2割を切っているものや、正しい綴りよりも多くの人が答えている間違っている綴り、なんていうものもあります。

これらのデータは、JSON形式でこちらからダウンロードすることもできます。

名前のスペルについては、間違われようが気にしない、というか実害もそれほど無いかもしれませんが、大量のデータの間違いを分析することで面白い結果が取れるというのはいろいろ他にも実験できそうですね。

英語のかばん語や韻を自動生成してくれるジェネレーター、気の利いた言い回しが作れるかも

Portmanteau & Rhyme Generator(カバン語と韻ジェネレーター)は、英単語を2つを入れると、その二つの単語やその類語・周辺語から韻を踏める単語を探したり、カバン語を合成してくれるというwebサービスです。

例えば “dog” “run” でやってみると、韻については

  • “around” “Grayhound” グレイハウンド、周りに
  • “bark” “embark” 吠える 乗船する

など、元の「犬」「走る」に関連した言葉で、韻を踏める組み合わせが、音としてどれぐらい近いかという指標をあわせて列挙されます。

かばん語(ポートマントー)の方も、「犬」「走る」に関連した類語を探した上で、

  • ranimal (ran/animal) (「走る」と「動物」で「ラニマル」)
  • puground (pug/aground) (「パグ」と「座礁する」で「パグラウンド」)
  • carrytriever (carry/retriever) (「運ぶ」と「レトリバー」で「キャリトリバー」

二つの音をつなげた新語をたくさん提案してくれます。

ポートマントーの方は仕事の役に立ちそう。ブランドやドメインで実在しない言葉の案を多数出す時など、ベースとなる商品のジャンルや希望するイメージの言葉などを与えると、類語を調べ、音の響きをあわせた候補がたくさん出てくるわけで、英語圏の人にはもちろんのこと、英語にそれほど親しみが無い(けれど、英語的な造語をネタ出ししなきゃいけないような状況の)人にとって有用なツールとなりえるのではないでしょうか。

ソースコードも公開されていて、データを差し替えて自分で動かすことも可能そうです。

via Hacker News

Uncover Harassers – #MeTooされた有名人の名前をハイライトするブラウザ拡張

Uncover Harassers は、セクシャルハラスメントの告発を受けたことがある有名人のリストを保持し、ブラウザのニュース記事などでその有名人が出てきた時にハイライト表示するというChromeブラウザ拡張です。

例として出てくる画像では、一年前に5人の元生徒らから告発された人気俳優ジェームズ・フランコ氏(James Franco)を例に使っています。左が通常のニュース記事なら、名前の部分が赤くハイライトされて目立っています。

さらに、ハイライトされた名前に対して、どのような告発がいつ有ったか、といったソースを辿れる情報も表示されます。

氏名やニュース概要、ソースのURLなどの情報はすべて拡張のソース内にありました。これとツールチップのTippy.js、ハイライターのmark.js が同梱されているだけなので、とりあえず今のv2.3.0 はおかしな動きはしなさそうです。データの更新でバージョンが上がる作りなので、先のことはわかりませんが。

気になる名簿の根拠ですが、タイム誌によるこちらの特集記事やニューヨークタイムズの記事を参考としているそうです。タイム誌の記事では、ハーヴェイ・ワインスタイン氏に対するMeToo告発の後に告発を受けた、実に142人もの有名人が列挙されています。

載ってない告発された有名人については、フォームで受け付けて更新するということ。

作者のサリム・ハックさん(Sarim Haq)は、一か月ほど前にジェームズ・フランコ氏の出演した映画「ディザスター・アーティスト」の感想をフェイスブックで書いた際に、友人にフランコ氏のMeToo騒動について初めて教えられ、ひどい行為をしたことを認識せずに有名人の宣伝に加担してしまうことを問題と感じ、サイドプロジェクトとして Uncover Harassers を作り始めたそうです。

サリムさんは TheNextWeb の取材で出た「告発された、ではなく有罪になった人のリストであるべきでは?」という問いに対し、「告発された(accused)」と表示する線は逸脱していないのと、その人物に対してそのような疑義がありニュースになっている、という事を示しているだけである、と答えています。さらに知りたければリンク先から自分で調べられる、ので良し、というスタンスのようですね。

via TheNextWeb

メジャーリーガーが多用する英語表現は?

ワシントンポスト紙が、過去21年間、7000本ものプロ野球選手へのインタビュー記事を解析して、選手がインタビューで多用する表現は何かを調べた記事が面白いです。

Python製の自然言語解析ライブラリNLTKを使い、4・5単語以上のフレーズで7回以上登場したものから抽出した「インタビューで良く出てくるフレーズ」。

何百回も出てくるフレーズは、記事中で解説されています。たとえばこういったもの

  • ここに立てて幸せです (I’m just happy to be here)
  • 一日一日やるだけです (we gotta play ’em one day at a time)

実はこれらは、映画「さよならゲーム」で、ケビン・コスナー演じるベテランが、若手投手に教える「これさえ言っておけばなんとかなる」というインタビュー用フレーズなのです。しかし、実際のメジャーリーガー達もこれらを何百回と使ってしまっているという。

また、以下のようなフレーズは、日常ではあまりないが野球では多用されるということ。

  • バットをボールに当てに行く (put the bat on the ball)
  • ストライクゾーンをぶちぬく (pound the strike zone)
  • いいピッチングはいいヒッティングに勝る (good pitching beats good hitting)
  • なんとかやりぬく道を見つける (find a way to get it done)

記事の末尾には、メジャーリーガーが良く使うフレーズが、「よくあるフレーズ」「慣用句」「野球用語」の三つにわけて紹介されています。

フレーズの上にマウスを置くと、実際にそのフレーズを使った野球選手のインタビュー抜粋が表示されるので、どんな風に使われるのかもわかるようになっています。

「よくあるフレーズ」「慣用句」は、たぶんアメリカで話す時にも良く使われているのでしょう。良く使われているフレーズを勉強することは、生きた英語を身に着けることにつながりそうです。

また、「野球用語」のところもしっかり勉強すれば、野球選手の通訳がうまくできるようになるかもしれませんね。

Away Mode – スマートスピーカーで泥棒除け

オンライン保険会社の Hippo が、アマゾン社のスマートスピーカー Amazon Echo 向けのスキルとして公開した Away Mode は、留守の間でも人がいるかのように偽装するスキルです。

Amazon Echo を持っていれば、Amazon のアカウントから無料で入手して試すこともできますが、ウェブサイトのトップでも7種類ほどのサンプルの冒頭20秒を聴くことができます。

サンプルは、「電話でイケアの家具の組み立て方を娘に指示する母親(68分間)」とか「いろんなことを話すが本についてだけは話さない読書クラブの会合(67分間)」「テレビを観ながら別れ話をするカップル(72分間)」といったもの。このスキルを入れて Alexa に命令すると、これらの会話を再生してくれるので、留守にしても留守っぽく聴こえないかも、ということ。

USA Today紙の取材に対し、少なくとも一人、経歴30年の引退した警察官は、「泥棒だって自分が盗むところを家の人に見られたくはないでしょう。家に誰かいるかもしれない、と思わせることには、なんらかの効果はあります」とコメントしたそうです。

Hippo 社も、これを真剣なホームセキュリティツールとしては考えておらず、泥棒対策について皆に考えてもらうきっかけとしてほしいということですが、外出先からのコントロールやより真剣でありそうな会話、電灯やテレビなども含めた制御を強化していけば、家に人がいるのかいないのか外からなかなか判別しにくいスマートホームを作り上げることも無理ではなさそうですね。

Dislexicon – 英語サービスの命名等に、造語作成を支援してくれるサービス

Dislexicon: The English Language Extender は、単語を渡すと、その単語を含んだ(上で、英語的にそれっぽい)名前を考えてくれるサービスです。

完全にランダムな単語を選んで案を出させることもできますが、”root word”のところに英単語を入れると、その単語を組み込んだ上で造語を提案してくれます。たとえば、”design tech”と二つの単語を与え、一度に複数作らせると、以下のような結果が出てきました。

rodere-, neco-, ultra- といった前について修飾するパーツや、-ian, -ish, -ular, -scope など後について修飾するパーツがランダムに追加されることで、元の単語に意味を拡張した新語が生まれています。

新語の字面や響き、そしてDefinition で解説された新語の持つ意味合いが気に入れば、辞書に載っていなくて、同名の企業やブランドが無いか少なそう(で、.com ドメイン取得などができそうな)名前を得ることができるかもしれません。

サービス利用者が良く使う単語

Top Dislexicon Root Wordsのページでは、サイトに訪れたユーザーが試した人気の単語のランキング表が載っています。(二つ表がありますが、左が同一ユーザーの複数入力をカウントしたもの、右はIPが同じものを除外したもの)

2011年には、Androidアプリもリリースされているようです。

類似の「英語命名サービス」

ネットショップを開けるwebサービス Shopifyでも、このような命名サービス Business Name Generator を提供していました。

こちらは、接頭語や接尾語をくっつけるタイプではなく、与えた単語と、新規の単語をくっつけて100個表示するというもの。「100個の中に気に入ったのがあれば、今すぐオンラインショップを開きましょう」という動線を持つ、サービスのプロモーションを兼ねたジェネレータですね。

Namelix というジェネレータは、「AIを活用してる」と言っています。

短めに作られた造語に、ロゴも自動で作ってくれるところが特徴ですね。こちらは、生成されたロゴを$25(¥2,750)~$175(¥19,250) で売ってくれる、というビジネスのよう。

Anadeaは企業ウェブサイト制作の請負につなげるジェネレーター。BNGNamestationはドメイン名販売につなげるジェネレーター。と、この手のサービス、名前を考えてくれた後にその名前に関するサービスを売りつけようとするのが多いようですね。

もちろん、考えてもらった名前を持ち帰って自分で使ったり、ネタ出しとしてまた次の命名会議に出したり、する分には何もコストは掛かりません。

英語でブランド名を考えるように、なんて言われることがあれば、最初の取っ掛かりとしてこういうサービスを使ってみるのもいいのかなと思います。

Footnotes

これは、2005年の当ブログ記事、クールな英語の名前生成サービスを、現在の情報を基に書き直したものです。

Homophones, Weakly – 同音異議の英単語をシンプルなイラストで比較紹介するサイト

Homophones, Weakly (同音異義語, 弱く)は、発音が同じ複数の英単語を並べて、その違いがわかるようにピクトグラム風のイラストで見せる、というブログです。

例えば、ate(食べた)とeight(8)。聴くと同じなのにまったく意味が違う単語ですが、2つ(時には3つ)のイラストは、デザイン的に似ていたり、関連がついていたりしてることが多いです。

こちらは、mantel(暖炉の前飾り)とmantle(地球内部の岩石層)。

whine(泣き言をいう)とwine(ワイン)。

2011年から毎週一本が投稿されていたようですが、更新は2016年でほぼ止まっていました。今回流れてきたのは、記事を集めた書籍が出るという案内がされたからのようです。

似たような英単語が二つあり、区別がついてなかったりとかスペルを逆に覚えていたりとかすることも多いと思いますが、こういうイラストと一緒に毎週見ていると、楽しんで知識が増えるかもしれないですね。

via Bored Panda