カテゴリー
データ

[アメリカ] 男女性別不明なユニセックス・ネーム

データ処理に関するブログ FlowingData で紹介されていたのは、聞いただけでは女性か男性かわからない、どちらの性別でもつけられることがあるファーストネームの統計結果です。

most-unisex-names-in-us-history-chart

1930年以降のデータで男性にも女性にもつけられてきた名前が、もっともどっちつかずだった順番に第1位のジェシー(Jessie)から並べられています。青いのが男性の、赤いのが女性の子供にその命名がされた割合を示しています。白い丸は、その名前の男女比が最も均衡していた、一番半々に近かった年を表しているそうです。

日本でいうと、「かおる」とか「ひろみ」、「あきら」、「しのぶ」といった名前にあたるでしょうか。英語の中性的な名前がどれか、なんて考えたこともなかったので、リストを順番に見るだけでも面白いです。

上から、ジェシー、マリオン、ジャッキー、アルバ、オリー、ジョディー、クレオ、ケリー、フランキー、グァダループ、キャリー、トミー、エンジェル、ホリス、サミー、ジェイミー、クリス、ロビー、トレーシー、メリル、ノエル、レネ、ジョニー、アリエル、ジャン、デボン、クルズ、ミシェル、ゲール、ロビン、ドリアン、ケーシー、ダナ、キム、シャノン。

このような両性的な名前の人は、すべて合わせてもアメリカ人全体からみれば1%にも満たないということですが、聞いたことがあるような名前も含まれていますね。

日常的にアメリカ人と多く接したりしてなければ、日本人が持つこれらの名前に対する性別の印象は、歌手や映画俳優などの外国の有名人に影響されるのではないでしょうか。僕だったら、「ジャッキー」は男、「ジョディー」は女、「マリオン」は女、「フランキー」は男、と思い込んでしまいそうですが、それぞれ、かなりの割合で、その名前で反対の性の人が存在することがわかります。他に、エンジェルは男性の方が多いとか、女性のサミーが半数近くになってきているとかも、僕の感覚とは違っています。

アメリカ人たち自身の子供の命名についても有名人の影響というのは同じようにあり、その名前を持った有名人の活躍で、これらのユニセックスな名前が、ある時突然一方の性別に偏っていくことがグラフからもわかるようです。グラフ中にも特記されていますが、陸上選手のマリオン・ジョーンズのオリンピック金メダル獲得は女の子のマリオンを増やしたし、初の黒人メジャーリーガー、ジャッキー・ロビンソンの登場は、男の子のジャッキーを増やしています。

24位のアリエル(Ariel)は、ディズニーの人魚姫から僕も女性の名前だと思い込んでいましたが、映画の公開までは男性の方がむしろ多く、映画から後に大きく女性の方に振れたのですね。40歳以上のアリエルさんは男性で、40歳以下のアリエルさんは女性が多い、ということのようです。

カテゴリー
fun

Googleの特殊検索にケビン・ベーコン数が登場

天気や単位・通貨の変換などを検索ボックスから直接呼び出せるグーグルの特殊な検索がありますが、これに新しくベーコン数を調べる検索機能が追加されました。

ベーコン数とは?
ハリウッド俳優ケビン・ベーコンとの距離を表す数です。
俳優ケビン・ベーコンと直接共演したことがある俳優は、ベーコン数1となります。ベーコン本人と共演したことはなくても、そのベーコン数1の俳優と共演したことがあれば、ベーコン数2。ベーコン数5という俳優は、間に4人の俳優を挟んで辿らないと、ケビン・ベーコンに辿りつけない俳優です。

なんでケビン・ベーコンなのか、についてはLong Tail World: ケヴィン・ベーコンとベーコン数:Average Kevin Bacon numberで詳しく解説されています。
任意の俳優についてベーコン数を調べるサービスはこれまでもあったのですが、今日グーグルが追加したのは、グーグルの検索ボックスからダイレクトにこのベーコン数を調べることができる、”bacon number (俳優名)”というキーワード。
bacon number sonny chiba と入力すると、
Baconnumbersonnychiba
ソニー千葉のベーコン数は2
ソニー千葉とジェームス・アール・ジョーンズは武士道ブレードで共演
ジェームス・アール・ジョーンズとケビン・ベーコンはザ・マジック7で共演
どちらの映画も知りませんでしたが、たしかに2作品で千葉真一からケビン・ベーコンにたどり着けるようです。

bacon number ken watanabe
の結果はこれ
Baconnumberkenwatanabe
takeshi kitano、yuki kudo、takuya kimuraとかseiko matsudaもベーコン数2ですね。どっからでもつながるなあ。
残念ながら、日本語で「ベーコン数 渡辺謙」とかやっても結果は出ないようです。
日本のグーグルだとそもそもベーコン数の結果が表示されませんし、ベーコン数算出の元データも、たぶん英語の映画中心のデータベースでやっているのでしょうから、ローマ字で入れても日本の映画しか出ていない日本の俳優では出てこないことが多いのが残念なところ。
ぜひ日本のデータも増やしてもらって、日本語でもベーコン数が出てくるようになるといいですね。
via Google builds Six Degrees of Kevin Bacon into its search system | Film | guardian.co.uk

カテゴリー
技術

ツイッターのつぶやきの言語と座標から作られた、世界の生きた言語地図

ツイッターのつぶやきの言語と座標情報を集めて、言語ごとに異なる色でプロットした世界地図
Language communities of Twitter
作者はEric Fischerさん。この人は、2010年にデジカメ画像の位置情報を集めて「旅行者」と「現地人」をプロットし、世界各都市の観光地を可視化する、というのをやって話題になった人ですね。
ヨーロッパの様子。言語の切れ目でぼんやりと国境が見えてきます。
Twitterbylanguageseurope
カタランとかスイスとか旧ユーゴとか、面白いですね。
こちらが日本周辺を切り出したもの。
Twitterbylanguagesjapanese
海上の座標でつぶやかれた日本語のツイートがけっこうあるような。GPSの精度の問題か、漁船やフェリーとかからつぶやく人がそんなにいるのか、理由はわかりませんが。
あと台湾の中国語の色が日本語の色と似てるのがまぎらわしいです。
つぶやきの言語を判定するには、言語判定のライブラリを使っているそうです。
ちなみに、文字列からそれがどの言語かを推定する言語判定ライブラリとしては、サイボウズ・ラボでも中谷さんが開発しているLanguage Detectionライブラリがあり、これ検出精度もかなり高いようです。もし上記のような地図など作ってみたい方がいたらぜひ試してみてください。
via Language communities of Twitter