カテゴリー
ネットの事件

アメリカで赤ちゃんの「アレクサちゃん」が年々減少中

こちらの statista 社のインフォグラフィック、アマゾンのスマートスピーカーを呼び出す際の音声アシスタントで使われている “Alexa(アレクサ)”を持つ新生児の数が、サービスの登場した2015年から毎年減少していることを伝えています。

2015年に女の子の名前としてはアメリカで32位の人気だった Alexa は、2019年には 139位に後退しています。

こちらの babynamewizard で見ると、Alexa という名前は1980年代中盤から増え、2000年代に入ってから減る傾向にあったようです。Hacker News で指摘されているように、必ずしもAmazon の Alexa が出たから減っている、とは言えないかもしれません。Amazon Echo 以前に減りつつあった理由はわかりませんが、いろいろな家庭で機械に命令するために使われている”Alexa” を、子供の名前につけちゃって大丈夫かな、と思う人はそれなりに多いのではないかと想像します。

署名サイトで Alexa の名前を使わないよう求めたキャンペーンなども以前にはあり、名前が Alexa の人や子供に既に Alexa とつけていた人たちなどが抗議の声を上げていたようですね。

Apple の音声アシスタント Siri の方は、国勢調査の統計に出てくるほど人数がいるわけではなさそうですが、女性の名前、北欧系の名前 Sigrid のバリエーションとして実在しているようです。

Given name をブランドとして使われることで混乱が起こったり、子供がからかわれたりということはこれまでもあっただろうとは思いますが、音声アシスタントの場合は人間に近い存在として日常的に呼びかけるわけで、同じ名前を持つ人にとっては一度のからかいでは済まないたいへんさがあるように思います。その点では OK Google は問題を起こしにくい名前だったのかと。

via Hacker News

カテゴリー
fun

姓がない人をWebのフォームでどう扱えばいいか

世界の姓名データを集めるプロジェクトに関する Hacker News の突っ込みを読んだ中に出てきて面白かったのは、世界には姓が無い人がいるという話。

世界に姓がない人がいる(日本にもいますが)のは知っていたけれど、それがアプリやブラウザ上の入力フォームでどう扱われるか、扱われるべきなのか、というのは考えたことがありませんでした。

妻は姓を持たず、アメリカに来るたびにすべてのフォームで「ファーストネーム」と「ラストネーム」を問われることに困惑しています。彼女のパスポートには「名前」欄しかないのに

というコメントに対し、同じようにgiven nameしか持たずアメリカに来て、銀行口座の開設、車の購入、結婚証明の取得、などの手続きごとに窓口で揉め、結局心理的に大きな抵抗を持ちながらも改名することになった話なども出ていました。

上はミャンマー人の話のようですが、インド人からも、インドを構成する多数の言語利用者の中には名前が一つしかない人達もいるのに、政府は名前欄を2つ設けて入力させるのを強制している、多数派の想像力不足だ、というコメントが出ています。この人はまた、アメリカ領事館の査証発行システムにこのような姓のない人が登録する場合に、姓の部分に”LNU”(Last Name Unknown)と入れたり、逆の場合(!)にはファーストネーム欄に”FNU”(First Name Unknown)と入れたりした例を見たそうです。

また、2語からなる姓だけを持ちgiven nameを持たない人が、ファーストネーム+サーネームの入力をかいくぐるために姓の最初の語をファーストネーム、2番目の語をサーネーム「ということにして」乗り切ったが、ドイツに移住した際に両方とも姓ではと指摘されてしまい(ドイツっぽい)、サーネームに正しい2語の姓を、ファーストネームには(無い、という意味で)”-“を入れるように変更された話とか。

日本で名前を登録するようなサービスを作るとしたら、姓名のどちらかが空欄だとエラーになるようなフォーム、普通に作ってしまうと思いますが、それは海外由来の名前を持つ人にとっては本名を登録できない欠陥フォームになりうるんですね。

ただ、ほとんどの場合ユーザーは姓と名両方あるので、単純に空欄で受け入れるとこんどは誤入力だらけになる。エラーで止めるのではなく、本当に姓や名が無いのかを確認するような特別なフローに遷移するとかが正しい実装なんでしょうか。

カテゴリー
データ

names.io – 徹底的な?姓名データベース

names.io は、世界の多数の姓(surname)と名(first name)を集めたデータベース、と言っているテキストデータで、GitHub で公開されています。

Exhaustive(徹底的な)が示すように、あらゆる国の姓名を収集しているそうで、README にも入手元へのリンクを多数載せていますが、その規模はというと「姓が10万種類、名が16万種類」だそう。あれ?

日本の姓は30万種類ぐらいあるそう。ローマ字表記のこのデータベースでは同じ音の姓はかなり整理されるだろうとは思いますが、それにしても10万種類で「徹底的な」はないかな、と。

ただこのテキストファイル、同じく公開されているスクリプトで各所のデータを持ってきて加工して作成していることから、データの入手元を増やしていけば、本当に網羅的なものになる可能性もあるでしょう。issues には追加すると良さそうな提案が集まってきています。

最初に「すごい」「完全」と打ち出すことで、あえて突っ込みを受けて改善していこうということなのかもしれません。

via Hacker News