カテゴリー
fun

姓がない人をWebのフォームでどう扱えばいいか

世界の姓名データを集めるプロジェクトに関する Hacker News の突っ込みを読んだ中に出てきて面白かったのは、世界には姓が無い人がいるという話。

世界に姓がない人がいる(日本にもいますが)のは知っていたけれど、それがアプリやブラウザ上の入力フォームでどう扱われるか、扱われるべきなのか、というのは考えたことがありませんでした。

妻は姓を持たず、アメリカに来るたびにすべてのフォームで「ファーストネーム」と「ラストネーム」を問われることに困惑しています。彼女のパスポートには「名前」欄しかないのに

というコメントに対し、同じようにgiven nameしか持たずアメリカに来て、銀行口座の開設、車の購入、結婚証明の取得、などの手続きごとに窓口で揉め、結局心理的に大きな抵抗を持ちながらも改名することになった話なども出ていました。

上はミャンマー人の話のようですが、インド人からも、インドを構成する多数の言語利用者の中には名前が一つしかない人達もいるのに、政府は名前欄を2つ設けて入力させるのを強制している、多数派の想像力不足だ、というコメントが出ています。この人はまた、アメリカ領事館の査証発行システムにこのような姓のない人が登録する場合に、姓の部分に”LNU”(Last Name Unknown)と入れたり、逆の場合(!)にはファーストネーム欄に”FNU”(First Name Unknown)と入れたりした例を見たそうです。

また、2語からなる姓だけを持ちgiven nameを持たない人が、ファーストネーム+サーネームの入力をかいくぐるために姓の最初の語をファーストネーム、2番目の語をサーネーム「ということにして」乗り切ったが、ドイツに移住した際に両方とも姓ではと指摘されてしまい(ドイツっぽい)、サーネームに正しい2語の姓を、ファーストネームには(無い、という意味で)”-“を入れるように変更された話とか。

日本で名前を登録するようなサービスを作るとしたら、姓名のどちらかが空欄だとエラーになるようなフォーム、普通に作ってしまうと思いますが、それは海外由来の名前を持つ人にとっては本名を登録できない欠陥フォームになりうるんですね。

ただ、ほとんどの場合ユーザーは姓と名両方あるので、単純に空欄で受け入れるとこんどは誤入力だらけになる。エラーで止めるのではなく、本当に姓や名が無いのかを確認するような特別なフローに遷移するとかが正しい実装なんでしょうか。

カテゴリー
データ

names.io – 徹底的な?姓名データベース

names.io は、世界の多数の姓(surname)と名(first name)を集めたデータベース、と言っているテキストデータで、GitHub で公開されています。

Exhaustive(徹底的な)が示すように、あらゆる国の姓名を収集しているそうで、README にも入手元へのリンクを多数載せていますが、その規模はというと「姓が10万種類、名が16万種類」だそう。あれ?

日本の姓は30万種類ぐらいあるそう。ローマ字表記のこのデータベースでは同じ音の姓はかなり整理されるだろうとは思いますが、それにしても10万種類で「徹底的な」はないかな、と。

ただこのテキストファイル、同じく公開されているスクリプトで各所のデータを持ってきて加工して作成していることから、データの入手元を増やしていけば、本当に網羅的なものになる可能性もあるでしょう。issues には追加すると良さそうな提案が集まってきています。

最初に「すごい」「完全」と打ち出すことで、あえて突っ込みを受けて改善していこうということなのかもしれません。

via Hacker News