カテゴリー
ネットのサービス

Speech2Face – 声からあなたの顔つきを当てる研究

声から、喋っている人がどんな顔なのかを推定する、という研究です。

上に並んでいるのが、短文の音声メッセージの話者です。これ左端はダニエル・クレイグ氏(007)ですよね。他はわかりませんが。

サイトで再生ボタンを押すと、推定に使われた音声データが聴けます。10秒も無いぐらいの短い文章です。

そして、下に並んでいるのが、その音声から深層ニューラルネットワークを利用して推定した話者の顔。

学習データとしては、インターネット/YouTube 上の数百万の人が喋っている動画を使ったそうです。「こんな風貌の人は、こんな風に話す」というデータを大量に食わせることで、「こんな風に話す人は、こんな見た目なことが多い」という変換を得たということですね。

推測結果には性別・ジェンダー・人種など繊細な問題が絡むことから、倫理的な注意書きが添えられています。学習データは全人類の平均的な喋り方を集めたのではなく、YouTube などから動画を集めたことから、データには当然バイアスがあります、と。YouTube に出ているような人の喋り方、に偏っているかもしれないし、喋っている言語のサンプルが少なかったりする言語の場合も偏りがあるかもしれない、などなど。

また、話者本人を特定したり、話者のファッション(髪の色やメガネ等)を特定したりは当然できません。(メガネをかけた人特有の話し方、とかない限り)

アプリやブラウザに対して喋ると顔写真を出してくれたり、というお遊びサービスは面白そうですが、その先にどのような実用的な応用がありうるのか。何か面白いことができそうな研究ではありますね。

via Futurism

カテゴリー
ネットのサービス

ThisResumeDoesNotExist – 架空の履歴書ジェネレーター

This resume does not exist は、実在しない人物のそれっぽい履歴書を作ってくれるwebサービスです。

10秒ごとに新しい人物の履歴書が生成され、リロードすると表示されます。

実在しない人物の写真が作れるようになりましたし、文章や経歴についても同じように多数のデータを与え、似たものを作らせることができれば、実在しないけど実在しているかのように詳細が定義された履歴書を作ることもできるということですね。

用途ですが、たとえば、実在する誰かの個人情報を侵害することなく、採用の練習やウェブサイトデザインに使うとかが考えられますかね。UIデザイン時のユーザーペルソナを作るとかにも使えそうでしょうか。

悪用も考えられますね。実在しないそれっぽい人のデータがたくさんあれば、実社員や実ユーザーがいないフェイク企業をそれっぽく飾り立てるなんてことも起こるかもしれません。

via Hacker News

カテゴリー
ネットのサービス

JudgeFakePeople – 自動生成された「実在しない顔」を皆で〇×評価するサイト

Judge Fake People (フェイクな人々を判定)は、StyleGAN 技術で生成された存在しない顔写真を「有りか無しか」「好きか嫌いか」で評価するという派生サイトです。

ランダムに表示される、生成された顔写真を、Hot or Not (今は出会い系業者に売却されているようです)のように♡か×かで評価していきます。

サイトには、評価の低い順・真ん中・高い順で顔写真を並べ替える機能がついていて、サイトに来た人たちが判定した、好きな顔・嫌いな顔を見ることができます。現時点での highest はこんな人たち(実在しないのに「人たち」は変?)

トップページのランダム表示は老若男女さまざまですが、人気の顔写真は若い女性だらけですね。

集合知から、今の人類が好ましいと思う架空の顔、なんてのが求められれば、それがどんな顔になるのか見てみたい気もします。

via Geekologie