カテゴリー
ネットのサービス

NSFW画像検知APIの優劣比較

NSFW(Not safe for work = 職場閲覧不適)画像、わかりやすい言い方だとエロ画像ですが、画像を渡すとその画像がエロかどうか判定してくれる API というの、結構たくさんあるんですね。

なぜこの種のAPIに需要があるかというと、ユーザー投稿型のwebサービス運営において、広く見せられないような画像を投稿されることが運用の大きな障害となるからでしょうね。悪意のあるユーザーや考えなしのユーザーによって法に触れたりサービスのイメージが悪化するような画像を投稿され、さらにそのことがソーシャルメディアで喧伝されたりすれば、サイトの評判に関わります。

Facebook や twitter のような超大手なら、画像の判定もいくらでも内製できるでしょうが、そうでない小さなサービスでは、多少お金を払ってでも簡易に判定を外部に任せたいところでしょう。

…と、書いていたら、Tumblr が(おそらく Apple に iPhone アプリを禁止された影響で)アダルトな投稿を禁じるという方針転換を発表し、同時に開始したアダルト画像のフィルタリングの誤判定がひどいらしいので、NSFW 判定は多数のエンジニアを抱える大手でも難しい分野なのでしょう。

そんな画像検知のAPI を、Aditya Ananthram さんが、API の検出精度を実験したり、価格を比較したりしてくれています。

調査対象のAPIはなんと11個。このまとまったリストだけでも、取っ掛かりとしてはありがたいですね。

また、セーフ/アウトのアウトの種類もいろいろあるようで、API によっても分類は異なりそうですが、以下のようなカテゴリ分けで判定を試みています。

  • Explicit Nudity (露骨なヌード)
  • Suggestive Nudity (思わせぶりなヌード – 隠すところは隠しているが… みたいなやつ)
  • Porn/sexual act (ポルノ/性行為)
  • Simulated/Animated porn (CGやアニメのポルノ)
  • Gore/Violence (流血/暴力)
  • Safe for Work (職場で問題ない)

実験するにあたって、当然、本物の NSFW 画像が必要となります。ブログ記事自体は必要なところはボカシが入っていて、SFW(safe for work = 職場安全)ですけど、中にGoogle Documents へのリンクがあり、リンク先には今回使用された、正しく分類されたデータが入っています。追試とかしたい方は注意してください。

カテゴリごとに強いAPIはありますが、Google のものがおおむね良い成績を上げたそうで、さすがというところでしょうか。また、Gore/Violence や Safe for Work というカテゴリはどのAPIでも判定は難しいようで、各APIでも誤判定が多かったそうです。このへんは元のテストデータにしても正解かどうか意見がわかれそうですし、「職場で問題ないかどうか」なんて普遍的にわかるものでもないですからね。

擬陽性・偽陰性の多寡を並べたグラフ(Overall Comparison セクション内)や、呼び出し回数に対する価格(Pricing セクション内)などもまとめられているのでこれらを併せて比較することで、予算と精度からどのAPIを調べてみるといいかの手がかりが得られそうです。

カテゴリー
育児

Kudoso – 宿題やお手伝いをするとWiFiが使える家庭用ルーター

Kaiserの調査では、アメリカの子供は一日7.5時間、電子デバイス(含むテレビ)を使っているそうです。

Kudosoは、そんな子供のネット利用を制限するルーターですが、単にアクセス制限をするだけではなく、アプリケーションとセットで、親が決めたアクティビティをこなすことでアクセス可能な時間を延ばしたりできるシステムとなっています。

こちらがお手伝いなどに対する報酬の調整画面。

kudoso-chore-list

歯磨きしたら10点、九九を練習して20点、外で遊んだら20点、など、やった事に応じてポイントが与えられ、その分数だけネットがつながるそうです。

外との通信を全部見ているわけなので、親はどのサービスがどれぐらいアクセスされたかといった統計も確認できます。

kudoso-prioritize-web-services

たとえば、ネットフリックスは必要ポイントを高くして、ナショナルジオグラフィックスは低くすることで、子供が同じだけ手伝いや勉強をしても、ナショナルジオグラフィックスを視聴する方が長く遊べる、というように調整することも可能です。

# という例を見るに、ネットフリックス上の番組よりも、ナショナルジオグラフィックスの方が教育上いい、という意識があるのでしょうね

カーンアカデミーのようなオンライン授業を受けることで、ネットを使ってもポイントが減るのではなく溜まるようにする、といったことも。

バージョン2開発のためのKickstarterでの50000ドル(550万円)の募金呼びかけは、残念ながら30000ドル(330万円)ちょっとで締め切りとなり頓挫してしまったようですが、子供とネット接続について悩んでいる親は世界中にいるでしょうし、サービスをうまく設計すればそこそこ売れるのではないかなと感じました。

via USA Today