カテゴリー
fun

ベルリンの壁 – 同じ場所で壁有りと壁無しを並べた写真集

ベルリン・モルゲンポストの壁のあるベルリンとないベルリン、のページが面白かった。

ウェブサイトでよく見る、2つの写真を同じ場所に重ね合わせ、スライダーで見栄えを切り替えるという手法を使い、自分の手で切り替えながら見ることができます。

2019年の写真をスライドすると、

同じ場所を1981に撮影した写真が出てきます。

1989年11月9日にベルリンの壁は開放されたのですが、それ以前と昨年2019年の同じ場所の写真を並べています。

1981年というのは東側への旅行が制限つきながら緩和された年のようです。ベルリンの2つの時代の地図もスライダーで切り替えられるのですが、1981年版の地図では東ドイツ側にそもそも航空写真がなく、黒くなっていたりもしますね。

この地図上の数字のついた各地点で、両方の時代の写真を見ることができます。壁崩壊時の西ベルリン市長が、ブランデンブルク門の前で昔と同じポーズを取る写真なんかもあります。

via Maps Mania

カテゴリー
ネットのサービス

NSFW画像検知APIの優劣比較

NSFW(Not safe for work = 職場閲覧不適)画像、わかりやすい言い方だとエロ画像ですが、画像を渡すとその画像がエロかどうか判定してくれる API というの、結構たくさんあるんですね。

なぜこの種のAPIに需要があるかというと、ユーザー投稿型のwebサービス運営において、広く見せられないような画像を投稿されることが運用の大きな障害となるからでしょうね。悪意のあるユーザーや考えなしのユーザーによって法に触れたりサービスのイメージが悪化するような画像を投稿され、さらにそのことがソーシャルメディアで喧伝されたりすれば、サイトの評判に関わります。

Facebook や twitter のような超大手なら、画像の判定もいくらでも内製できるでしょうが、そうでない小さなサービスでは、多少お金を払ってでも簡易に判定を外部に任せたいところでしょう。

…と、書いていたら、Tumblr が(おそらく Apple に iPhone アプリを禁止された影響で)アダルトな投稿を禁じるという方針転換を発表し、同時に開始したアダルト画像のフィルタリングの誤判定がひどいらしいので、NSFW 判定は多数のエンジニアを抱える大手でも難しい分野なのでしょう。

そんな画像検知のAPI を、Aditya Ananthram さんが、API の検出精度を実験したり、価格を比較したりしてくれています。

調査対象のAPIはなんと11個。このまとまったリストだけでも、取っ掛かりとしてはありがたいですね。

また、セーフ/アウトのアウトの種類もいろいろあるようで、API によっても分類は異なりそうですが、以下のようなカテゴリ分けで判定を試みています。

  • Explicit Nudity (露骨なヌード)
  • Suggestive Nudity (思わせぶりなヌード – 隠すところは隠しているが… みたいなやつ)
  • Porn/sexual act (ポルノ/性行為)
  • Simulated/Animated porn (CGやアニメのポルノ)
  • Gore/Violence (流血/暴力)
  • Safe for Work (職場で問題ない)

実験するにあたって、当然、本物の NSFW 画像が必要となります。ブログ記事自体は必要なところはボカシが入っていて、SFW(safe for work = 職場安全)ですけど、中にGoogle Documents へのリンクがあり、リンク先には今回使用された、正しく分類されたデータが入っています。追試とかしたい方は注意してください。

カテゴリごとに強いAPIはありますが、Google のものがおおむね良い成績を上げたそうで、さすがというところでしょうか。また、Gore/Violence や Safe for Work というカテゴリはどのAPIでも判定は難しいようで、各APIでも誤判定が多かったそうです。このへんは元のテストデータにしても正解かどうか意見がわかれそうですし、「職場で問題ないかどうか」なんて普遍的にわかるものでもないですからね。

擬陽性・偽陰性の多寡を並べたグラフ(Overall Comparison セクション内)や、呼び出し回数に対する価格(Pricing セクション内)などもまとめられているのでこれらを併せて比較することで、予算と精度からどのAPIを調べてみるといいかの手がかりが得られそうです。

カテゴリー
データ可視化

ポテトチップスの空気量を調べたインフォグラフィックス

How Much Air is in Your Bag of Chips?(チップスの袋の空気量)は、14種類の有名なポテトチップスを購入し、その袋の中のどれぐらいが空っぽか、というのを計った調査と、その結果のインフォグラフィックスです。

59%が空気というチップスから、19%が空気というものまで、14品種のポテトチップスの空気の割合が並べられています。平均は43% ということで、スーパーでポテトチップスを買っても、半分近くは空気だということですね。

それぞれのパッケージの価格や内容量もあるので、空気が多いものが量が少ないというものではないでしょうけど、袋を開けてみてがっかりするのが嫌なら、空気率の低いブランドを選ぶのがいいのかもしれません。

測定方法は、同じ商品を2セットずつ買って、水に沈めて水位の変化でパッケージの体積を計測、次に空気を吸いだしたものを同じく水に沈めて計測、2回の平均を取った、ということです。

ヘンリー・ハーグリーブスさん(Henry Hargreaves)が2015年に同様の調査を公開していたそうで、今回のインフォグラフィックスも参考にしたそうですが、二つの調査結果を比べると、70%が空気だった2015年の調査からすれば、今回の空気の割合は43%と、だいぶ改善したようです。もし、これらの調査結果が報道されたことで、空気を増やし続ける動きにブレーキが掛かったのだとすれば、消費者にとっては良い調査でしたね。

via Bored Panda