カテゴリー
ネットのサービス

Listly – ウェブページからデータを抽出してExcelファイルにしてくれるサービス

Listly は、ウェブページのスクレイピングをお手軽にしてくれるサービスです。

フォームに抽出したいサイトのURLを入れて、Listyボタンを押すと、

ページ内の構造から、リストを抽出してくれます。抽出に使ったCSSセレクタを表示してくれてるので、これをコピーして使うもよし、”Excel”ボタンを押すと、エクセルファイルでダウンロードもできます。

何回も繰り返すような作業ならプログラム化すると思いますが、一度しかやらないとわかっている抽出作業などでは、特に便利なのではないでしょうか。

また、未実装ですが”Scraper”というボタンを見ると、繰り返し抽出を行うためのブックマークレットか何かを生成してくれる予定があるようです。APIも開発中とか。

同様のものにImport.ioというサービスが先行であり、機能的にも強力なのですが、こちらは月$199(2万1890円) からの有料サービスとなっています。Listly もユーザーが増えればいずれはお金を取りそうではありますが、今のところは登録等なく利用できます。

via Hacker News

カテゴリー
ネットのサービス

英語の求人文章から「男性的」「女性的」な表現の偏りをチェックしてくれるサイト

イギリス内閣府とNPO団体 の共同運営するAppliedは、ジェンダー差別や人種差別を廃し、公正で多様性のある採用ができるような支援機能を多数持つ求人サイトだそうです。

そのような機能のうちの一つ、あなたの書いた求人の文章のジェンダーバイアスをチェックしてくれるオンラインツールは、デモとして無料公開されています。

試しに、ネットに公開されているシニア・プロダクトマネージャー募集のサンプルを与えてみたところ、こんな判定が出てきました。

男性的(masculine)と判定された単語は、

  • leader (リーダー)
  • confident (自信いっぱいの)
  • analyze (分析する)
  • lead (リードする)
  • leadership (リーダーシップ)

女性的(feminine)と判定された単語は

  • responsibilities (責任)

求人広告に書かれた文章は、その職務のことだけでなく、企業組織やその文化についてのヒントを応募者に与え得るそうです。Applied は、男性的な言葉ばかり並べた募集の文面は女性の応募を遠ざけ、結果的に多様性の無い組織を作ってしまう、と主張しています。求人を書くときに、無意識にどちらかの性の人物を想定して、言葉を選んでしまっていないか、ということでしょうね。

他にも同様の注意を呼び掛けているサイトはあり、バイアスの少ない文章が求人で重要、という考え方はAppliedだけの発想ではなさそうです。

サービスは最低プランが無料から始まるフリーミアムで、ユーザー1人で使うだけなら無料である程度使えるようです。

海外に支店があったり、グローバライズした製品やサービスを売ったりしなければいけない日本企業では、英語で求人しなければいけない、という状況もあるでしょう。英語で正しく文章を書くだけでも大変ですが、文章に含まれる微妙な偏りや差別については、文法的な正しさとはまた違った知識や経験が必要そうですし、このようなツールに一回かけてみて、あまりに一方的な判定結果が出た場合はちょっと考えてみる、というのは安全のためにもいいかもしれないですね。

via New Scientist

カテゴリー
ツール

写真などの画像を無数のセルで出来たエクセルのシートに変換できるツール Google Spreadsheet Art

よくGoogle Spreadsheetsマクロによる凝ったツールを公開しているブログ Digital Inspiration のAmit Agarwal さんが、また面白いツールを公開してくれました

写真などの画像ファイルを表計算ファイルへと変換するツール Google Spreadsheet Art です。

view-from-cybozu-tokyo

これが元ファイル。300×300のサイズにあらかじめ縮小してあります。

Google Spreadsheet のツールファイルをブラウザで開いて、自分のGoogle Drive にコピーします。

google-spreadsheet-art-1

[Spreadsheet Art]メニューから、1. アップロードを選択、

google-spreadsheet-art-2

このツールで取り扱える画像ファイルの種類とサイズが注意として出てきます。

google-spreadsheet-art-3

画像ファイルのアップロードが終わると、多数のセルの中に色を表す数字が入っています。これが、元の画像ファイルのピクセルから取ってきた色の情報ですね。

google-spreadsheet-art-4

続いて、メニュー2番の「色を適用する」を実行。ちょっと時間が掛かります。

google-spreadsheet-art-5

1で取得した色で実際にセルの色が表示されるようになりました。

google-spreadsheet-art-6

全セルのサイズを小さくするのは、手動でもできますが、メニューの3番「セルを調整する」も用意されています。セルのサイズは、今回は2にしてみました。

google-spreadsheet-art-7

Google Spreadsheets 上に、アップロードした写真が再現されました。これを[ファイル]-[形式を指定してダウンロード]から Excel 形式で保存すると、Excelでも見えるようになります。

google-spreadsheet-art-8

できあがったファイルがこちら。

view-from-cybozu-tokyo.xlsx

元の画像ファイルが44KBだったところが、917KBとなりました。予想していたよりは小さい。

単純な作業を膨大にこなして作られたものが驚きになるというのは、他にもマッチ棒や10円(0.09ドル)玉、レゴなどで色々あると思います。しかし、デジタルな結果を作るのであれば、結局それはツールでできてしまうんだなあ、と。

公開されているGoogle Spreadsheetsのマクロは、現時点でのものは目を通し、怪しいコードは入ってないと思いました。何年にも渡っていろいろなツールを公開しているブログなので問題はないと思いますが、公開しているファイルやマクロを後から書き換えることは簡単ですので、自己責任でお試しください。