カテゴリー
ネットのサービス

CSVファイルのデータ異常値を感覚的に捕まえるビューワ CSV Fingerprints

Victor Powellさんが提案した CSV Fingerprints (CSVの指紋)は、CSVファイルのデータをデータの有無やデータの型(文字、数字など)に合わせて色づけすることで、日々の事務などで自動生成されているCSV出力の異常な部分を、目視で発見できるようになるのでは、という提案です。

csv-fingerprints-example

カラムのデータの型によって異なる色で塗ったのが上のような例。

図の上でクリックしながらマウスを動かすと、指している辺りが拡大表示され、セルの内容を確認することができます。

csv-fingerprints-2

大きなデータセットの中から、異常になっている部分をすばやく特定し、その前後の値を含めて確認できるというわけです。

csv-fingerprints

こちらのページで、好きなCSVデータを貼り付けてfingerprint を作成してみることができます。

ビューワーはAngular.js および D3.js で作られており、GitHubで公開されています。

CSVを編集するExcelなどのアプリに、こういう可視化ツールがついているといいのかもしれませんね。

via Hacker News