CSVファイルのデータ異常値を感覚的に捕まえるビューワ CSV Fingerprints
Victor Powellさんが提案した CSV Fingerprints (CSVの指紋)は、CSVファイルのデータをデータの有無やデータの型(文字、数字など)に合わせて色づけすることで、日々の事務などで自動生成されているCSV出力の異常な部分を、目視で発見できるようになるのでは、という提案です。
カラムのデータの型によって異なる色で塗ったのが上のような例。
図の上でクリックしながらマウスを動かすと、指している辺りが拡大表示され、セルの内容を確認することができます。
大きなデータセットの中から、異常になっている部分をすばやく特定し、その前後の値を含めて確認できるというわけです。
こちらのページで、好きなCSVデータを貼り付けてfingerprint を作成してみることができます。
ビューワーはAngular.js および D3.js で作られており、GitHubで公開されています。
CSVを編集するExcelなどのアプリに、こういう可視化ツールがついているといいのかもしれませんね。
via Hacker News