Yahoo! Japan から 日本語形態素解析Webサービス がリリースされて、「ほほう」と思っている人も多いかと思います。
mecab などをサーバにインストールすれば今まででも形態素解析を使用したサービス(特に需要が多いのは分かち書きかな?)を提供することは可能だったわけですが、形態素解析は結構重い処理なので、非力なサーバだと少々しんどくて困っていたり、そもそもそういったアプリケーションをインストールできないサーバなために形態素解析の利用を断念していたなんて人には結構朗報かもしれません。
個人的には JSONP に対応して欲しかったところ。あんなことやこんなことやもやもやいろいろできるんだけどなあ……
でもまあこのサービスをちょっと試してみたかったので、GreaseMonkey で今見ているページのキーワードクラウドをページの一番上に付加するスクリプトなんてのを書いてみました。
(GreaseMonkeyが必要です)
このような感じで表示されます。ちょっと楽しげ?
Yahoo の形態素解析には uniq というオプションがあり、これを指定しておくと単語の出現頻度情報が得られます(使用回数を算出の上、多い順に並べて返す)。また、品詞を指定してフィルタリングもしてくれるので、実は帰ってきた結果をそのまま出力するだけでキーワードクラウド完成です(笑)。
GreaseMonkey で本文を取得して形態素解析サービスに送っているので、イントラのページなどでも解析できてしまいます。
逆に言えば、極秘のページであっても Yahoo! さんに内容を送ってしまいますので、利用は少々試してみるという範囲にとどめてくださいまし。
というわけで決まり文句ですが「万一本スクリプトでなんらかの被害が生じたとしても、無責任無保証」でお願いします。