« 書評:「みんなの知識」をビジネスにする | メイン | Rating Burner 有名ブログランキング »

2008年03月30日

txt2re 文章から対話的に正規表現を作れる支援サービス

一週間のうちにいくつも正規表現のツールが話題になるのは、正規表現で悩むプログラマが多いということだろう。また面白いサービスが出てきた。

txt2re-logo.png

txt2reは、テキストボックスに入れたテキストを分解し、そこからどんな正規表現が作りたいのかを推測して提案してくれるというサービス。

サンプルで入っているテキストでは、日付(の英語表現)のあとに引用文で英文、という入力。

txt2re-step1.png

入れたものが要素ごとに分解された上で、まとまった部分が「文字列」なのか「月」なのか「アメリカの州」なのか、といった推測がされて、選択肢としてリンク表示される。

txt2re-step2.png

「ここは月のつもりだった」ということでMonthをリンクすると、その部分の正規表現が確定する。

txt2re-step2-month-chosen.png

作った正規表現だけ出してくれても役に立つと思うけれど、このサービスではさらに、Perl, PHP, Python, Java, Javascript, ColdFusion, C, C++, Ruby, VB, VBScript, J#.net, C#.net, C++.net, VB.netのソースコードとしても出力してくれる。

txt2re-step3.png

月(の英語表現)を選んだときなど、できる正規表現では月の省略形とフルネーム(JulyとJulとか)のどちらにも対応するように書かれていたりと、がんばって生成している。

生成したコードなので、多少甘いところもあるとは思うけれど、それを基にしてチューニングしていけばいいだろう。自分がよく知らない言語で正規表現を扱うことになったときにも、とっかかりとして参考になると思った。

投稿者 秋元 : 2008年03月30日 10:38

トラックバック

このエントリーのトラックバックURL:
http://labs.cybozu.co.jp/cgi-bin/mt-admin/mt-tbp.cgi/1826

 
mg src="http://img.awasete.com/image.phtml?u=http%3A%2F%2Flabs.cybozu.co.jp%2Fblog%2Fakky%2F" width="160" height="140" alt="あわせて読みたい" border="0">

著書

PHPxWebServiceAPIConnections.jpg

プロフィール

週三日勤務で、残りは個人で活動しています