カテゴリー
技術

なんでも特許文書に置換するジェネレーター

特許書類の文書って、読み進めるのが苦痛な独特の文体ですね。日本語だけの現象かと思っていたら、英語でもやはり特許の文章は独特なようです。 Sam Lavigneさんが作成したのは、どんな文章でも特許の申請書のように変換して […]

特許書類の文書って、読み進めるのが苦痛な独特の文体ですね。日本語だけの現象かと思っていたら、英語でもやはり特許の文章は独特なようです。

Sam Lavigneさん作成したのは、どんな文章でも特許の申請書のように変換してしまうというコンバーター Patent Generator

http://commons.wikimedia.org/wiki/File:Middlebrook_paperclip_machine_patent2.gif

Python で作成され、GitHub上で公開されているツールは、4つのスクリプトに分かれます。

  • 特許を生成する “machine.py”
  • 元の文章の単語から、口語や上位語などを検索する “search.py”
  • Bing検索から特許の画像を取得する “get_illustrations.py”
  • キーワードを含む特許文を全文検索しダウンロードする “scraper.py”

Patternライブラリを使って、特許文書に特有の文法構造を見つけ出し、お題として与えられた文章からその構造に似た文章を抽出することで、与えられた小説などにある言葉遣いを保ちながら、特許的な文章を作り上げている、ということ。

ツールを使って生成されたサンプルとしては、以下のものなどが公開されています。(図の画像は含まれていません)

例えば、「共産党宣言」というタイトルは、「理解可能で理論的な、歴史的活動のための手法と機器」となり、特許の概要や詳細も同様に自動生成されています。

ジョークツールとしては面白いですが、むしろ反対に、特許のわかりにくい文章を普通の文章に変換してくれるツールこそ、有用かもしれないですね。