rss-proxy - 非対応のwebサイトからRSSやJSONを生成する、セルフホストもできるOSSツール
damoeb/rss-proxy は、ウェブサイトが RSS feed を提供していなくても、HTML の構造から類推した新着情報を切り出してくれるオープンソースのツールです。
feed を提供してないウェブサイトのURLを入れると、html の構造から列挙になっている箇所を探し出し、生成する新着 feed の候補を並べてくれます。
それぞれの候補が差している箇所は赤点線で示されるので、ここが自分の欲しい新着情報だと思ったら、右下のfeed生成ボタンを押すと、RSS feed が生成されます。
RSS/ATOM 形式だけでなく、JSON を生成することもできるので、プログラムから利用したい場合はそちらが便利という人もいるでしょう。
デモサイトもあるのでここで動作を試すこともできますが、ソースコードは公開されており、呼び出すだけで動くdockeイメージも配布されているため、ローカルでも簡単に使ってみることができました。
スーパーマーケットの特売情報をJSONで取る、とか手軽にできそうです。
ローカルPC や自分のVPS等で動かしておくことで、これまで RSS リーダーで捕捉できていなかったウェブサイトの新着情報を効率良く受け取ることができるのではないでしょうか。
任意のウェブサイトからフィードを生成するサービスはいくつもあり、RSSリーダーの中にもそのような機能を内蔵しているものもあります。ですが、変換できる数に上限が有ったり、有料だったりと制限のあるものも多いです。
自前でホストすればそのあたりは制限がありませんし、ソースコードがあって自分で中を見ることができるのは、自動の切り出しでは飽き足らず個別に手を加えて新着情報を取りたいサイトが出た場合などに良さそうですね。
[caption id="attachment_13318" align="alignnone" width="580"] dockerで動かした時のログの様子[/caption]
via Hacker News