« C++ で自動型変換 | メイン | 最適化された最適化手法について »

2008年07月23日

Pathtraq の API を公開しました

 本日、Pathtraq の Web API を公開いたしました。

サイボウズ・ラボ、話題のウェブサイトをランキング化するサイト Pathtraq (パストラック) の統計情報取得 API を公開 - 6,000万件のブログやニュースの統計データから検索やランキング取得が利用可能に

 公開から約1年を経て、Pathtraq は、宣伝したりインストールしてくださる皆さんのおかげをもちまして、6,000 万 URL 以上のアクセス統計を保持するデータベースに成長いたしました。この統計情報をどのように活用していくか、と考えたときに、皆さんからいただいたデータを囲い込んでおくのではなく、できる範囲で公開し、再利用してもらうべき、というのは自然な発想だと思います。

 そうは言っても、データベースやネットワークに与える負荷を考えるとなかなか難しいなぁというのが当初、個人的な感触だったのですが、同僚の山口を中心にいろいろ積極的に社外の人々に話を伺ったりして (お世話になった方々、ありがとうございます)、公開できるものを整理して実装、Pathtraq の開発者向け情報として文書化をすることができました。この API 群を使うことで、インターネット全体に渡って、人気のニュースやブログ記事を検索したり、アクセス数の推移をグラフ化したり、リンクの遷移情報をたどったり、といったことが可能になります

 とは言っても、Pathtraq の API は未成熟だと思いますし、実際に使っていただく場合には痒いところに手が届かない、というケースもあるかと思いますので、そういった場合には、ご相談いただければ幸いに存じます。この統計データを使うことで、情報を、より速く、より楽しく、より簡単に、共有できるようになれば、Pathtraq を運営する一人として、とてもうれしく思います。

19:05追記: 具体的な使用方法については、ステップ・バイ・ステップで Pathtraq の API を使ってみよう - IT戦記 をご覧ください。

7月25日追記: API について、以下の3点を変更いたしました。id:keita_yamaguchi さん、フィードバックありがとうございました。 (参考: ruby-pathtraq を作成しました - ¬¬日常日記)

  1. ページチャートAPI が XML 形式に対応
  2. キーワード・URL検索API において、パラメータが不足している場合のステータス・コードを 400 に修正
  3. JSON 形式で URL 一覧を返す場合にも description を含めるよう修正

注: このサイズは Google など検索エンジンのインデックスと比較すると小さいものですが、国内のユーザーが実際にアクセスした統計情報を伴っているという点でユニークなものだと考えています

投稿者 kazuho : 2008年07月23日 15:45 このエントリーを含むはてなブックマーク このエントリーを含むはてなブックマーク

トラックバック

このエントリーのトラックバックURL:
http://labs.cybozu.co.jp/cgi-bin/mt-admin/mt-tbp.cgi/1965

このリストは、次のエントリーを参照しています: Pathtraq の API を公開しました:

» [を] Pathtraq API が出たので「ウェブ検索パストラック順」を公開 from たつをのChangeLog
Pathtraq の API が公開されました。- Pathtraq の API を公開しました ( ... [続きを読む]

トラックバック時刻: 2008年07月23日 21:27

» livedoor Blogのサイドバーに「アクセス元」「アクセス先」を追加する方法 from @ネットおたく
■やること Pathtraq APIを使って、livedoor Blogのサイドバーに「アクセス元」と「アクセス先」を追加する。 ■手順 管... [続きを読む]

トラックバック時刻: 2008年07月24日 01:14

» Pathtraqいろいろ from ナンセンス不定記
休み明けでhadoopでもやろうかと思って、hadoopのことをPathtraqで探していたら、hadoopでなくPathtraqについていろいろ出てき... [続きを読む]

トラックバック時刻: 2008年08月18日 17:22

コメント

既に言及されているかもしれませんが、Pathtraq専用拡張ソフトの登録ユーザ数はどれくらいですか?

投稿者 kk : 2008年08月24日 00:30

Firefox3にPathtraqをインストールしたら、ステータスバーの右下に青い文字で、数字が表示されるようになりました。

例:Pathtraq 0/0.5

この数字には何の意味があるのですか?
ヘルプには「リーチ率」という言葉がありましたが、この数値とどういう関連性があるのか、具体的な意味が分かりません。
表示される数字の意味が分からないまま使い続けるのは、気持ち悪いです。

ユーザーにクライアントをインストールさせるのだから、表示される数値の意味等を、きちんと説明する場所を公式サイトの分かりやすい場所に掲示して欲しい。

また、こういった要望を提出するためのフォームを公式サイトに設けて欲しい。

投稿者 llxxxllxxxll : 2008年08月25日 17:26