ブログ本文を取り出しやすくするマイクロフォーマットについて(ちょっと)調べてみた

ほんとにちょっとなので期待しすぎないで。

XPathの不便なところ – ぶろぐ。@はてなで、特に意味はないけど(笑)XPathで本文を探しにくいサンプルとしてこのブログが上げられていた(すいませんほんとに)。

そのXPathは、LDRFullFeedで使うことを想定しているということ。見てみたら、WebページのURLから本文を取るためのデータで、そこは参加者が持ち寄って作るデータベースらしい。

LDRがlivedoor Readerだとすると、このブログは全文出してるので本文はそっから取れるのだけれど、このデータはそれに限らずいろいろな本文を取り出すスクリプトで参照されるから、フィードから本文が全部取れるかどうかはまた別の話なのかもしれない。

とにかく、スクリプトに優しくないということなので個別ページのHTMLのソースを見てみた。で、上のページもあわせて読むと、なんとなく不親切な構造なんだろうな、というのは把握した。

で、今の構造はどうしてこうなってるか考えたけど、たぶん最初にMT3をインストールしたときの構造をベースに、弊社のウェブデザイナーにお願いしたんだと思う。もともとMTはこういう構造なんではなかろうか。

microformatsのページで、ブログのマイクロフォーマットはどうあるべきか、というところを読む。

ここでは、Movable TypeやWordPressといったインストール型のブログシステムや、BloggerやLiveJournalなどのブログサービス、CMSや掲示板などの著名なものについて、本文をどう指しているか調べているのだけれど、まとめというか列挙になっていて、各システムでまったく違う構造や(あったとしても)マイクロフォーマットが割り振られているようだ。

ここまで読んで、実際にどう改造すると機械にもやさしいブログになれるのか、ちょっとわからなくなってきた。もしMovable Typeのデフォルトがこれなら、XPathはちょと複雑でも、今のままの形にしておけば「Movable Typeブログ向け汎用SITEINFO」みたいなものがきくのかなあ、などとも思ったり。

MTの構造を残したまま、別のもっとダイレクトな(idを振った)本文のdivを入れるというのが落としどころかもしれない。どうしよう?

参考

ここよりも後でここより前を指定するXPath – 0x廃棄階層 – 統治局

水都大阪のポスターがヤバイ とか(2009/02/09の雑記) – Hinemosu それなのかなあ。でもなんで”center”?

プログラマーになりたい中学生から取材を受けた

中学校の課題で「なりたい職業の人に会って、そのレポートを書く」というのがあるそうで、中学三年生からメールをもらい、サイボウズ・ラボの会議室でインタビューを受けた。

なりたい職業は「ブロガー」じゃなくて「プログラマー」の方ね。グーグルの検索とかで僕のブログが出てきたらしい。

なにがきっかけでプログラマーになろうと思ったのか(電気屋の店頭でパソコンを見つけて)とか、いつからなりたいと思ってたか(小五)とか、プログラマーのいいとこ(スーツ着ないでいいとか)や悪いところ(納期前はたいへん)とか、その他いろいろ用意されてきた質問に答えた。

「プログラマーになりたいと思うからには、今もプログラミングとかしてるんですよね?」と逆質問したところ、今はC言語でDXLibを使ってRPGを作ってるという。その前はJavascriptをやってたそうだ。

最近になって自分専用のパソコンを買ってもらったという。好きなウェブサービスを聞いたら、なんとGoogle Readerだって。ケータイのゲームとか子供向けのサイトとかじゃなくて、RSSリーダーでいろんなブログを購読して読むのが面白い、ということ。

なんかいい学校らしいので、全部の中学校がそんなだとは思わないけど、自分が中学生の時にはこんな課題有りえなかっただろうなと思った。中学校で何十ページのレポート書くなんて。夏休みの読書感想文ぐらいしか文章を書くことは無かったと思う。そして、僕は学生の頃は文章を書くのがすごく苦手で、大嫌いだった。今やってる仕事を考えると信じられないけれど。

そもそも自分が将来仕事をするかどうかすら意識していなかったような気がする。漠然と「コンピュータやそのソフトを売ってるからには、それを作る仕事の人もいるんだろうな」とは思っていたけれども。

この中学生と自分の共通点を挙げるなら、早い段階でパソコンに触れたこととか、部活でパソコンを使ってるとかかな。僕は高校でだったけど、テニス部の練習に音を上げたあと、物理部にもぐりこんで備品のMSXで毎日ゲームで遊んでた。

Googleニュースの新ブログパーツ(ウィジェット)

Googleニュースをブログ等へ貼り付けるウィジェットが案内されている。

対象地域に「日本語」もあるので『「サイボウズ」のニュース』とか作ってみようとしたけど、検索ワードに日本語入れても今のところ何もでてこない。

“office8″とかアルファベットだと出る。

作成はこちらから。