カテゴリー
データ

英語のGoogle Newsで出てくるニュース社/ブログのリスト

Googleニュースの公式ブログで興味深いリストが公開されています。この前のアメリカ軍によるパキスタンでのビン・ラディン殺害のニュースを題材として、このニュースを取り上げてGoogleニュースに掲載されたニュースサイトや […]

Binladinnewsongooglenewsjapan

Googleニュースの公式ブログで興味深いリストが公開されています
。この前のアメリカ軍によるパキスタンでのビン・ラディン殺害のニュースを題材として、このニュースを取り上げてGoogleニュースに掲載されたニュースサイトやブログの長大なリスト、5日間でなんと15万件のニュース記事のデータです。
Google公式ブログは、Googleニュースがいかに世界中のいろいろな言語のニュースをカバーしているか、というのを誇示するためにこのデータを出したと思われます。しかし、Digital Inspirationブログで指摘しているのが、このリストこそ、一般公開されていない「Googleニュースが集めているニュースのソース一覧」に近いのではというもの。
Googleブログの記事中には、世界中のニュースの例として朝日新聞・読売新聞の記事も例示されていますが、公開された15万件のリストの中には日本語のニュースは一個、ロケットニュースのものがあるだけです。そういうわけで、Googleニュースの日本版が集めているサイトの一覧は取れないのですが、英語のタグのついたURLからドメインを抜き出せば、Googleニュース英語版で集めている主要な(=ビン・ラディン殺害という大ニュースを一件でも扱ったニュースサイト・ブログ)が列挙できそうだ、ということ。オリジナルデータから言語とドメイン名だけ残したリストはDigital Inspirationが作ってくれています。
# これだけの大事件でも、ジャンルが違ってて一件も取り上げないようなブログもあるとは思うので、完璧なリストとは言い切れませんが。
他の言語のものも含めて、Googleが苦労して作った、各国の「それなりに信頼できそうな」ニュースソースのリストだと思うと、各国のメディア/ブログメディアの資料としても役に立つかもしれません。個人でやっている英語ブログのAsiajinでも、Google Newsで記事が参照されるかどうかはウォッチしていて、有名な技術ブログは掲載されるたびに少しずつ覚えてはいるのですが、まったく情報がないところから紹介されたり、メール等が来たりしたときにも、この手のリストは使えそうです。