2005.12.14 (水)

[diary ]
BLOG360のキーワードは書名が多い?

blogを収集・分析するサイトがいくつもできてますが、また新手が登場しました。

RSS収集・分析サイト「BLOG360」開設、ブログで話題のキーワードを表示 - Internet Watch -

BLOG360は、BlogPeopleなど公開されたPingサーバーの更新情報をもとにRSSを収集している。4月から収集・分析を始めており、現在までに累計で約35万のブログから約756万のRSSを収集した。集めたRSSに対しては形態素解析などを行ない、キーワードの候補を抽出。カギ括弧などにより、ブログ作者が強調したと思われるキーワードなどに対して、独自のアルゴリズムで重み付けが行なわれるという。
BLOG360

サイトを少し見てみましたが、「ほっとキーワード」は面白いですね。 technoratiで掲示している単語は検索語ですが、こちらはblogに書かれた語ですから、傾向の違いがありそうです。

とはいえ、「今日のほっとキーワード」は書名やTV番組タイトルがやけに多いように感じました。カギ括弧で囲まれたものに重みを付けているというより、そればかり取り出しているように思えます。人名や時事的な話題などがあまり出てきていないのでそういう印象を受けるのかもしれません。

[BCY:13.04km]
   

トラックバック(0)

トラックバックURL: http://blog.bibinko.com/mt-bin/mt-tb.cgi/974

コメントする

アーカイブ

Photo Calendar

最近のコメント

最近のトラックバック