2007年2月19日月曜日

研究について

研究編:webで氾濫している情報を集めてみる

webで氾濫している情報を集めてみる。


http://japan.cnet.com/column/cjic2005/story/0,2000055908,20085564,00.htm
これは、CNETでRSSで情報を配信することの優位性についての記事だ。

ちなみに、このブログはmixiというSNSサイトにも外部ブログとしてRSSで日記を配信しているのだが、このRSSという技術最近になって聞き始めた方も多いと思う。
このRSSとはそのページのメタデータである。

さて、このメタデータっていうのは、いったい何のか?こういう風に思われるだろう。そこで少し解説。 メタデータというのは広く言えば、実は、生活の中で昔から使っていたものなのだ。 というのも、あるものに対しての抽象度の高い部分をかいつまんでのデータつまり、そのデータに対してのデータ わかりやすく言えば、データのユニークな部分を付加的情報としてつけている。例としてはカテゴリー、製造年月日、制作者、商品番号などである。 つまり本体を見なくても一通りのことがわかるようにメタデータというのは、作られている。

Atom/RSSについて


RSSにおいては、色々バージョンがあったことも普通一般の利用者から見ればどうでもいいことで、知る由もないことだろうが、いちおうリンクをはっておきます。
http://www.intertwingly.net/slides/2003/seybold/6.html
私はRSSについて明るい方ではない。しかし、上記のサイトを参照された方でもバージョンがあがるにつれてその階層構造は、細かくそして、要素が増えていることがわかるだろう。これは拡張性の為にバージョンをあげている訳ではない。
RSSとは - e-words
上記のサイトより
「0.9-2.0系列」(Really Simple Syndication)と「1.0系列」(Rich Site Summary)の2系統に分裂している。
とある。このページになぜ2系統になったのかも書かれている。 ここで注意しておかないといけないのは歴史ではなく、RSSには、2つの流れがあり、この2つには互換性がないということだ。 主流になっているのはどちらのほうか?と聞かれたらどちらの方ということはわからないですが。。。でも、少しでも多くの人に対応させるという事になると、きっと、2つ分のRSSをはかせられるような構造にさせるしかないのかもしれない。
実は、AtomとRSSの違いってよくわかってないわかっているのは、AtomはRSSのあるバージョンをもとにつくられた規格って言うこと。

さて、なぜここで配信用の規格について書いたかというと、この二つの規格は配信用の規格であることそして、最大の特徴は更新されたもののトピックだけ配信する情報としてのせられるという訳。 つまり、RSSだけみていればそのページの何が更新されたのか?ということがわかるということだ。これにより、うけて側がチェックする手間が省けるっていうことね。
RSS,Atomについては、後々にでも書くとしてますか。

研究の対象となるのは、WEBにあるドキュメントの情報って言うのはどこに気が向いているのかということ。 すべてのドキュメントを一からあさるのではなくあさってくれるのはコンピュータになる訳だが、これをどういう風にすれば効率的に、集められるのか?っていうこと。 問題としてあげられるのはブログ等を書いている人の層だ。 これは人数からみるに利用している人間っていうのは下が10代上が50代だろう。 無論、この世代の絞り込みだって上の方はかなり少ないだろうが。
確かに情報的には日本から見れば一部の情報かもしれない。しかし、情報を配信している人間はコンピュータリテラシーに明るい人間か、何らかしらの情報を配信したい人間のはずだ、それを集めればきっと有益な情報になるに違いない。そして、この情報はユーザからリアルタイムで得られる情報としてかなり信用性のあるものであるに違いないからビジネスに使えるはずだ。というのがこの研究をしたいと思ったきっかけだ。