日記など 2002年から

福祉の話題が多いです。東京都の西部・多摩地区が行動範囲です。

RSSについてざっと調べる

そのまえに、RDF

RSSやるまえに、何かと縁の深いRDFについて。
これは、Web上のモノとコトを

サイト "http://d.hatena.ne.jp/Araki"(主語)は、
id:Araki(目的語)によって、書かれている(述語)

という主語、述語、目的語の3つで表現する枠組み(RDFは、Framework)。「サイトA(主語)の作者(述語)はid:and_then(目的語)だ」っていう説明が気持ち悪いので動詞にしました(注:うなぎ文)。

RDFは、ウェブ識別子(Uniform Resource Identifier(URI)と呼ばれる)を使用して事物を識別し、シンプルなプロパティーとプロパティー値で資源を記述するという考えに基づいています。
これによって、資源を表すノードとアークのグラフや、そのプロパティーと値として、資源に関するシンプルなステートメントを提供できるようになります。
RDF入門

「シンプルなプロパティーとプロパティー値で資源を記述する」のほうが自然言語の話より分かりやすい。リソース(主語)とプロパティー(述語)は必ずURIで表現される。URI(意訳:統一Web資源識別子)はWeb上のリソースを識別する語?で、場所にアクセスできるURLと、存在しなくても名前だけを識別するURNがある。よく聞く「Dublin Core - Wikipedia」はWebにある文書の「作者、日時、タイトル」といったメタ情報を標準化しよう絞り込んだもの。

http://purl.org/dc/elements/1.1/subject

と書けばURIとなり、「メールの題」でもなく「被験者」でもなく「DublinCoreにおける主題、テーマ」を表す。

URI:飛んでみたらちゃんとスキーマが置かれていました。。そういうものなのか・・
5/30-訂正:やはりURNのようだ。転送先のDCMI Home: Dublin Core® Metadata Initiative (DCMI)に"DublinCore"そのものをRDFで要約したものがある。"メタデータ記述語彙"が自分自身のメタデータを記述している。

The Dublin Core Element Set v1.1 namespace providing access to its content by means of an RDF Schema

RSS 0.9

ネットスケープ社がRDFを使って、ポータルサイトの情報を記述したもの。"RDF Site Summary"

RSS 0.91

RDFを止めて、著作権などを加えた独自拡張のXML定義を使う "Rich Site Summary"
コンテンツ配信のメディアとして注目されるが、独自拡張によって標準データ形式としてのメリット薄れる

RSS 1.0

RDF復活。コア要素と拡張モジュール要素に分ける。

公式なモジュールとして、Dublin Coreモジュール、Syndicationモジュール及びContentモジュールが定められた。これによりRSS 0.9の不満であった語彙の乏しさを解消させ、またコンテンツ配信手段としてRSS 1.0を採用する道を残すものとなった。
RSS - Wikipedia

RSS 2.0

拡張の自由度があるかわりに複雑化したRSS(1.0)をシンプルなものにするため、RSS 0.91をもとに作られたフォーマット(RSS0.92, 0.93, 0.94などがあった)を統合したもの。 RDF止める。"Really Simple Syndication"

Blog戦争:RSSはどこへ行く? - CNET Japan

提唱者のDave Winner先生が「これ以上の拡張を凍結すると宣言」した、展開名どおり「実に(ストイックに)シンプルな要約配信」。RSS 1.0の売りであるxml:namespacesを使ったモジュール拡張こそ、来るべきSemantic Webに欠かせない「相互運用性」を阻害するから許せないという立場。

RSS分派の仁義無き抗争の歴史は1章 The Atom Project - RSSの興隆からAtomの誕生に詳しい。

Atom

現在でもnamespacesたくさんのRSS1.0をよく見かけるが、RDF構文がとっつきにくいのとモジュールの多さが敬遠されて、2.0のようにシンプルなメタデータを求める声が大きかったようだ。しかし、同じシンプルでも、相互運用性を保つため単純なまま凍結されたRSS2.0と、より簡単にコンテンツ配信できるメディアが欲しい人々の向かう方向は違った。

食べ物のパイという意味と「誰にでも簡単」という意味も持つ"Pie"が元の名前だったのが、予約済みだったということで、投票の結果Atomという名前になった。ココロは同じく「原子のように、もっとも単純で、それ以上分割できない単位」ということらしい。

Formerly Echo - Pie/EchoがAtomになるまで

特徴1:あくまで「サイトの概要」で、コンテンツ自体は直接サイトに取りに来てもらうRSSと異なり、コンテンツそのものをサイトと独立に配信することを目的としている。

  • XHTMLをエスケープせず直接書き込める
  • 要約文と本文を分けて記述
  • 画像などファイルデータをBase64で書き込める。

特徴2:特定のベンダや人間に属していない。

  • IBMのSam Ruby氏や、Sun MicrosystemsのTim Bray氏を中心にした大勢のボランティア
  • IETFにてAtomの標準化が進められてRFCも作成されている

参考URL:

Atom 配信フォーマット The Atom Syndication Format

RSSと同じ(要約にとどまらないが)配信のためのAtom
AtomのURLをサイトのLINK要素に書き込むことでブラウザなどが自動的にAtomを検出できる。例:


2章 Atomフォーマット - The Atom Syndication Format
Atom 出版プロトコル The Atom Publishing Protocol

はてなダイアリーでも確か使われているAtomPP。なんでAtomなのかよく分かってなかった。Atomが生まれた経緯を知ると、あらゆるWebコンテンツ(まあ今はブログかな)を標準化された形式で配信できるということは、逆にユーザーからあらゆる配信サービスに対して記事を投稿できる統一形式にもなる。

補足

RSSとAtomに統合の見通し--配信フォーマット戦争で停戦の申し入れ - CNET Japan
ついに手打ちか、ってずいぶん古いなあ。最近あまりニュースが無いようですがうまく行ってるのかな。

RSSについて一度目を通してみたかったので、日記に書いて読まれる緊張感に尻をたたかれながらサイトを巡って見ました。確認せず書いているのでリンクをたどって確かめてくださいね。