4. RSSファイルの中味
ここでは、RSSの仕様について簡単に見て行こう。
RSSはXML文書
RSSは、XMLによるアプリケーションの一つだ。つまり、XML 1.0の仕様に準拠しないとダメだ。 XML文書だから、ただ一つのルート要素を持つが、それがrss要素となる。 そしてrss要素の内容は、ただ一つのchannel要素から構成される。
rss要素の書き方
rss要素は、必須属性versionを持つ。属性値は必ず「2.0」を指定する。 rss要素はただ一つのchannel要素を持つ。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
channel要素
</rss>
channel要素の書き方
channel要素では、配信元に関する情報および具体的な配信情報を記述する。 channel要素は、内容として3つの必須要素、 title要素、link要素、description要素と配信情報を記述するitem要素から構成される。 なお、item要素の数に制限はない。また、その他にオプションとなる要素がいくつかある。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
title要素
link要素
description要素
その他の要素
複数のitem要素
</channel>
</rss>
title要素、link要素、description要素の書き方
- title要素
-
titile要素には、配信元の名称、通常はウェブサイトの名称を記述する。これをチャンネル名と呼ぶ。
- link要素
-
link要素には、配信元ウェブサイトのURLを記述する。
- description要素
-
description要素には、配信元ウェブサイトの簡単な説明を記述する。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>チャンネル名</title>
<link>配信元ウェブサイトURL</link>
<description>配信元ウェブサイトの説明</description>
その他の要素
複数のitem要素
</channel>
</rss>
その他の要素
- language要素
-
チャンネルで使用している言語コードを指定する。 日本語の場合、「ja」あるいは「ja-JP」を指定する。
- copyright要素
-
著作権表示を記述する。
- docs要素
-
元になったRSSのURLを記述する。通常は、「http://blogs.law.harvard.edu/tech/rss」 を指定する。
上記以外にもwebMaster要素、pubDate要素、lastBuildDate要素など多数の要素が容易されているが、 ここでは省略する。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>チャンネル名</title>
<link>配信元ウェブサイトURL</link>
<description>配信元ウェブサイトの説明</description>
<language>言語コード</language>
<copyright>著作権表示</copyright>
<docs>http://blogs.law.harvard.edu/tech/rss</docs>
複数のitem要素
</channel>
</rss>
item要素の書き方
item要素は、配信情報を記述する要素だ。つまり、新しい配信情報が増えるたびに、 このitem要素が増えることになる。item要素の内容となる要素はすべてオプションだが、 主に記述するものとしては、title要素、link要素、description要素、author要素、pubDate要素などがある。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>チャンネル名</title>
<link>配信元ウェブサイトURL</link>
<description>配信元ウェブサイトの説明</description>
<language>言語コード</language>
<copyright>著作権表示</copyright>
<docs>http://blogs.law.harvard.edu/tech/rss</docs>
<item>
title要素
link要素
description要素
author要素
guid要素
pubDate要素
</item>
</channel>
</rss>
title要素、link要素、description要素の書き方
ここで説明する各要素は、item要素の子要素となるものだ。channel要素の子要素とは別物なので注意しよう。
- title要素
-
titile要素には、配信情報のタイトルを記述する。
- link要素
-
配信情報へのURLを記述する。
- description要素
-
description要素には、配信情報の簡単な説明を記述する。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>チャンネル名</title>
<link>配信元ウェブサイトURL</link>
<description>配信元ウェブサイトの説明</description>
<language>言語コード</language>
<copyright>著作権表示</copyright>
<docs>http://blogs.law.harvard.edu/tech/rss</docs>
<item>
<title>配信情報のタイトル</title>
<link>配信情報へのURL</link>
<description>配信情報の簡単な説明</description>
author要素
guid要素
pubDate要素
</item>
</channel>
</rss>
author要素、guid要素、pubDate要素の書き方
ここで説明する各要素は、item要素の子要素となるものだ。 前述の要素も含めてすべてオプションだが、指定されることが多いものだ。
- author要素
-
author要素には、配信情報の著者名を記述する。通常は、Eメールアドレスを記述する。
- guid要素
-
guid要素は、配信情報を一意に識別する文字列を記述する。 通常は、新しい記事へのURLを記述する。
- pubDate要素
-
配信情報の記述された日時を記述する。ここに記述する日時は、 RFC822形式にする。
曜日, 日 月 年 時:分:秒+0900
曜日は、「Sun,Mon,Tue,Wed,Thu,,Fri,Sat」、日は2桁、月は、「Jan,Feb,Mar,Apr,May,Jun,Jul,Aug,Sep,Oct,Nov,Dec」、 西暦は4桁、時刻はすべて2桁、最後に標準時からの時差(日本の場合は+9000)を指定する。
<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
<channel>
<title>チャンネル名</title>
<link>配信元ウェブサイトURL</link>
<description>配信元ウェブサイトの説明</description>
<language>言語コード</language>
<copyright>著作権表示</copyright>
<docs>http://blogs.law.harvard.edu/tech/rss</docs>
<item>
<title>配信情報のタイトル</title>
<link>配信情報へのURL</link>
<description>配信情報の簡単な説明</description>
<author>配信情報著者名</author>
<guid>配信情報識別文字列</guid>
<pubDate>RFC822形式の日付</pubDate>
</item>
</channel>
</rss>