|
RSS History
|
 |
Kaum ein Experte vermag genau zu sagen, wofür das Kürzel RSS eigentlich steht. Ein kurzer Exkurs in die Geschichte verrät, was es mit den verschiedenen Versionen, in denen RSS durch die Fachwelt geistert, auf sich hat und wie es zum Abkürzungs- und Versions-Wirrwarr überhaupt kam.
Über Jahre hinweg fristete RSS mehr oder minder ein Mauerblümchen-Dasein. Die Wurzeln des XML-Formats für den News-Austausch reichen zurück bis in den Oktober 1997. Seitdem beschäftigt sich das World Wide Web Consortium (W3C) mit dem Thema „Semantic Web“ – dem Bemühen, Internet-Inhalte um strukturelle und beschreibende Komponenten zu ergänzen, die es einem Computer erlauben, Inhalte zu deuten oder gar zu „verstehen“.
Hierzu entwickelte das W3C seit 97 das Ressource Description Framework, kurz RDF. RDF sollte für verschiedene Bereiche XML-basierte Spezifikationen für die Kodierung von Meta-Daten erarbeiten, welche Strukturen und Bedeutungen von Inhalten genormt abzubilden.
Ein Teilbereich hiervon ist RDF Site Summary, kurz RSS, die dazu dienen soll, Web-Seiten in kompakter Form durch Angabe von Titel und URL zu kodieren. Wenn ein Anbieter wie „Der Spiegel“ sämtliche seiner aktuellen Web-Seiten in einer einzigen RSS-Datei darstellt, können sich andere Programme wie etwa Spider von Suchmaschinen etc. die aktuellen Inhalte der Site leichter erschließen und diese exakt und schneller indizieren.
RSS findet seine Wurzeln im Resource Description Framework des W3C
|
Soweit die Theorie. Die Gedanken rund um RSS griff Netscape im Jahre 1999 auf, als die erste Welle der Personalisierung über das Internet hereinbrach. Mit dem „MyNetscapeNetwork“ (MNN) wollte man eine Plattform im Internet schaffen, die es dem Anwender erstmals ermöglichte, sich seine persönliche Startseite zusammen zu stellen. Netscape suchte, dieses Konzept gleichzeitig in Form personalisierbarer „SideBars“ in den damals noch verbreiteten Netscape Browser zu integrieren.
Netscape griff RSS auf, um Betreibern von Web-Site eine Möglichkeit zu geben, Ihre aktuellen Inhalte als personalisierbaren Content in das MNN-Portal zu integrieren. So entstand die Idee, RSS für Content Syndication einzusetzen. Funktional und optisch ähnelte das MNN-Portal anfangs dem heutigen News-Service von Google. Präsentiert wurden jeweils nur die Headlines verlinkt mit dem Content-Angebot des jeweiligen Lieferanten. RSS wurde in diesem Kontext oftmals (fälschlich) als „Rich Site Syndication“ oder „Real Simple Syndication“ übersetzt.
Die Struktur von RSS eignete sich dabei hervorragend, um die gewünschten Headlines und Links ohne redaktionellen Aufwand automatisiert in das Portal zu übernehmen. Im Zuge des MNN Portals veröffentlichte Netscape im März 1999 eine erste Spezifikation als RSS 0.90 und erweiterte diese noch im selben Jahr basierend auf dem "scriptingNews"-Format von Userland Software. Der erweiterte Standard RSS 0.91 umfasste 14 neue Elemente, darunter erstmals ein DESCRIPTION-Tag, das neben Link (TITLE) und URL (LINK) auch einen ausführlichen Teaser-Text zu der Seite beinhalten konnte.
2000 verlor Netscape das Interesse an MNN und stellte die Bemühungen um das RSS-Format ein. Userland Software fiel so die Federführung in die Hand, die RSS aufgriffen und im Dezember 2000 erneut neue Elemente einführte. RSS 0.92 kannte weitere, optionale Tags, die es unter anderem erlauben, einem Eintrag eine Kategorie zuzuweisen, Sub-Elemente innerhalb eines Artikels (ITEM) einzufügen oder Informationen zum Update-Rhythmus des Channels mitzuliefern, so dass RSS-Reader diese Informationen nutzen können, um den Feed zeitgesteuert nur dann neu zu laden, wenn dieser auch tatsächliche neue Informationen enthält.
RDF-Spezifikation zu RSS 1.0 parallel zu Userlands RSS 0.92 veröffentlicht
|
Parallel war man auch beim W3C nicht untätig und trieb das Ressource Description Framework voran. Am 6. Dezember 2000, also kurz vor der erweiterten RSS 0.92 Version von Userland Software, veröffentlichte das W3C RDF in Version 1.0. Der Standard umfasst auch RSS 1.0, das vom Umfang der verfügbaren Elemente her deutlich schlanker gehalten ist, als RSS 0.92 oder 0.91. Zudem weicht der Aufbau einer RSS 1.0 Datei von dem Userland-Standard deutlich ab, womit RSS 0.92 und RSS 1.0 nicht kompatibel sind.
Während RSS 0.91 und 0.92 sämtliche Artikel-Infos der Einfachheit halber als ITEM-Tags innerhalb der Channel-Beschreibung (CHANNEL) führt, sieht der offizielle RDF-Standard vor, innerhalb der Channel-Beschreibung nur eine URL-Auflistung der Artikel zu führen, die dann nach Schließen des CHANNEL-Tags als für sich stehende ITEM-Tags folgen.
Zur Beschreibung des Artikels Innerhalb des ITEM-Tags ist RSS 1.0 von Hause aus nur spärlich mit Elementen ausgestattet. Neben den Standards LINK und URL kennt RSS 1.0 noch das DESCRIPTION-Tag. Tags für weitere Metadaten sind bewusst aus dem eigentlichen Standard ausgegliedert und in Modulen gekapselt.
Mit diesen Modulen lässt sich RSS 1.0 aufgabenbezogen um weitere standardisierte Elemente erweitern. Derzeit stehen zahlreiche Module zur Verfügung, von denen drei (Dublin Core, Syndication, Content) bereits offiziell standardisiert sind. Daneben gibt es eine Menge weiterer Module für spezifische Inhalte wie etwa Aktieninformationen, Wetterdaten etc.
Diese können innerhalb der Document Type Definition, die am Anfang jeden RSS-Dokuments steht und auf die verwendeten Name-Spaces verweist, eingebunden werden. Das Modul Dublin Core stellt einen sehr umfangreichen Satz von zusätzlichen Metadaten zur Verfügung, mit dem neben Autor, Zeitpunkt der Veröffentlichung, Uhrheberrechten etc. auch Sprache, Kategorisierung des Artikels usw. in die RSS-Datei eingebunden werden können.
Das Modul Syndication stellt Tags zur Kennzeichnung der Update-Preioden für den Feed zur Verfügung (ähnlich RSS 0.92) und Content erlaubt es, beliebige Elemente einer Web-Seite als CDATA-Objekt in die RSS-Datei einzubetten. So lassen sich etwa HTML-formatierte Textblöcke in eine RSS-Datei einbetten.
Insgesamt ist der RSS 1.0 Standard zwar vom Aufbau und Handling her etwas komplexer, als RSS 0.9x, dafür aber aufgrund der modularen Struktur und der verfügbaren, umfangreichen Module wesentlich leistungsfähiger.
Im Bereich Content Syndication konnte sich RSS 1.0 noch nicht durchsetzen
|
Insbesondere eröffnet RSS 1.0 Anwendungsfelder wie strukturierte Archivierung, Document Retrival oder auch Payed Content Services, die RSS 0.9x nicht zu leisten vermag. Dennoch konnte sich im Bereich der reinen Content Syndication der offizielle Standard des W3C noch nicht durchsetzen.
Für den reinen News-Austausch erschien vor allem die Trennung von Channel-Block und News-Items zu kompliziert. So kam es, dass die meisten RSS-Feeds, die in den USA bereits für das MNN oder für Syndication bei Userland geschrieben wurden, nicht auf den Standard 1.0 angepasst sondern entsprechend RSS 0.92 erweitert wurden.
Als man auch hier an die Grenzen stieß, folgte im Sommer 2002 die Spezifikation für RSS 2.0, wobei hier als Abkürzung erstmals der Begriff „Really Simple Syndication“ auftaucht – wohl um nicht mit der W3C und Ihrem RDF-Standard in Konflikt zu geraten. RSS 2.0 erweitert RSS 0.92 um einige weitere optionale Tags und ist somit zu RSS 0.91 und 0.92 kompatibel. Da auch in RSS 2.0 sämtliche ITEM-Tages innerhalb der Channel-Beschreibung stehen, ist das Format jedoch nicht kompatibel zu RSS 1.0.
Welches RSS-Format soll man verwenden?
|
Wenn RSS ausschließlich für die Content-Syndication genutzt wird und lediglich zur Integration von Headlines und Teasern in fremde Web-Sites dienen soll, ist das RSS 2.0 Format leichter zu realisieren. Hingegen ist RSS 1.0 deutlich leistungsfähiger und flexibler und erlaubt es dank der Module, nahezu beliebigen Content innerhalb eines RSS-Feeds einzubetten. So lassen sich etwa auch URLs auf Grafiken zu jedem ITEM-Tag übergeben oder umfangreiche Metadaten für die Archivierung oder zur Kennzeichnung von Urheberrechten einbinden. Vor dem Hintergrund, RSS im Unternehmen etwa auch für Retrival-Anwendungen oder intelligente Web- und Knowledge Management Anwendungen zu nutzen, ist RSS 1.0 deutlich der Vorzug zu geben.
Die Tools von infoMantis nutzen und verstehen sowohl RSS 2.0 (und damit auch die älteren 0.9x Formate) wie auch RSS 1.0. Um sämtliche Features wie etwa die Integration von Bildern für den interaktiven News-Schoner iSaver auszureizen, empfehlen wir die Verwendung von RSS 1.0.
|