XSLT
Aus 4webmaster.de
|
XSLT ist eine Programmiersprache zur Transformation eines beliebigen XML-Dokuments in eine andere Struktur. Der volle Name lautet XSL Transformations. XSLT ist Teil von XSL Extensible Stylesheet Language, nämlich die Transformationskomponente, wie das T andeutet. XSLT, XSL-FO und XPath bilden zusammen die Grundpfeiler für XSL.
XSLT-Programme werden XSLT-Stylesheets genannt. Sie sind nach den Regeln des XML-Standards aufgebaut.
Spezielle XSLT-Prozessoren lesen XSLT-Stylesheets ein und transformieren ein oder mehrere XML-Dokumente nach den Stylesheet-Regeln in das gewünschte Ausgabeformat. Solche XSLT-Prozessoren sind in vielen modernen Webbrowsern integriert (z.B. Internet Explorer seit Version 6, Mozilla Firefox, Opera ab Version 9). Der XSLT-Prozessor lässt sich aber auch in den Webserver integrieren. Dann geschehen die Transformationen vor der Auslieferung der Seite. So können auch ältere Browser oder Browser auf Mobilgeräten diese Seiten darstellen.
Entwickelt wurde XSLT ursprünglich von James Clark (XSLT 1.0, XSLT 1.1), für die derzeitige Weiterentwicklung ist Michael Kay verantwortlich (der auch den SAXON XSLT-Prozessor herausgibt). Seit dem 23. Januar 2007 ist XSLT 2.0 eine Recommendation des W3C und hat damit die seit 1999 gültige Version XSLT 1.0 abgelöst.
Geschichte
Ursprünglich sollte mit XSL eine DSSSL-artige Sprache in XML-Syntax entstehen. Schnell war jedoch klar, dass eine solche Sprache eigentlich aus drei interagierenden, aber unabhängig voneinander einsetzbaren Bestandteilen besteht:
- Einer Sprache für die Beschreibung eines Dokuments als Baum mit Formatierungsanweisungen und Stilangaben: XSL Formatting Objects (XSL-FO)
- Einer Sprache für die Transformation eines beliebigen XML-Dokuments in einen anderen Baum, z. B. einen in XSL-FO: XSLT
- Einer Sprache für die Adressierung von Baumbestandteilen: XPath
Funktionsweise
Die Sprache XSLT beschreibt die Umwandlung eines XML-Derivats (auch XML-Dialekt oder XML-Anwendung genannt) in ein anderes Dokument. Diesen Vorgang nennt man Transformation. Das resultierende Dokument entspricht meist der XML-Syntax, es können aber auch andere Textdateien und sogar Binärdateien erstellt werden.
Dazu werden die XML-Dokumente als logischer Baum betrachtet: Die Quellbäume der zu transformierenden Dokumente und die durch die Transformation entstehenden Zielbäume der zu erzeugenden Dokumente.
Eine Transformation besteht aus einer Reihe von einzelnen Transformationsregeln, die Templates (deutsch „Schablonen“) genannt werden. Ein Template besitzt ein auf XPath basierendes Pattern (deutsch „Muster“), das beschreibt, für welche Knoten es gilt, und einen Inhalt, der bestimmt, wie das Template seinen Teil des Zielbaums erzeugt.
In einem XSLT-Dokument kommen also an Sprachen und XML-basierten Technologien mindestens vor:
- XML als Basis für XSLT
- XSLT selbst (XML-basiert)
- XPath / XSLT Patterns
- Die Sprache(n) des Quell-Dokuments (XML-basiert, z. B. DocBook)
- Die Sprache(n) des Ziel-Dokuments (häufig XML-basiert, z. B. XHTML (ab XSLT 2.0), XML, XSLT selbst, aber auch HTML oder RELAX NG, Text-Format auch möglich)
- XML-Namespaces zur Unterscheidung der einzelnen verwendeten Sprachen
Sowie ab XSLT 2.0:
- Datentypen aus XML Schema
- XHTML
Template Rules und Conflict Resolution
Template Rules (deutsch „Schablonen-Regeln“) werden immer dann angewendet, wenn eine bestimmte Bedingung passt. Das folgende Beispiel schließt den Inhalt aller Titel („title“-Tags) in „em“-Tags ein, egal wo sie im Dokument vorkommen, und lässt den Rest unberührt.
...
<xsl:template match="//title">
<em>
<xsl:apply-templates/>
</em>
</xsl:template>
...
„<xsl:apply-templates/>“ transformiert das aktuelle Element mittels sämtlicher dafür anwendbarer Regeln.
Conflict Resolution (deutsch „Konfliktauflösung“) wird dann benötigt, wenn ein Knoten zu mehreren Template Rules gleichzeitig passt. In solchen Fällen gelten die folgenden Regeln.
- Importierte Regeln haben niedrigere Priorität.
- Wenn ein Attribut priority gegeben ist, wird es berücksichtigt.
- Spezifischere Patterns haben höhere Priorität als weniger spezifische. So ist beispielsweise der Test, ob irgendein Knoten existiert, weniger spezifisch als ein Test für einen Knoten mit konkretem Namen.
- Wenn es mehrere gleichberechtigte Regeln gibt, ist das ein Fehler, und wird vom XSLT-Parser als Meldung ausgegeben.
Sortierung und bedingte Ausgabe
Um Elemente zu sortieren, kann ein „for-each“-Tag mit einem „sort“-Tag kombiniert werden. Die Schleife läuft dann nicht in der Reihenfolge der Knoten des Originaldokuments sondern in alphabetischer oder numerischer Reihenfolge. Im folgenden Beispiel werden alle Buch-Elemente aufsteigend nach ihrem Preis sortiert.
<xsl:for-each select="buch"> <xsl:sort select="preis"/> </xsl:for-each>
XSLT bietet sowohl binäre Entscheidungen mittels des „if“-Tags als auch mehrfache Entscheidungen über das „choose“-Tag. Das folgende Beispiel gibt genau dann ein Sternchen aus, wenn das Attribut „nationality“ des Elements „author“ den Wert „U.S.“ hat.
<xsl:if test="author/@nationality='U.S.'">* </xsl:if>
Um mehrere Fallunterscheidungen zu treffen, kann die Kombination aus „choose“- und „when“-Tags verwendet werden.
<xsl:choose> <xsl:when test=...> <xsl:when test=...> <xsl:when test=...> </xsl:choose>
Anwendungsgebiet
Für XSLT gibt es zwei Hauptanwendungsgebiete.
- POP (Presentation Oriented Publishing) bezeichnet die Transformation zum Zwecke der Darstellung. Mit unterschiedlichen Stylesheets können die Daten in XHTML, XSL-FO, SVG Scalable Vector Graphics, SMIL Synchronized Multimedia Integration Language, DocBook und viele andere Formate umgewandelt werden. Das Zieldokument muss hierbei nicht zwingend ein XML-Dokument sein. Das ursprüngliche semantische Markup wird dabei durch ein Stil-bezogenes Markup ersetzt.
- MOM (Message Oriented Middleware) bezeichnet die Transformation zum Zwecke des Datenaustausches. Da XML lediglich ein Sprachkonzept zur Entwicklung von Sprachen bildet, genügt es nicht, dass zwei Systeme (z. B. Programme) XML beherrschen, um gegenseitig Daten austauschen zu können. Sie müssen die gleiche XML-basierte Sprache verwenden. In dem häufigen Fall, in dem die Systeme nicht die gleiche XML-basierte Sprache verwenden, wird gerne XSLT eingesetzt, um mit Hilfe von Transformationen Übersetzer von der einen Sprache in die andere zu entwickeln.
Anwendungsbeispiele
- Statistische Daten liegen als XML vor (z. B. aus der Datenbank) und werden mit Hilfe unterschiedlicher Transformationen unter anderem aufbereitet als Vektorgrafik in SVG, als bloßer Text, als Tabelle in XHTML, als PDF (über den Zwischenschritt XSL-FO) oder auch Excel (durch SpreadsheetML ab Office XP).
- Für eine Website werden die XHTML-Dateien oder XML-Dateien erstmals ohne Layout geschrieben und erhalten anschließend das Layout mit Hilfe einer Transformation. Der Vorteil ist dabei ähnlich dem eines klassischen CMS: Um das Layout zu ändern, ist es nicht notwendig, alle XHTML-Seiten zu ändern; stattdessen ändert man das Stylesheet und transformiert neu. Das XML Publishing System Apache Cocoon beispielsweise verwendet XSLT-Stylesheets hierfür sehr intensiv.
Derzeit wird XSLT wohl am häufigsten dazu verwendet, einfach XML-Dokumente durch Transformation in XHTML-Dokumente inkl. CSS-Auszeichnungen umzuwandeln, die in Webbrowsern darstellbar sind.
Alternativen zu XSLT
DSSSL
Eine mögliche Alternative zu XSLT ist DSSSL, das man auch als Vorläufer von XSLT betrachten kann. Der wohl größte Vorteil von XSLT gegenüber DSSSL ist seine XML-basierte Syntax. Somit kann jeder XML-Editor automatisch auch für XSLT eingesetzt werden, außerdem gelten die Syntax-Regeln von XML (Wohlgeformtheit, Gültigkeit) damit auch für XSLT. Dadurch ist es möglich, dass XSLT sich selbst bearbeitet, man kann also Transformationen zur Erzeugung und Bearbeitung von Transformationen entwickeln.
MetaMorphosis
MetaMorphosis ist ebenfalls von DSSSL inspiriert. Im Gegensatz zu XSLT ist es ein „target driven“ Prozessor. Dabei wird der zu erstellende Zielbaum konstruiert. Die Regeln beschreiben nicht, wie die Eingabedatei verarbeitet werden soll, sondern, wie die Ausgabedatei konstruiert werden soll. Der Prozess beginnt mit einer virtuellen Regel „!begin“ mit der der Transformationsprozess beginnt. Die Transformationsregeln beschreiben, wie die Knoten gefüllt werden sollen. Dabei werden Abfragen in die Quellbäume (es können im Gegensatz zu XSLT mehrere sein) wie auch in die bis dahin aufgebauten Zielbäume formuliert. Die Abfragesprache ist ein mengenorientierter Ausdruck, der alle Eigenschaften der Knoten auslesen und auch setzen kann. Erzeugte Knoten können nachträglich beliebig manipuliert werden.
Weitere Merkmale von MetaMorphosis unterstützen den industriellen Einsatz: flexible Speicherverwaltung für sehr große Dokumente, Aufbau von Hilfsdatenstrukturen (getindex, putindex) zum schnellen Zugriff, Plugin-Architektur, API für C++, C#, Java, die Möglichkeit dedizierte Frontends und Backend zu implementieren (in C++ wie auch in der MetaMorphosis-Skriptsprache).
Generische Programmiersprachen
Eine grundsätzliche Alternative zu XSLT besteht in der Möglichkeit, solche Transformationen in jeder beliebigen Programmiersprache (z. B. Java, C++ oder Perl) abzufassen. XSLT kann dabei jedoch bei Einhaltung bestimmter Voraussetzungen eine gewisse Garantie für wohlgeformte und unter Umständen sogar gültige Zieldokumente gewähren. Außerdem ist die Entwicklung einer Transformation in XSLT in der Regel mit erheblich weniger Aufwand verbunden als die Entwicklung einer Transformation in einer generischen Programmiersprache.
Es ist auch möglich, beides zu koppeln: Die eigentliche Transformation geschieht dann per XSLT, jedoch innerhalb des XSLT-Stylesheets werden selbstdefinierte Funktionen zur Stringmanipulation aufgerufen. Das (z. B. in Ruby oder Python geschriebene) Programm besteht dann aus diesen selbstdefinierten Funktionen und dem Aufruf einer XSLT-Funktion, die den Stylesheet und die eigenen Funktionen als Parameter erhält.
CSS
Häufig wird CSS als Alternative zu XSLT genannt. CSS ist jedoch nur scheinbar eine Alternative zu XSLT, da es sich bei CSS lediglich um eine Formatierungssprache handelt. CSS beschreibt lediglich, wie die Bestandteile eines Baumes (akustisch oder visuell) zu formatieren sind, während XSLT den Baum radikal ändern kann oder als Ergebnis Dokumente liefern kann, die nicht auf XML basieren. So kann man mit XSLT z. B. automatisch Inhaltsverzeichnisse, Indizes, Link-Listen und komplexe Berechnungen erstellen, nicht jedoch mit CSS. Mit XSLT ist es zudem möglich, Ergebnisse zu erzeugen, die CSS als Formatierungssprache verwenden.
Beispiele
Ein Inhaltsverzeichnis erzeugen
Folgendes XSLT erzeugt ein einfaches Inhaltsverzeichnis für eine XHTML-Seite mit Überschriften:
<?xml version="1.0" encoding="iso-8859-1"?> <xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform" xmlns:html="http://www.w3.org/1999/xhtml" xmlns="http://www.w3.org/1999/xhtml" exclude-result-prefixes="html" > <xsl:output method="xml" doctype-system="http://www.w3.org/TR/xhtml11/DTD/xhtml11.dtd" doctype-public="-//W3C//DTD XHTML 1.1//EN" /> <xsl:template match="html:body"> <xsl:copy> <xsl:apply-templates select="@*"/> <h1><xsl:apply-templates select="//html:title//text()" /></h1> <h2 id="toc">Inhaltsverzeichnis</h2> <ul> <li><a href="#toc">Inhaltsverzeichnis</a></li> <xsl:for-each select=".//html:h2"> <li> <xsl:if test="not(@id)"> <xsl:message>Achtung: Kann ohne Id keinen Link erzeugen</xsl:message> </xsl:if> <a href="#{@id}"><xsl:apply-templates/></a> </li> </xsl:for-each> </ul> <xsl:apply-templates/> </xsl:copy> </xsl:template> <xsl:template match="node()|@*"> <xsl:copy> <xsl:apply-templates select="@*"/> <xsl:apply-templates/> </xsl:copy> </xsl:template> </xsl:stylesheet>
XSLT-Prozessoren
Folgend eine Auflistung von bekannten XSLT-fähigen Prozessoren und Bibliotheken.
- Xalan-C XSLT-Prozessor der Apache Software Foundation, frei
- Xalan-J dito, in Java, frei
- Saxon XSLT and XQuery Processor — by Michael Kay; open source version available, supports extentions written in Java or C#
- TransforMiiX (C++, frei)
- xmlstarlet (C, multiplattform, frei)
- XT (Java, ursprünglich von James Clark, frei) http://www.jclark.com/xml/xt-old.html
- Sablotron (C++, multiplattform, frei)
- libxslt/xsltproc (C, frei)
- PHP XSL Funktionen (PHP 5, basiert auf libxslt, frei)
- Microsoft XML Core Services (Windows, nicht frei)
- .NET Framework 1.0/1.1 (System.Xml.Xsl.XslTransform) und 2.0/3.0/3.5 (System.Xml.Xsl.XslCompiledTransform)
- Unicorn XSLT Processor (Windows, nicht frei, nützliche Zusatzwerkzeuge)
Weblinks
- XSLT FH Wedel
- XSLT nochmal anders
- XSL Transformations (XSLT) Version 1.0 (Normative Version) (englisch)
- XSL Transformations (XSLT) Version 1.0 (nicht offizielle Übersetzung)
- XSL Transformations (XSLT) Version 2.0 (englisch)
- Das XML-XSLT-Seminar, Kapitel XSLT – Einführung in XSLT
- Tutorial zum Thema XSLT
- Ausführliches Beispiel (Wörterbuch)
- weiterführender Artikel zu den Verbesserungen und Erweiterungen in XSLT 2.0
- SAXON-Dokumentation mit XSLT und XPATH-Beschreibung
- selfhtml.org – XSLT-Anleitung
- XSL FAQ (englisch)
Dieser Artikel basiert auf dem Artikel XSL_Transformation aus der freien Enzyklopädie Wikipedia. Er steht unter der GNU-Lizenz für freie Dokumentation. In diesem Wiki und / oder der Wikipedia ist eine Liste der Autoren verfügbar.