Dies ist eine alte Version. Zeitpunkt der Bearbeitung: 02:53, 28. Sep. 2007 durch Björn Klippstein (Diskussion | Beiträge).
(Unterschied) ← Nächstältere Version | Aktuelle Version (Unterschied) | Nächstjüngere Version → (Unterschied)

Was ist XML

Klippstein IT Service

Aus 4webmaster.de

Wechseln zu: Navigation, Suche

Was kann ich mit XML machen?

  • Zahlreiche Dokumentenformate basieren auf XML. Das Verständnis von XML ermöglicht es, diese Dokumentenformate möglichst einfach zu verwenden, zu validieren und in andere Formate zu transformieren.
  • Mit XML können Sie eigene Dokumentenformate definieren, die dann von anderen genauso einfach verwendet werden können.
  • Vielleicht wollen sie mit XML selbst gar nichts machen, sondern nur eine der zahlreichen XML-basierten Sprachen nutzen.

XML bedeutet »Extensible Markup Language«, auf deutsch etwa „erweiterbare Auszeichnungssprache“.
Was aber ist eine Auszeichnungssprache?

Etwas sehr Altes auf jeden Fall. Schon ihre Deutschlehrer benutzten eine Auszeichnungssprache, um die Fehler in ihren Schulheften zu markieren. Ein senkrechter Strich bedeutete Fehler, ein V-ähnliches Zeichen bedeutete, dass hier etwas eingefüht werden müsste, usw. Auch die Setzer beim Buchdruck bedienten sich einer Auszeichnungssprache. Damit kennzeichneten sie Textpassagen, die besonders formatiert werden sollten. Sie verwendeten dafür einen festgelegten Satz von Symbolen, die jeder Setzer verstand.

Mit dem Aufkommen digitaler Formate entstanden so viele neue Auszeichnungssprachen, dass es zum Problem wurde. Jedes Textverarbeitungsprogramm speicherte seine Daten in einem anderen Format. Jede Textverarbeitung kennzeichnete z.B. einen kursiv darzustellenden Text anders. Mit der Folge, dass die Formate zueinander inkompatibel waren und es oftmals auch schwer war, einen benutzbaren Konverter zu bauen.

XML ist nun ein universelles Syntaxschema, das für alle Auszeichnungssprachen verwendet werden kann. XML-basierte Auszeichnungssprachen sind relativ leicht ineinander konvertierbar. Außerdem ist XML sowohl für Menschen als auch für Computer lesbar, relativ einfach lesbar sogar.

Aber was ist XML denn nun genau?
Ist es ein universelles Dokumentenformat? Oder ist es eine Sprache?

Beides. Die Begriffe sind gar nicht so weit voneinander entfernt, wie es zunächst scheint. Jedes Dokumentenformat kann immer auch als Sprache interpretiert werden. Das Dokumentenformat eines Textverarbeitungsprogrammes beschreibt z.B., welcher Text normal und welcher kursiv dargestellt werden soll. Z.B. so:

Bla Bla Blubb Blubb <kursiv>Guten Tag</kursiv> Bla Bla Blubb Blubb

Das kann man so interpretieren:

„Bla Bla Blubb Blubb “ ist normaler Text, „Guten Tag“ ist kursiver Text, „ Bla Bla Blubb Blubb“ ist normaler Text.

Man kann aber den gleichen Quelltext auch als Folge von Anweisungen auffassen:

Schreibe „Bla Bla Blubb Blubb“!
Schreibe „Guten Tag“ in kursiver Formatierung!
Schreibe „Bla Bla Blubb Blubb“!

Die Frage, ob es sich um ein Dokumentenformat oder um eine Sprache handelt, hängt nur von der Perspektive ab, die sie einnehmen. Ein Dokumentenformat ist eine Sprache.

Und wie war das mit der Metasprache?
XML ist doch eine Metasprache, liest man überall.

Meta bedeutet, dass man eine Aussage auf einer höheren Ebene macht als auf der aktuellen Ebene. Eine Metasprache ist daher eine Sprache, mit der sich eine andere Sprache beschreiben lässt. Der Grund, warum XML manchmal eine Metasprache genannt wird, ist die Universalität von XML. Wenn sie etwas in XML schreiben, müssen sie zunächst das Vokabular und die Grammatik klarstellen. Vokabular und Grammatik sind nämlich (fast) frei wählbar in XML. Sie können ein ganz persönliches Vokabular erfinden (wie in obigem Beispiel mit dem kursiven Text) oder sich auf ein bereits vorhandenes Vokabular+Grammatik beziehen (und damit einen fertig definierten XML-Sprachdialekt verwenden, wie z.B. XHTML oder SVG).

XML-Dokumente enthalten normalerweise einen Verweis auf eine Beschreibung ihres Vokabulars und ihrer Grammatik. Anhand dieser Beschreibung kann man ein XML-Dokument zwar noch nicht vollständig interpretieren, aber man kann es immerhin validieren. Diese Beschreibung des Vokabulars und der Grammatik ist das eigentliche Meta-Element des gesamten XML-Konzeptes.

Eigentlich ist also XML gar keine Metasprache, sondern ein universeller Sprachbaukasten. Zum XML-Konzept gehört aber die Verwendung einer Metasprache, mit der jeder XML-Sprachdialekt formal beschrieben werden kann. Das ist die Beschreibung des Vokabulars und der Grammatik. In ihrer gebräuchlichsten Form DTD Document Type Definition verwenden Sie dafür eine extra Sprache. Erst das neuere XML-Schema ermöglicht die Beschreibung des Vokabulars und der Grammatik mit XML selbst.

Wenn jeder das Vokabular und die Grammatik frei wählen kann,
sind wir dann nicht wieder beim alten Problem, dass alle Formate zueinander inkompatibel sind?

Nein. Alle XML-Sprachen teilen die gleiche, sehr simple Grundgrammatik. Es gibt verbindliche Regeln über die Grundstruktur von XML-Dokumenten. Wenn man schon eine andere XML-basierte Sprache beherrscht, dann muss man keine neue Grundgrammatik lernen. XML erspart Ihnen, für die 35igste Sprache wieder ein proprietäres Syntaxschema lernen zu müssen. Und jede Computer-Hochsprache ist in der Lage, die Grundstruktur beliebiger XML-basierter Sprachen zu interpretieren.


Weblinks

  • SGML Standard Generalized Markup Language in der Wikipedia (XML ist eine einfachere Untermenge der dieser älteren Auszeichnungssprache)