Björn Klippstein

ISO 8859-1

Klippstein IT Service

Aus 4webmaster.de

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

ISO 8859-1 ist neben ASCII und Unicode wohl der wichtigste und am häufigsten gebrauchte Zeichensatz. Der Standard ist abwärtskompatibel zu ASCII, nutzt jedoch 8 Bit und ergänzt ASCII damit um 127 Zeichen.

ISO 8859-1 versucht möglichst viele Sonderzeichen westeuropäischer Sprachen abzudecken. Es fehlen aber das Euro-Zeichen und einige französische Zeichen.

Auch der Microsoft-Zeichensatz Windows-CP-1252 Westeuropäisch (siehe unten) baut auf ISO 8859-1 auf.

Tabellen

ISO/IEC 8859-1

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… nicht belegt
1…
2… SP!"#$%&'()*+,-./
3… 0123456789:;<=>?
4… @ABCDEFGHIJKLMNO
5… PQRSTUVWXYZ[\]^_
6… `abcdefghijklmno
7… pqrstuvwxyz{|}~
8… nicht belegt
9…
A… NBSP¡¢£¤¥¦§¨©ª«¬SHY­®¯
B… °±²³´µ·¸¹º»¼½¾¿
C… ÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
D… ÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß
E… àáâãäåæçèéêëìíîï
F… ðñòóôõö÷øùúûüýþÿ

SP (0x20, "space") ist das Leerzeichen, NBSP (0xA0, "non-breaking space") das feste Leerzeichen und an 0xAD ist der bedingte Trennstrich (SHY, "soft hyphen"), der normalerweise nur am Zeilenende sichtbar ist.

ISO 8859-1

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… NULSOHSTXETXEOTENQACKBELBSHTLFVTFFCRSOSI
1… DLEDC1DC2DC3DC4NAKSYNETBCANEMSUBESCFSGSRSUS
2… wie ISO/IEC 8859, Windows-125X und US-ASCII
3…
4…
5…
6…
7… wie ISO/IEC 8859, Windows-125X und US-ASCIIDEL
8… PADHOPBPHNBHINDNELSSAESAHTSHTJVTSPLDPLURISS2SS3
9… DCSPU1PU2STSCCHMWSPAEPASOSSGCISCICSISTOSCPMAPC
A… wie ISO/IEC 8859-1 und Windows-1252
B…
C…
D…
E…
F…

Die IANA hat folgende gleichwertige großschreibungsunabhängige Bezeichnungen für diese Codetabelle registriert:

  • ISO_8859-1:1987
  • ISO_8859-1
  • ISO-8859-1
  • ISO-IR-100
  • csISOLatin1
  • latin1
  • l1
  • IBM819
  • CP819

Windows-1252

Windows-1252 wird als Westeuropäisch, Western European oder westlich bezeichnet. Eine synonyme Bezeichnung ist CP1252.

Diese Kodierung weicht von ISO 8859-1 im Bereich 0x80–9F ab, dessen 32 Positionen hier 27 darstellbare Zeichen beinhalten, u.a. die in ISO 8859-15 hinzugekommenen und einige für bessere Typographie notwendige. Die Unterschiede zwischen all diesen Kodierungen sowie generell mangelnde Konsequenz bei der Unterstützung verschiedener Zeichensätze sind ein häufiges Interoperabilitätsproblem.

Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
0… wie ISO-8859-1 und US-ASCII
1…
2… wie ISO/IEC 8859, ISO-8859-1 und US-ASCII
3…
4…
5…
6…
7… wie ISO-8859-1 und US-ASCII
8… ƒˆŠŒ Ž
9… ˜šœ žŸ
A… wie ISO/IEC 8859-1 und ISO-8859-1
B…
C…
D…
E…
F…

Windows-1252 ist ebenfalls bei der IANA registriert und akzeptiert u.a. "CP1252" als Synonym.

8859-1 vs. -15 vs. Windows-1252

Unterschiede Latin-1 zu Latin-9 zu Windows-1252
Zeichen Š š Ž ž Œ œ Ÿ ¤ ¦ ¨ ´ ¸ ¼ ½ ¾
8859-1 - - - - - - - - A4A6A8B4B8BCBDBE
8859-15 A4A6A8B4B8BCBDBE - - - - - - - -
CP1252 808A9A8E9E8C9C9F A4A6A8B4B8BCBDBE

Verwendung

Für mindestens folgende Sprachen reicht ISO 8859-1 aus:

  • Afrikaans (È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Û/û),
  • Albanisch (Ç/ç, Ë/ë),
  • Baskisch (Ñ/ñ),
  • Dänisch (Å/å, Æ/æ, Ø/ø),
  • Deutsch (Ä/ä, Ö/ö, Ü/ü, ß, nicht ggf. ſ),
  • Englisch (£, ¢; veraltend: Æ/æ, ä, ë, ï, ö, ü, nicht Œ/œ),
  • Färöisch (Á/á, Ð/ð, Í/í, Ó/ó, Ú/ú, Ý/ý, Æ/æ, Ø/ø),
  • Finnisch (Å/å, Ä/ä, Ö/ö, nicht Š/š, Ž/ž in Fremdworten),
  • Französisch (Æ/æ, À/à, Â/â, È/è, É/é, Ê/ê, Ë/ë, Î/î, Ï/ï, Ô/ô, Ù/ù, Û/û, Ç/ç, Ü/ü, ÿ, nicht Œ/œ, Ÿ),
  • Irisches Gälisch, neue Orthographie (Á/á, É/é, Í/í, Ó/ó, Ú/ú),
  • Isländisch (Á/á, Ð/ð, É/é, Í/í, Ó/ó, Ú/ú, Ý/ý, Þ/þ, Æ/æ, Ö/ö),
  • Italienisch (À/à, È/è, É/é, Ò/ò, Ù/ù),
  • Katalanisch (À/à, Ç/ç, È/è, É/é, Í/í, Ï/ï, Ò/ò, Ó/ó, Ú/ú, Ü/ü),
  • Niederländisch (nicht IJ/ij, aber ÿ),
  • Norwegisch, Bokmål und Nynorsk (Å/å, Æ/æ, Ø/ø, Ò/ò),
  • Portugiesisch inkl. Brasilianisch (À/à, Á/á, Â/â, Ã/ã, Ç/ç, É/é, Ê/ê, Í/í, Ó/ó, Ô/ô, Õ/õ, Ú/ú, Ü/ü),
  • Rätoromanisch,
  • Schottisches Gälisch (À/à, È/è, Ì/ì, Ò/ò, Ù/ù)
  • Schwedisch (Å/å, Ä/ä, Ö/ö),
  • Spanisch (¡, ¿, ª, º, Á/á, É/é, Í/í, Ñ/ñ, Ó/ó, Ú/ú, Ü/ü, früher auch Ç/ç),
  • Suaheli und
  • Wallonisch (Â/â, Å/å, Ç/ç, È/è, É/é, Ê/ê, Î/î, Ô/ô, Û/û).

Da dies heutzutage in Westeuropa, Amerika und Australien die am meisten verwendeten (Schrift-)Sprachen sind, ist es überall dort die dominierende Zeichenkodierung. Auch in Teilen Afrikas, in denen nicht die arabische Schrift verwendet wird, ist es weit verbreitet, obwohl oft einige Sonderzeichen fehlen, die aber auch in keiner anderen 8-Bit-Kodierung vorhanden sind.

Verwendung diakritischer Zeichen
Code …0 …1 …2 …3 …4 …5 …6 …7 …8 …9 …A …B …C …D …E …F
C…/E… À/àÁ/áÂ/âÃ/ãÄ/äÅ/åÆ/æÇ/çÈ/èÉ/éÊ/êË/ëÌ/ìÍ/íÎ/îÏ/ï
fra, ita, cat, por, scofao, gle, isl, por, spafra, por, wlnpordeu, eng, fin, swedan, fin, nor, swe, wlndan, eng, fao, fra, isl, noralb, fra, cat, por, wlnafr, fra, ita, cat, sco, wlnafr, fra, gle, isl, ita, cat, por, spa, wlnafr, fra, por, wlnafr, alb, eng, frascofao, fra, gle, isl, cat, por, spaafr, wlnafr, eng, fra, cat
D…/F… Ð/ðÑ/ñÒ/òÓ/óÔ/ôÕ/õÖ/ö Ø/øÙ/ùÚ/úÛ/ûÜ/üÝ/ýÞ/þß/ÿ
fao, islbaq, spaita, cat, scofao, gle, isl, cat, por, spaafr, fra, por, wlnpordeu, eng, fin, isl, swedan, fao, norfra, ita, scofao, gle, isl, cat, por, spaafr, fra, wlndeu, eng, fra, cat, por, spafao, islisldeu; fra, nld





Dieser Artikel basiert auf dem Artikel ISO_8859-1 aus der freien Enzyklopädie Wikipedia. Er steht unter der GNU-Lizenz für freie Dokumentation. In diesem Wiki und / oder der Wikipedia ist eine Liste der Autoren verfügbar.




Dieser Artikel basiert auf dem Artikel Vorlage:ISO-8859-Sonderzeichen aus der freien Enzyklopädie Wikipedia. Er steht unter der GNU-Lizenz für freie Dokumentation. In diesem Wiki und / oder der Wikipedia ist eine Liste der Autoren verfügbar.