Feasability

Beispiel

Am Beispiel des großen lateinischen Z mit Hacek soll die Verfügbarkeit von UNICODE demonstriert werden:
017D;LATIN CAPITAL LETTER Z WITH CARON;Lu;0;L;005A 030C;;;;N;LATIN CAPITAL LETTER Z HACEK;;;017E;
Zeichen 017d kann in HTML ausgedrückt werden als Die Dekomposition des Zeichens erfolgt lt. Tabelle als
005A;LATIN CAPITAL LETTER Z;Lu;0;L;;;;;N;;;;007A;
030C;COMBINING CARON;Mn;230;NSM;;;;;N;NON-SPACING HACEK;;;;
Hierbei ist "Z" direkt eingebbar, "Combining Caron" für sich gesehen ist nicht darstellbar, korrektes Browserverhalten ist es, auch in diesem Fall das kombinierte Zeichen auszugeben. In Parenthese gesetzt ist deshalb auch noch eine Darstellung mit
02C7;CARON;Sk;0;ON;;;;;N;MODIFIER LETTER HACEK;Mandarin Chinese third tone;;;
Im Header dieser HTML-Seite ist als Content-Type eingestellt, daß sie (codierte) UNICODE-Zeichen enthält:
<META http-equiv="Content-Type" content="text/html; charset=UTF-8">
Die UTF-8-Transformation des Unicode-Zeichens x017D ist die Folge von Bytes xC5 xBD, Die Transformationen von x005A x030C und x02C7 sind x5A xCC x8C rsp xCB x87 Hier also die Zeichen direkt:

Hier können Sie ausprobieren, was Ihr Browser mit verschiedenen Codierungen verschiedener Zeichen veranstaltet.

Die folgende Tabelle enthält die ermittelten Darstellbarkeiten, falls ein UNICODE-Zeichensatz für die Anzeige eingestellt ist (Bitstream CyberBit, ftp://ftp.netscape.com/pub/communicator/extras/fonts/windows/, wurde unter Win 9x benutzt, unter Windows NT der im System enthaltene Font Times New Roman).
ArtRepräsentationIhr Browser Windows NTWindows 9x
 NC6pwIE5NC4  NC6pwIE5 (x)NC4IE4
kombiniert, hexadezimal&#x017d;Ž ++- ++--
kombiniert, dezimal&#381;Ž +++ ++++
nonspacing, hexadezimal...<sp>&#x030c;... ̌ (1)(1)- (2)(2)--
nonspacing, dezimal...<sp>&#780;... ̌ (1)(1)(1) (2)(2)(2)(2)
spacing, hexadezimal&#x02c7;ˇ ++- ++--
spacing, dezimal&#711;ˇ +++ +++(2)
 
dekomponiert, hexadezimalZ&#x030c; (1)+- (2)(2)--
dekomponiert, dezimalZ&#780; (1)+(1) (2)(2)(2)(2)
dekomponiert, hexadezimal&#x005a;&#x030c; (1)+- (2)(2)--
dekomponiert, dezimal&#90;&#780; (1)+(1) (2)(2)(2)(2)
 
kombiniert, UTF-8xC5 xBDŽ +++ ++++
dekomponiert, UTF-8x5A xCC x8C (1)+(1) (2)(2)(2)(2)
nonspacing, UTF-8...<sp>xCC x8C... ̌ (1)(1)(1) (2)(2)(2)(2)
spacing, UTF-8xCB x87ˇ +++ +++(2)
(1) Je nach eingestelltem Font:
Cyberbit: Keine Darstellung
Times New Roman: Klötzchen
Lucida Sans Unicode: Nach links verschobener Hacek
(2) Je nach eingestelltem Font:
Cyberbit: Keine Darstellung
Times New Roman: Klötzchen
(x) ältere Versionen crashen
(p) Preview, äquivalent zu M14