Einzelbyte- und Mehrbyte-Zeichensätze

Der ASCII-Zeichensatz definiertes Zeichen im Bereich 0x00 – 0x7F.Es gibt mehrere andere Zeichensätze, hauptsächlich europäisch, die die Zeichen im Bereich 0x00 – 0x7F identisch mit dem ASCII-Zeichensatz und definieren Sie auch einen erweiterten Zeichensatz von 0xFF – 0x80 definieren.Daher ist ein 8-Bit, Einzelbyte-Zeichensatz (SBCS) aus, um den ASCII-Zeichensatz sowie die Zeichensätze für viele europäischen Sprachen darzustellen.Einige außereuropäische Zeichensätze, enthalten jedoch Japanisch Kanji-Spezifikation, wie viele weitere Zeichen als Einzelbyte- codierungs in einem Schema dargestellt werden kann und daher benötigen Codierung des Multibyte-Zeichensatzes (MBCS).

HinweisHinweis

Viele SBCS Routinen in der Microsoft-Laufzeitbibliothek behandeln Mehrbyte Zeichenfolgen und Zeichen, Bytes.Bei vielen Mehrbyte-Zeichensätzen definieren den ASCII-Zeichensatz als Teilmenge.In vielen Mehrbyte-Zeichensätzen sind die Zeichen im Bereich 0x00 – 0x7F mit den entsprechenden Zeichen des ASCII-Zeichensatzes identisch.Beispielsweise kann in ASCII und MBCS Zeichenfolgen, hat das Zeichen Ein BYTEs NULL („\ 0 ") Wert 0x00 und gibt das den Wert NULL auf.

Ein Multibyte-Zeichensatz besteht möglicherweise Ein BYTE und 2-Byte- Zeichen.Daher kann eine Mehrbyte-Zeichenfolge eine Mischung aus Einzelbyte- und Doppelbytezeichen.Ein 2-Byte- mehrbytezeichen hat ein führendes Byte und ein nachfolgendes Byte.In einem bestimmten Mehrbyte-Zeichensatz liegen die führenden Bytes ebenso wie die nachfolgenden Bytes innerhalb eines bestimmten Bereichs.Wenn diese Bereiche überschneiden, kann es notwendig, die bestimmten Kontext ausgewertet wird, um zu bestimmen, ob ein bestimmtes Byte als führendes Byte oder nachfolgendes Byte funktioniert.

Siehe auch

Referenz

Internationalisierung

Ablaufroutinen nach Kategorie