Set di caratteri a byte singolo e multibyte

Il set di caratteri ASCII definisce i caratteri compresi nell'intervallo tra 0x00 e 0x7F.Esistono numerosi altri set di caratteri, principalmente europei, che definiscono i caratteri nell'intervallo tra 0x00 e 0x7F in modo identico al set di caratteri ASCII e definire anche un set di caratteri esteso da 0x80 e 0xFF.Pertanto un 8 bit, singolo-byte-carattere imposta (SBCS) è sufficiente per rappresentare il set di caratteri ASCII che i set di caratteri per molte lingue europee.Tuttavia, alcuni set di caratteri non europei, ad esempio il Kanji giapponese, includono molti altri caratteri che può essere rappresentato in una combinazione di codifica a byte singolo e richiedono il carattere multibyte (impostanoMBCS) codifica.

[!NOTA]

molti SBCS routine in byte, i caratteri e le stringhe multibyte handle della libreria di runtime di Microsoft in base alle proprie esigenze.Molti set di caratteri multibyte definiscono il set di caratteri ASCII sottoinsieme.In molti set di caratteri multibyte ciascun carattere compreso nell'intervallo tra 0x00 e 0x7F è identico al carattere con lo stesso valore nel set di caratteri ASCII.Ad esempio, in entrambe ASCII e MBCS stringhe di caratteri, il dati NULL il carattere (" \ 0 ") ha valore 0x00 e indica il carattere di terminazione null.

Un set di caratteri multibyte può essere sia di dati che di caratteri a due byte.Pertanto una stringa con caratteri multibyte può contenere una combinazione di a byte singolo e di caratteri DBCS.Un carattere multibyte a due byte ha un byte iniziale e un byte finale.In un determinato set di caratteri multibyte, sia i byte iniziali che i byte finali sono compresi in intervalli specifici.Quando questi intervalli si sovrappongono, può essere necessario valutare il contesto specifico per determinare se un determinato byte funga da byte iniziale o finale.

Vedere anche

Riferimenti

Internazionalizzazione

Routine di runtime per la categoria