NormalizationForm Enum

Definitie

Definieert het type normalisatie dat moet worden uitgevoerd.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Overname
NormalizationForm
Kenmerken

Velden

Name Waarde Description
FormC 1

Geeft aan dat een Unicode-tekenreeks wordt genormaliseerd met behulp van volledige canonieke decompositie, gevolgd door de vervanging van reeksen met hun primaire samengestelde, indien mogelijk.

FormD 2

Geeft aan dat een Unicode-tekenreeks wordt genormaliseerd met behulp van volledige canonieke decompositie.

FormKC 5

Geeft aan dat een Unicode-tekenreeks wordt genormaliseerd met behulp van volledige compatibiliteitsontleding, gevolgd door de vervanging van reeksen met hun primaire samengestelde, indien mogelijk.

FormKD 6

Geeft aan dat een Unicode-tekenreeks wordt genormaliseerd met volledige compatibiliteitsontleding.

Opmerkingen

Sommige Unicode-reeksen worden als gelijkwaardig beschouwd omdat ze hetzelfde teken vertegenwoordigen. Het volgende wordt bijvoorbeeld beschouwd als gelijkwaardig omdat een van deze kan worden gebruikt om 'ắ' weer te geven:

  • "\u1EAF" (U+1EAF LATIJNSE KLEINE LETTER A MET BREVE EN ACUTE)

  • "\u0103\u0301" (U+0103 LATIJNSE KLEINE LETTER A MET BREVE + U+0301 MET ACUTE ACCENT)

  • "\u0061\u0306\u0301" (U+0061 LATIJNSE KLEINE LETTER A + U +0306 COMBINEREN BREVE + U+0301 COMBINEREN ACUTE ACCENT)

Ordinaal, dat wil gezegd, binaire vergelijkingen beschouwen deze reeksen echter anders omdat ze verschillende Unicode-codewaarden bevatten. Voordat u ordinale vergelijkingen uitvoert, moeten toepassingen deze tekenreeksen normaliseren om ze op te delen in hun basisonderdelen.

Elk samengesteld Unicode-teken wordt toegewezen aan een meer basisreeks van een of meer tekens. Het proces van ontleding vervangt samengestelde tekens in een tekenreeks door de meer basistoewijzingen. Een volledige ontleding voert deze vervanging recursief uit totdat geen van de tekens in de tekenreeks verder kan worden uitgevouwen.

Unicode definieert twee typen ontleding: compatibiliteitsdecompositie en canonieke decompositie. In compatibiliteitsontleding kunnen opmaakgegevens verloren gaan. In canonieke ontleding, een subset van compatibiliteitsontleding, blijft opmaakgegevens behouden.

Twee sets tekens worden beschouwd als canonieke gelijkwaardigheid als hun volledige canonieke decomposities identiek zijn. Op dezelfde manier worden twee sets tekens beschouwd als compatibiliteitscompatibiliteit als de volledige compatibiliteitsontleding identiek is.

Zie Unicode Standard Annex #15: Unicode Normalization Forms at unicode.org voor meer informatie over normalisatie, ontleding en gelijkwaardigheid.

Van toepassing op

Zie ook