Compartilhar via


Analisando cadeias de caracteres numéricas no .NET

Todos os tipos numéricos têm dois métodos Parse de análise estáticos e TryParse, que você pode usar para converter a representação de cadeia de caracteres de um número em um tipo numérico. Esses métodos permitem analisar cadeias de caracteres que foram produzidas usando as cadeias de caracteres de formato documentadas em Cadeias de Caracteres de Formato Numérico Padrão e Cadeias de Caracteres de Formato Numérico Personalizado. Por padrão, os métodos Parse e TryParse podem converter com êxito cadeias de caracteres que contêm apenas dígitos decimais integrais em valores inteiros. Eles podem converter cadeias de caracteres com êxito que contêm dígitos decimais integrais e fracionários, separadores de grupo e um separador decimal em valores de ponto flutuante. O Parse método gera uma exceção se a operação falhar, enquanto o TryParse método retorna false.

Observação

A partir do .NET 7, os tipos numéricos no .NET também implementam a System.IParsable<TSelf> interface, que define os métodos IParsable<TSelf>.Parse e IParsable<TSelf>.TryParse.

Provedores de análise e formatação

Normalmente, as representações de cadeia de caracteres de valores numéricos diferem por cultura. Elementos de cadeias de caracteres numéricas, como símbolos de moeda, separadores de grupo (ou milhares) e separadores decimais, variam de acordo com a cultura. Os métodos de análise usam implicitamente ou explicitamente um provedor de formato que reconhece essas variações específicas da cultura. Se nenhum provedor de formato for especificado em uma chamada ao método Parse ou TryParse, será usado o provedor de formato associado à cultura atual (o objeto NumberFormatInfo retornado pela propriedade NumberFormatInfo.CurrentInfo).

Um provedor de formato é representado por uma implementação IFormatProvider . Essa interface tem um único membro, o GetFormat método, cujo único parâmetro é um Type objeto que representa o tipo a ser formatado. Esse método retorna o objeto que fornece informações de formatação. O .NET dá suporte às duas IFormatProvider implementações a seguir para analisar cadeias de caracteres numéricas:

O exemplo a seguir tenta converter cada cadeia de caracteres em uma matriz em um Double valor. Ele primeiro tenta analisar a cadeia de caracteres usando um provedor de formato que reflete as convenções da cultura inglesa (Estados Unidos). Se essa operação gerar uma FormatException, ela tentará analisar a cadeia de caracteres usando um provedor de formato que reflete as convenções da cultura francesa (França).

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string[] values = { "1,304.16", "$1,456.78", "1,094", "152",
                          "123,45 €", "1 304,16", "Ae9f" };
      double number;
      CultureInfo culture = null;

      foreach (string value in values) {
         try {
            culture = CultureInfo.CreateSpecificCulture("en-US");
            number = Double.Parse(value, culture);
            Console.WriteLine($"{culture.Name}: {value} --> {number}");
         }
         catch (FormatException) {
            Console.WriteLine($"{culture.Name}: Unable to parse '{value}'.");
            culture = CultureInfo.CreateSpecificCulture("fr-FR");
            try {
               number = Double.Parse(value, culture);
               Console.WriteLine($"{culture.Name}: {value} --> {number}");
            }
            catch (FormatException) {
               Console.WriteLine($"{culture.Name}: Unable to parse '{value}'.");
            }
         }
         Console.WriteLine();
      }
   }
}
// The example displays the following output:
//    en-US: 1,304.16 --> 1304.16
//
//    en-US: Unable to parse '$1,456.78'.
//    fr-FR: Unable to parse '$1,456.78'.
//
//    en-US: 1,094 --> 1094
//
//    en-US: 152 --> 152
//
//    en-US: Unable to parse '123,45 €'.
//    fr-FR: Unable to parse '123,45 €'.
//
//    en-US: Unable to parse '1 304,16'.
//    fr-FR: 1 304,16 --> 1304.16
//
//    en-US: Unable to parse 'Ae9f'.
//    fr-FR: Unable to parse 'Ae9f'.
Imports System.Globalization

Module Example
    Public Sub Main()
        Dim values() As String = {"1,304.16", "$1,456.78", "1,094", "152",
                                   "123,45 €", "1 304,16", "Ae9f"}
        Dim number As Double
        Dim culture As CultureInfo = Nothing

        For Each value As String In values
            Try
                culture = CultureInfo.CreateSpecificCulture("en-US")
                number = Double.Parse(value, culture)
                Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number)
            Catch e As FormatException
                Console.WriteLine("{0}: Unable to parse '{1}'.",
                                  culture.Name, value)
                culture = CultureInfo.CreateSpecificCulture("fr-FR")
                Try
                    number = Double.Parse(value, culture)
                    Console.WriteLine("{0}: {1} --> {2}", culture.Name, value, number)
                Catch ex As FormatException
                    Console.WriteLine("{0}: Unable to parse '{1}'.",
                                      culture.Name, value)
                End Try
            End Try
            Console.WriteLine()
        Next
    End Sub
End Module
' The example displays the following output:
'    en-US: 1,304.16 --> 1304.16
'    
'    en-US: Unable to parse '$1,456.78'.
'    fr-FR: Unable to parse '$1,456.78'.
'    
'    en-US: 1,094 --> 1094
'    
'    en-US: 152 --> 152
'    
'    en-US: Unable to parse '123,45 €'.
'    fr-FR: Unable to parse '123,45 €'.
'    
'    en-US: Unable to parse '1 304,16'.
'    fr-FR: 1 304,16 --> 1304.16
'    
'    en-US: Unable to parse 'Ae9f'.
'    fr-FR: Unable to parse 'Ae9f'.

Análise Sintática e Valores de NumberStyles

Os elementos de estilo (como espaço em branco, separadores de grupo e separador decimal) que a operação de análise pode manipular são definidos por um NumberStyles valor de enumeração. Por padrão, cadeias de caracteres que representam valores inteiros são analisadas usando o valor, que NumberStyles.Integer permite apenas dígitos numéricos, espaço em branco à esquerda e à direita e um sinal à esquerda. Strings que representam valores de ponto flutuante são analisadas usando uma combinação de NumberStyles.Float e NumberStyles.AllowThousands; esse estilo composto permite dígitos decimais, juntamente com espaço em branco à esquerda e à direita, um sinal à esquerda, um separador decimal, um separador de grupo e um expoente. Ao chamar uma sobrecarga do método Parse ou TryParse que inclui um parâmetro do tipo NumberStyles e definir um ou mais sinalizadores NumberStyles, você pode controlar os elementos de estilo que podem estar presentes na cadeia para que a operação de parsing tenha êxito.

Por exemplo, uma cadeia de caracteres que contém um separador de grupo não pode ser convertida em um Int32 valor usando o Int32.Parse(String) método. No entanto, a conversão será bem-sucedida se você usar o NumberStyles.AllowThousands sinalizador, como ilustra o exemplo a seguir.

using System;
using System.Globalization;

public class Example
{
   public static void Main()
   {
      string value = "1,304";
      int number;
      IFormatProvider provider = CultureInfo.CreateSpecificCulture("en-US");
      if (Int32.TryParse(value, out number))
         Console.WriteLine($"{value} --> {number}");
      else
         Console.WriteLine($"Unable to convert '{value}'");

      if (Int32.TryParse(value, NumberStyles.Integer | NumberStyles.AllowThousands,
                        provider, out number))
         Console.WriteLine($"{value} --> {number}");
      else
         Console.WriteLine($"Unable to convert '{value}'");
   }
}
// The example displays the following output:
//       Unable to convert '1,304'
//       1,304 --> 1304
Imports System.Globalization

Module Example
    Public Sub Main()
        Dim value As String = "1,304"
        Dim number As Integer
        Dim provider As IFormatProvider = CultureInfo.CreateSpecificCulture("en-US")
        If Int32.TryParse(value, number) Then
            Console.WriteLine("{0} --> {1}", value, number)
        Else
            Console.WriteLine("Unable to convert '{0}'", value)
        End If

        If Int32.TryParse(value, NumberStyles.Integer Or NumberStyles.AllowThousands,
                          provider, number) Then
            Console.WriteLine("{0} --> {1}", value, number)
        Else
            Console.WriteLine("Unable to convert '{0}'", value)
        End If
    End Sub
End Module
' The example displays the following output:
'       Unable to convert '1,304'
'       1,304 --> 1304

Aviso

A operação de análise sempre usa as convenções de formatação de uma cultura específica. Se você não especificar uma cultura passando um objeto CultureInfo ou NumberFormatInfo, a cultura associada ao thread atual será usada.

A tabela a seguir lista os membros da NumberStyles enumeração e descreve o efeito que eles têm na operação de análise.

Valor de NumberStyles Efeito na cadeia de caracteres a ser analisada
NumberStyles.None Somente dígitos numéricos são permitidos.
NumberStyles.AllowDecimalPoint O separador decimal e os dígitos fracionários são permitidos. Para valores inteiros, apenas zero é permitido como um dígito fracionário. Os separadores decimais válidos são determinados pela propriedade NumberFormatInfo.NumberDecimalSeparator ou pela propriedade NumberFormatInfo.CurrencyDecimalSeparator.
NumberStyles.AllowExponent O caractere "e" ou "E" pode ser usado para indicar notação exponencial. Para obter mais informações, consulte NumberStyles.
NumberStyles.AllowLeadingWhite O espaço em branco no início é permitido.
NumberStyles.AllowTrailingWhite O espaço em branco no final é permitido.
NumberStyles.AllowLeadingSign Um sinal positivo ou negativo pode preceder dígitos numéricos.
NumberStyles.AllowTrailingSign Um sinal positivo ou negativo pode seguir dígitos numéricos.
NumberStyles.AllowParentheses Parênteses podem ser usados para indicar valores negativos.
NumberStyles.AllowThousands O separador de grupo é permitido. O caractere separador de grupo é determinado pela propriedade NumberFormatInfo.NumberGroupSeparator ou NumberFormatInfo.CurrencyGroupSeparator.
NumberStyles.AllowCurrencySymbol O símbolo de moeda é permitido. O símbolo de moeda é definido pela NumberFormatInfo.CurrencySymbol propriedade.
NumberStyles.AllowHexSpecifier A cadeia de caracteres a ser analisada é interpretada como um número hexadecimal. Ele pode incluir os dígitos hexadecimal 0-9, A-F e a-f. Esse sinalizador só pode ser usado para analisar valores inteiros.
NumberStyles.AllowBinarySpecifier A cadeia de caracteres a ser analisada é interpretada como um número binário. Ele pode incluir os dígitos binários 0 e 1. Esse sinalizador só pode ser usado para analisar valores inteiros.

Além disso, a NumberStyles enumeração fornece os seguintes estilos compostos, que incluem vários NumberStyles sinalizadores.

Valor de estilos de números composto Inclui membros
NumberStyles.Integer Inclui os estilos NumberStyles.AllowLeadingWhite, NumberStyles.AllowTrailingWhite e NumberStyles.AllowLeadingSign. Esse é o estilo padrão usado para analisar valores inteiros.
NumberStyles.Number Inclui os estilos NumberStyles.AllowLeadingWhite, NumberStyles.AllowTrailingWhite, NumberStyles.AllowLeadingSign, NumberStyles.AllowTrailingSign, NumberStyles.AllowDecimalPoint e NumberStyles.AllowThousands.
NumberStyles.Float Inclui os estilos NumberStyles.AllowLeadingWhite, NumberStyles.AllowTrailingWhite, NumberStyles.AllowLeadingSign, NumberStyles.AllowDecimalPoint e NumberStyles.AllowExponent.
NumberStyles.Currency Inclui todos os estilos, exceto NumberStyles.AllowExponent .NumberStyles.AllowHexSpecifier
NumberStyles.Any Inclui todos os estilos, exceto NumberStyles.AllowHexSpecifier.
NumberStyles.HexNumber Inclui os estilos NumberStyles.AllowLeadingWhite, NumberStyles.AllowTrailingWhite e NumberStyles.AllowHexSpecifier.
NumberStyles.BinaryNumber Inclui os estilos NumberStyles.AllowLeadingWhite, NumberStyles.AllowTrailingWhite e NumberStyles.AllowBinarySpecifier.

Analisando BigIntegers binário e hexadecimal

Ao analisar BigInteger com os sinalizadores AllowHexSpecifier ou AllowBinarySpecifier, a cadeia de caracteres de entrada é interpretada como um número hexadecimal/binário com exatamente o comprimento da cadeia. Por exemplo, a análise "11" como um BigInteger binário produz -1, porque essa é a interpretação de 11 como um valor complemento de dois assinados com exatamente 2 dígitos. Se você quiser um resultado positivo, adicione um prefixo 0, como "011", que é interpretado como 3.

Análise de sintaxe e dígitos Unicode

O padrão Unicode define pontos de código para dígitos em vários sistemas de gravação. Por exemplo, os pontos de código de U+0030 a U+0039 representam os dígitos latinos básicos de 0 a 9, os pontos de código de U+09E6 a U+09EF representam os dígitos Bangla de 0 a 9 e os pontos de código de U+FF10 para U+FF19 representam os dígitos de largura total de 0 a 9. No entanto, os únicos dígitos numéricos reconhecidos pelos métodos de análise são os dígitos latinos básicos 0-9 com pontos de código de U+0030 a U+0039. Se um método de análise numérica for passado por uma cadeia de caracteres que contenha outros dígitos, o método gerará um FormatException.

O exemplo a seguir usa o Int32.Parse método para analisar cadeias de caracteres que consistem em dígitos em sistemas de escrita diferentes. Como mostra a saída do exemplo, a tentativa de analisar os dígitos latinos básicos é bem-sucedida, mas a tentativa de analisar os dígitos Fullwidth, Arabic-Indic e Bangla falha.

using System;

public class Example
{
   public static void Main()
   {
      string value;
      // Define a string of basic Latin digits 1-5.
      value = "\u0031\u0032\u0033\u0034\u0035";
      ParseDigits(value);

      // Define a string of Fullwidth digits 1-5.
      value = "\uFF11\uFF12\uFF13\uFF14\uFF15";
      ParseDigits(value);

      // Define a string of Arabic-Indic digits 1-5.
      value = "\u0661\u0662\u0663\u0664\u0665";
      ParseDigits(value);

      // Define a string of Bangla digits 1-5.
      value = "\u09e7\u09e8\u09e9\u09ea\u09eb";
      ParseDigits(value);
   }

   static void ParseDigits(string value)
   {
      try {
         int number = Int32.Parse(value);
         Console.WriteLine($"'{value}' --> {number}");
      }
      catch (FormatException) {
         Console.WriteLine($"Unable to parse '{value}'.");
      }
   }
}
// The example displays the following output:
//       '12345' --> 12345
//       Unable to parse '12345'.
//       Unable to parse '١٢٣٤٥'.
//       Unable to parse '১২৩৪৫'.
Module Example
    Public Sub Main()
        Dim value As String
        ' Define a string of basic Latin digits 1-5.
        value = ChrW(&h31) + ChrW(&h32) + ChrW(&h33) + ChrW(&h34) + ChrW(&h35)
        ParseDigits(value)

        ' Define a string of Fullwidth digits 1-5.
        value = ChrW(&hff11) + ChrW(&hff12) + ChrW(&hff13) + ChrW(&hff14) + ChrW(&hff15)
        ParseDigits(value)

        ' Define a string of Arabic-Indic digits 1-5.
        value = ChrW(&h661) + ChrW(&h662) + ChrW(&h663) + ChrW(&h664) + ChrW(&h665)
        ParseDigits(value)

        ' Define a string of Bangla digits 1-5.
        value = ChrW(&h09e7) + ChrW(&h09e8) + ChrW(&h09e9) + ChrW(&h09ea) + ChrW(&h09eb)
        ParseDigits(value)
    End Sub

    Sub ParseDigits(value As String)
        Try
            Dim number As Integer = Int32.Parse(value)
            Console.WriteLine("'{0}' --> {1}", value, number)
        Catch e As FormatException
            Console.WriteLine("Unable to parse '{0}'.", value)
        End Try
    End Sub
End Module
' The example displays the following output:
'       '12345' --> 12345
'       Unable to parse '12345'.
'       Unable to parse '١٢٣٤٥'.
'       Unable to parse '১২৩৪৫'.

Consulte também