Namespace Microsoft::CognitiveServices::Speech

Resumo

Membros	Descrições
enumeração PropertyId	Define ids de propriedade de fala. Alterado na versão 1.4.0.
OutputFormat enum	Formato de saída.
enumeração ProfanityOption	Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0.
enumeração ResultReason	Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.
enum CancellationReason	Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.
enumeração CancellationErrorCode	Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0.
enumeração NoMatchReason	Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.
ActivityJSONType enum	Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0.
SpeechSynthesisOutputFormat	Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0.
enumeração StreamStatus	Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0.
ServicePropertyChannel de enumeração	Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0.
RecognitionFactorScope enum	Define o escopo ao qual um Fator de Reconhecimento é aplicado.
enumeração PronúnciaAssessmentGradingSystem	Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0.
enumeração PronúnciaAssessmentGranularity	Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0.
SynthesisVoiceType	Define o tipo de vozes de síntese adicionadas na versão 1.16.0.
enumeração SynthesisVoiceGender	Define o gênero das vozes de síntese adicionadas na versão 1.17.0.
enumeração SynthesisVoiceStatus	Define o status das vozes de síntese.
SpeechSynthesisBoundaryType	Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0.
segmentationStrategy	A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".
classe AudioDataStream	Representa o fluxo de dados de áudio usado para operar dados de áudio como um fluxo. Adicionado na versão 1.4.0.
classe AutoDetectSourceLanguageConfig	Classe que define a configuração de origem de detecção automática atualizada em 1.13.0.
classe AutoDetectSourceLanguageResult	Contém o resultado do idioma de origem detectado automaticamente adicionado em 1.8.0.
classe ClassLanguageModel	Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0.
classe Connection	A conexão é uma classe proxy para gerenciar a conexão com o serviço de fala do Reconhecedor especificado. Por padrão, um Reconhecedor gerencia de forma autônoma a conexão com o serviço quando necessário. A classe Connection fornece métodos adicionais para que os usuários abram ou fechem explicitamente uma conexão e assinem as alterações de status da conexão. O uso da Conexão é opcional. Destina-se a cenários em que o ajuste fino do comportamento do aplicativo com base no status da conexão é necessário. Opcionalmente, os usuários podem chamar Open() para iniciar manualmente uma conexão de serviço antes de iniciar o reconhecimento no Reconhecedor associado a essa Conexão. Depois de iniciar um reconhecimento, a chamada de Open() ou Close() pode falhar. Isso não afetará o Reconhecedor ou o reconhecimento contínuo. A conexão pode ser suspensa por vários motivos, o Reconhecedor sempre tentará reinstituir a conexão conforme necessário para garantir operações em andamento. Em todos esses casos, eventos conectados/desconectados indicarão a alteração do status da conexão. Atualizado na versão 1.17.0.
classe ConnectionEventArgs	Fornece dados para o ConnectionEvent. Adicionado na versão 1.2.0.
classe ConnectionMessage	ConnectionMessage representa mensagens específicas de implementação enviadas e recebidas do serviço de fala. Essas mensagens são fornecidas para fins de depuração e não devem ser usadas para casos de uso de produção com o Serviço de Fala dos Serviços Cognitivos do Azure. As mensagens enviadas e recebidas do Serviço de Fala estão sujeitas a alterações sem aviso prévio. Isso inclui conteúdo de mensagens, cabeçalhos, conteúdos, pedidos etc. Adicionado na versão 1.10.0.
classe ConnectionMessageEventArgs	Fornece dados para o ConnectionMessageEvent.
classe EmbeddedSpeechConfig	Classe que define a configuração de fala inserida (offline).
classe EventArgs	Classe base para argumentos de evento.
eventSignal da classe	Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos.
classe EventSignalBase	Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos.
classe Grammar	Representa a gramática de classe base para personalizar o reconhecimento de fala. Adicionado na versão 1.5.0.
classe GrammarList	Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0.
classe GrammarPhrase	Representa uma frase que pode ser dita pelo usuário. Adicionado na versão 1.5.0.
classe HybridSpeechConfig	Classe que define configurações híbridas (na nuvem e inseridas) para reconhecimento de fala ou síntese de fala.
classe KeywordRecognitionEventArgs	Classe para os eventos emmitidos pelo KeywordRecognizer.
classe KeywordRecognitionModel	Representa o modelo de reconhecimento de palavra-chave usado com métodos StartKeywordRecognitionAsync.
classe KeywordRecognitionResult	Classe que define os resultados emitidos pelo KeywordRecognizer.
classe KeywordRecognizer	Tipo de reconhecedor especializado para manipular apenas a ativação da palavra-chave.
classe PhraseListGrammar	Representa uma gramática de lista de frases para cenários de gramática dinâmica. Adicionado na versão 1.5.0.
classe PronunciationAssessmentConfig	Classe que define a configuração de avaliação de pronúncia adicionada em 1.14.0.
classe PronúnciaAssessmentResult	Classe para resultados da avaliação de pronúncia.
classe PropertyCollection	Classe para recuperar ou definir um valor de propriedade de uma coleção de propriedades.
classe AsyncRecognizer	Classe base abstrata AsyncRecognizer.
classe BaseAsyncRecognizer	Classe BaseAsyncRecognizer.
da classe RecognitionEventArgs	Fornece dados para o RecognitionEvent.
classe RecognitionResult	Contém informações detalhadas sobre o resultado de uma operação de reconhecimento.
classe CancellationDetails	Contém informações detalhadas sobre por que um resultado foi cancelado.
classe NoMatchDetails	Contém informações detalhadas para resultados de reconhecimento noMatch.
do Reconhecedor de Classe	Classe base do reconhecedor.
classe SessionEventArgs	Classe base para argumentos de evento de sessão.
classe SmartHandle	Classe de identificador inteligente.
classe SourceLanguageConfig	Classe que define a configuração do idioma de origem, adicionada em 1.8.0.
classe SourceLanguageRecognizer	Classe para reconhecedores de idioma de origem. Você pode usar essa classe para detecção de idioma autônomo. Adicionado na versão 1.17.0.
classe SpeechConfig	Classe que define configurações para reconhecimento de voz ou síntese de voz.
classe SpeechRecognitionEventArgs	Classe para argumentos de evento de reconhecimento de fala.
classe SpeechRecognitionCanceledEventArgs	Classe para reconhecimento de fala cancelou argumentos de evento.
classe SpeechRecognitionModel	Informações do modelo de reconhecimento de fala.
classe SpeechRecognitionResult	Classe base para resultados de reconhecimento de fala.
classe SpeechRecognizer	Classe para reconhecedores de fala.
classe SpeechSynthesisBookmarkEventArgs	Classe para argumentos de evento de indicador de síntese de fala. Adicionado na versão 1.16.0.
classe SpeechSynthesisEventArgs	Classe para argumentos de evento de síntese de fala. Adicionado na versão 1.4.0.
classe SpeechSynthesisRequest	Classe que define a solicitação de síntese de fala. Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.37.0.
classe PersonalVoiceSynthesisRequest	Classe que define a solicitação de síntese de fala para voz pessoal (aka.ms/azureai/personal-voice). Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.39.0.
classe SpeechSynthesisResult	Contém informações sobre o resultado da síntese de texto em fala. Adicionado na versão 1.4.0.
classe SpeechSynthesisCancellationDetails	Contém informações detalhadas sobre por que um resultado foi cancelado. Adicionado na versão 1.4.0.
classe SpeechSynthesisVisemeEventArgs	Classe para argumentos de evento de viseme de síntese de fala. Adicionado na versão 1.16.0.
classe SpeechSynthesisWordBoundaryEventArgs	Classe para argumentos de evento de limite de palavra de síntese de fala. Adicionado na versão 1.7.0.
classe SpeechSynthesizer	Classe para sintetizador de fala. Atualizado na versão 1.14.0.
classe SpeechTranslationModel	Informações do modelo de tradução de fala.
da classe SynthesisVoicesResult	Contém informações sobre o resultado da lista de vozes de sintetizadores de fala. Adicionado na versão 1.16.0.
classe VoiceInfo	Contém informações sobre informações de voz de síntese atualizadas na versão 1.17.0.

Membros

enumeração PropertyId

Valores	Descrições
SpeechServiceConnection_Key	A chave de assinatura do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription.
SpeechServiceConnection_Endpoint	O ponto de extremidade do Serviço de Fala dos Serviços Cognitivos (URL). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromEndpoint. OBSERVAÇÃO: esse ponto de extremidade não é o mesmo que o ponto de extremidade usado para obter um token de acesso.
SpeechServiceConnection_Region	A região do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken.
SpeechServiceAuthorization_Token	O token de autorização do Serviço de Fala dos Serviços Cognitivos (também conhecido como token de acesso). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken ou TranslationRecognizer::SetAuthorizationToken.
SpeechServiceAuthorization_Type	O tipo de autorização do Serviço de Fala dos Serviços Cognitivos. Atualmente não utilizado.
SpeechServiceConnection_EndpointId	A ID do ponto de extremidade do Serviço de Voz Personalizado ou de Fala Personalizada dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetEndpointId. OBSERVAÇÃO: a ID do ponto de extremidade está disponível no Portal de Fala Personalizada, listado em Detalhes do Ponto de Extremidade.
SpeechServiceConnection_Host	O host (URL) do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromHost.
SpeechServiceConnection_ProxyHostName	O nome do host do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyPort	A porta do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyUserName	O nome de usuário do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_ProxyPassword	A senha do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0.
SpeechServiceConnection_Url	A cadeia de caracteres de URL criada a partir da configuração de fala. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. OBSERVAÇÃO: adicionado na versão 1.5.0.
SpeechServiceConnection_ProxyHostBypass	Especifica a lista de hosts para os quais os proxies não devem ser usados. Essa configuração substitui todas as outras configurações. Os nomes de host são separados por vírgulas e são correspondidos de maneira que não diferencia maiúsculas de minúsculas. Não há suporte para curingas.
SpeechServiceConnection_TranslationToLanguages	A lista de idiomas separados por vírgulas usados como idiomas de tradução de destino. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::AddTargetLanguage e SpeechTranslationConfig::GetTargetLanguages.
SpeechServiceConnection_TranslationVoice	O nome da voz do Serviço Cognitivo de Texto em Fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::SetVoiceName. OBSERVAÇÃO: Nomes de voz válidos podem ser encontrados aqui.
SpeechServiceConnection_TranslationFeatures	Recursos de tradução. Para uso interno.
SpeechServiceConnection_RecoMode	O modo de reconhecimento do Serviço de Fala dos Serviços Cognitivos. Pode ser "INTERATIVO", "CONVERSA", "DITADO". Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente.
SpeechServiceConnection_RecoLanguage	O idioma falado a ser reconhecido (no formato BCP-47). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetSpeechRecognitionLanguage.
Speech_SessionId	A ID da sessão. Essa ID é um identificador universalmente exclusivo (também conhecido como UUID) que representa uma associação específica de um fluxo de entrada de áudio e a instância de reconhecimento de fala subjacente à qual ela está associada. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SessionEventArgs::SessionId.
SpeechServiceConnection_UserDefinedQueryParameters	Os parâmetros de consulta fornecidos pelos usuários. Eles serão passados para o serviço como parâmetros de consulta de URL. Adicionado na versão 1.5.0.
SpeechServiceConnection_RecoBackend	A cadeia de caracteres para especificar o back-end a ser usado para reconhecimento de fala; as opções permitidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, a opção offline só é válida quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_RecoModelName	O nome do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_RecoModelKey	Essa propriedade foi preterida.
SpeechServiceConnection_RecoModelIniFile	O caminho para o arquivo ini do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthLanguage	O idioma falado a ser sintetizado (por exemplo, en-US) adicionado na versão 1.4.0.
SpeechServiceConnection_SynthVoice	O nome da voz TTS a ser usada para síntese de fala adicionada na versão 1.4.0.
SpeechServiceConnection_SynthOutputFormat	A cadeia de caracteres para especificar o formato de áudio de saída do TTS adicionado na versão 1.4.0.
SpeechServiceConnection_SynthEnableCompressedAudioTransmission	Indica se usar o formato de áudio compactado para transmissão de áudio de síntese de fala. Essa propriedade afeta somente quando SpeechServiceConnection_SynthOutputFormat é definido como um formato pcm. Se essa propriedade não estiver definida e o GStreamer estiver disponível, o SDK usará o formato compactado para transmissão de áudio sintetizada e a decodificará. Você pode definir essa propriedade como "false" para usar o formato pcm bruto para transmissão na transmissão. Adicionado na versão 1.16.0.
SpeechServiceConnection_SynthBackend	A cadeia de caracteres para especificar o back-end do TTS; as opções válidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths para definir o back-end de síntese como offline. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthOfflineDataPath	Os caminhos do arquivo de dados para o mecanismo de síntese offline; válido somente quando o back-end de síntese está offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthOfflineVoice	O nome da voz TTS offline a ser usada para síntese de fala em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::SetSpeechSynthesisVoice e EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Adicionado na versão 1.19.0.
SpeechServiceConnection_SynthModelKey	Essa propriedade foi preterida.
SpeechServiceConnection_VoicesListEndpoint	O ponto de extremidade de API (URL) da lista de vozes do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não precisa especificar essa propriedade, o SDK a construirá com base na região/host/ponto de extremidade de SpeechConfig. Adicionado na versão 1.16.0.
SpeechServiceConnection_InitialSilenceTimeoutMs	O valor de tempo limite de silêncio inicial (em milissegundos) usado pelo serviço. Adicionado na versão 1.5.0.
SpeechServiceConnection_EndSilenceTimeoutMs	Essa propriedade foi preterida. Para obter informações atualizadas sobre tempos limite de silêncio, visite https://aka.ms/csspeech/timeouts.
SpeechServiceConnection_EnableAudioLogging	Um valor booliano que especifica se o log de áudio está habilitado no serviço ou não. Os logs de áudio e conteúdo são armazenados no armazenamento de propriedade da Microsoft ou em sua própria conta de armazenamento vinculada ao recurso de Fala habilitado para ByOS (Traga Seu Próprio Armazenamento). Adicionado na versão 1.5.0.
SpeechServiceConnection_LanguageIdMode	O modo de identificador de linguagem de conexão do serviço de fala. Pode ser "AtStart" (o padrão) ou "Contínuo". Consulte documento de Identificação de Idioma. Adicionado em 1.25.0.
SpeechServiceConnection_TranslationCategoryId	A categoryId de conversão de conexão do serviço de fala.
SpeechServiceConnection_AutoDetectSourceLanguages	Os idiomas de origem de detecção automática adicionados na versão 1.8.0.
SpeechServiceConnection_AutoDetectSourceLanguageResult	O resultado do idioma de origem de detecção automática adicionado na versão 1.8.0.
SpeechServiceResponse_RequestDetailedResultTrueFalse	O formato de saída de resposta do Serviço de Fala dos Serviços Cognitivos solicitado (simples ou detalhado). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetOutputFormat.
SpeechServiceResponse_RequestProfanityFilterTrueFalse	O nível de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitado. Atualmente não utilizado.
SpeechServiceResponse_ProfanityOption	A configuração de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitada. Os valores permitidos são "mascarados", "removidos" e "brutos". Adicionado na versão 1.5.0.
SpeechServiceResponse_PostProcessingOption	Um valor de cadeia de caracteres que especifica qual opção de pós-processamento deve ser usada pelo serviço. Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestWordLevelTimestamps	Um valor booliano que especifica se os carimbos de data/hora de nível de palavra devem ser incluídos no resultado da resposta. Adicionado na versão 1.5.0.
SpeechServiceResponse_StablePartialResultThreshold	O número de vezes que uma palavra precisa estar em resultados parciais a serem retornados. Adicionado na versão 1.5.0.
SpeechServiceResponse_OutputFormatOption	Um valor de cadeia de caracteres que especifica a opção de formato de saída no resultado da resposta. Somente uso interno. Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestSnr	Um valor booliano que especifica se o SNR (taxa de sinal para ruído) deve ser incluído no resultado da resposta. Adicionado na versão 1.18.0.
SpeechServiceResponse_TranslationRequestStablePartialResult	Um valor booliano a ser solicitado para estabilizar os resultados parciais da tradução omitindo palavras no final. Adicionado na versão 1.5.0.
SpeechServiceResponse_RequestWordBoundary	Um valor booliano que especifica se os eventos WordBoundary devem ser solicitados. Adicionado na versão 1.21.0.
SpeechServiceResponse_RequestPunctuationBoundary	Um valor booliano que especifica se o limite de pontuação deve ser solicitado em Eventos WordBoundary. O padrão é verdadeiro. Adicionado na versão 1.21.0.
SpeechServiceResponse_RequestSentenceBoundary	Um valor booliano que especifica se o limite de sentença deve ser solicitado em Eventos WordBoundary. O padrão é false. Adicionado na versão 1.21.0.
SpeechServiceResponse_SynthesisEventsSyncToAudio	Um valor booliano que especifica se o SDK deve sincronizar eventos de metadados de síntese (por exemplo, limite de palavra, viseme etc.) com a reprodução de áudio. Isso só entra em vigor quando o áudio é reproduzido por meio do SDK. O padrão é verdadeiro. Se definido como false, o SDK disparará os eventos conforme eles vêm do serviço, o que pode estar fora de sincronia com a reprodução de áudio. Adicionado na versão 1.31.0.
SpeechServiceResponse_JsonResult	A saída de resposta do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Essa propriedade está disponível somente em objetos de resultado de reconhecimento.
SpeechServiceResponse_JsonErrorDetails	Os detalhes de erro do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use CancellationDetails::ErrorDetails.
SpeechServiceResponse_RecognitionLatencyMs	A latência de reconhecimento em milissegundos. Somente leitura, disponível nos resultados finais de fala/tradução. Isso mede a latência entre quando uma entrada de áudio é recebida pelo SDK e o momento em que o resultado final é recebido do serviço. O SDK calcula a diferença de tempo entre o último fragmento de áudio da entrada de áudio que está contribuindo para o resultado final e a hora em que o resultado final é recebido do serviço de fala. Adicionado na versão 1.3.0.
SpeechServiceResponse_RecognitionBackend	O back-end de reconhecimento. Somente leitura, disponível nos resultados do reconhecimento de fala. Isso indica se o reconhecimento de nuvem (online) ou incorporado (offline) foi usado para produzir o resultado.
SpeechServiceResponse_RequestId	O ID do pedido do serviço de fala para esse reconhecimento. Este é um identificador único para a solicitação. Somente leitura, disponível nos resultados finais de reconhecimento de fala/tradução.
SpeechServiceResponse_SynthesisFirstByteLatencyMs	A síntese de fala primeiro byte latência em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que o primeiro áudio de byte está disponível. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisFinishLatencyMs	A síntese de fala sintetiza a latência de todos os bytes em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que todo o áudio é sintetizado. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisUnderrunTimeMs	O tempo de execução inferior da síntese de fala em milissegundos. Somente leitura, disponível em resultados em eventos SynthesisCompleted. Isso mede o tempo total de subexecução de PropertyId::AudioConfig_PlaybackBufferLengthInMs é preenchido para a síntese concluída. Adicionado na versão 1.17.0.
SpeechServiceResponse_SynthesisConnectionLatencyMs	A latência de conexão de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que a conexão HTTP/WebSocket é estabelecida. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisNetworkLatencyMs	A latência de rede de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de ida e volta da rede. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisServiceLatencyMs	A latência do serviço de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de processamento do serviço para sintetizar o primeiro byte de áudio. Adicionado na versão 1.26.0.
SpeechServiceResponse_SynthesisBackend	Indica por qual back-end a síntese foi concluída. Somente leitura, disponível nos resultados da síntese de fala, exceto pelo resultado no evento SynthesisStarted adicionado na versão 1.17.0.
SpeechServiceResponse_DiarizeIntermediateResults	Determina se os resultados intermediários contêm identificação do locutor.
CancellationDetails_Reason	O motivo do cancelamento. Atualmente não utilizado.
CancellationDetails_ReasonText	O texto de cancelamento. Atualmente não utilizado.
CancellationDetails_ReasonDetailedText	O texto detalhado do cancelamento. Atualmente não utilizado.
AudioConfig_DeviceNameForCapture	O nome do dispositivo para captura de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromMicrophoneInput. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_NumberOfChannelsForCapture	O número de canais para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_SampleRateForCapture	A taxa de exemplo (em Hz) para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_BitsPerSampleForCapture	O número de bits de cada exemplo para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0.
AudioConfig_AudioSource	A fonte de áudio. Os valores permitidos são "Microfones", "Arquivo" e "Fluxo". Adicionado na versão 1.3.0.
AudioConfig_DeviceNameForRender	O nome do dispositivo para renderização de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromSpeakerOutput. Adicionado na versão 1.14.0.
AudioConfig_PlaybackBufferLengthInMs	Comprimento do buffer de reprodução em milissegundos, o padrão é 50 milissegundos.
AudioConfig_AudioProcessingOptions	Opções de processamento de áudio no formato JSON.
Speech_LogFilename	O nome do arquivo para gravar logs. Adicionado na versão 1.4.0.
Speech_SegmentationSilenceTimeoutMs	Uma duração do silêncio detectado, medida em milissegundos, após a qual a conversão de fala em texto determinará que uma frase falada terminou e gerará um resultado reconhecido final. Configurar esse tempo limite pode ser útil em situações em que a entrada falada é significativamente mais rápida ou mais lenta do que o normal e o comportamento de segmentação padrão produz consistentemente resultados que são muito longos ou muito curtos. Valores de tempo limite de segmentação inadequadamente altos ou baixos podem afetar negativamente a precisão de fala em texto; essa propriedade deve ser cuidadosamente configurada e o comportamento resultante deve ser validado minuciosamente conforme o esperado. O valor deve estar no intervalo [100,5000] milissegundos.
Speech_SegmentationMaximumTimeMs	O comprimento máximo de uma frase falada ao usar a estratégia de segmentação "Time". O valor de Speech_SegmentationSilenceTimeoutMs deve ser definido para usar essa configuração. À medida que o comprimento de uma frase falada se aproxima desse valor, o Speech_SegmentationSilenceTimeoutMs começará a ser reduzido até que o tempo limite do silêncio da frase seja atingido ou a frase atinja o comprimento máximo. O valor deve estar no intervalo [20000, 70000] milissegundos.
Speech_SegmentationStrategy	A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".
Speech_StartEventSensitivity	Controle a rapidez com que o sistema sinaliza que uma possível fala começa após detectar atividade vocal. Essa configuração não altera o algoritmo subjacente de detecção de atividade de voz. Ele apenas ajusta os critérios de tempo para levantar um evento SpeechStartDetected.
Conversation_ApplicationId	Identificador usado para se conectar ao serviço de back-end. Adicionado na versão 1.5.0.
Conversation_DialogType	Tipo de back-end de caixa de diálogo ao qual se conectar. Adicionado na versão 1.7.0.
Conversation_Initial_Silence_Timeout	Tempo limite de silêncio para ouvir Adicionado na versão 1.5.0.
Conversation_From_Id	Da ID a ser usada nas atividades de reconhecimento de fala adicionadas na versão 1.5.0.
Conversation_Conversation_Id	ConversationId para a sessão. Adicionado na versão 1.8.0.
Conversation_Custom_Voice_Deployment_Ids	Lista separada por vírgulas de IDs de implantação de voz personalizada. Adicionado na versão 1.8.0.
Conversation_Speech_Activity_Template	Modelo de atividade de fala, propriedades de carimbo no modelo na atividade gerada pelo serviço de fala. Adicionado na versão 1.10.0.
Conversation_ParticipantId	O identificador do participante na conversa atual. Adicionado na versão 1.13.0.
Conversation_Request_Bot_Status_Messages
Conversation_Connection_Id
DataBuffer_TimeStamp	O carimbo de data/hora associado ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. O carimbo de data/hora é um valor de 64 bits com uma resolução de 90 kHz. É o mesmo que o carimbo de data/hora da apresentação em um fluxo de transporte MPEG. Consulte https://en.wikipedia.org/wiki/Presentation_timestamp Adicionado na versão 1.5.0.
DataBuffer_UserId	A ID do usuário associada ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. Adicionado na versão 1.5.0.
PronunciationAssessment_ReferenceText	O texto de referência do áudio para avaliação de pronúncia. Para este e os seguintes parâmetros de avaliação de pronúncia, consulte a tabela parâmetros de avaliação de pronúncia. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Create ou PronúnciaAssessmentConfig::SetReferenceText. Adicionado na versão 1.14.0.
PronunciationAssessment_GradingSystem	O sistema de pontos para calibragem de pontuação de pronúncia (FivePoint ou HundredMark). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_Granularity	A granularidade da avaliação de pronúncia (Phoneme, Word ou FullText). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_EnableMiscue	Define se habilitar o cálculo de erro. Com isso habilitado, as palavras pronunciadas serão comparadas ao texto de referência e serão marcadas com omissão/inserção com base na comparação. A configuração padrão é False. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_PhonemeAlphabet	O alfabeto phoneme de avaliação de pronúncia. Os valores válidos são "SAPI" (padrão) e "IPA" Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetPhonemeAlphabet. Adicionado na versão 1.20.0.
PronunciationAssessment_NBestPhonemeCount	A avaliação de pronúncia nbest phoneme count. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetNBestPhonemeCount. Adicionado na versão 1.20.0.
PronunciationAssessment_EnableProsodyAssessment	Se deseja habilitar a avaliação prosody. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::EnableProsodyAssessment. Adicionado na versão 1.33.0.
PronunciationAssessment_Json	A cadeia de caracteres json dos parâmetros de avaliação de pronúncia em circunstâncias normais, você não deve precisar usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0.
PronunciationAssessment_Params	Parâmetros de avaliação de pronúncia. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. Adicionado na versão 1.14.0.
SpeechTranslation_ModelName	O nome de um modelo a ser usado para tradução de fala. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado.
SpeechTranslation_ModelKey	Essa propriedade foi preterida.
KeywordRecognition_ModelName	O nome de um modelo a ser usado para o reconhecimento de palavra-chave. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado.
KeywordRecognition_ModelKey	Essa propriedade foi preterida.
EmbeddedSpeech_EnablePerformanceMetrics	Habilite a coleção de métricas de desempenho de fala inseridas que podem ser usadas para avaliar a capacidade de um dispositivo usar fala inserida. Os dados coletados são incluídos nos resultados de cenários específicos, como o reconhecimento de fala. A configuração padrão é "false". Observe que as métricas podem não estar disponíveis em todos os cenários de fala inseridos.
SpeechSynthesisRequest_Pitch	O tom da fala sintetizada.
SpeechSynthesisRequest_Rate	A taxa da fala sintetizada.
SpeechSynthesisRequest_Volume	O volume da fala sintetizada.
SpeechSynthesisRequest_Style	O estilo da fala sintetizada.
SpeechSynthesisRequest_Temperature	A temperatura da fala sintetizada. O parâmetro de temperatura só entra em vigor quando a voz é uma voz HD.
SpeechSynthesisRequest_CustomLexiconUrl	A URL do léxico personalizado para a fala sintetizada. Isso fornece uma URL para um léxico de pronúncia personalizado a ser usado durante a síntese.
SpeechSynthesisRequest_PreferLocales	Os locais preferidos para a fala sintetizada. Lista separada por vírgulas de nomes de localidade em ordem de preferência.
SpeechSynthesis_FrameTimeoutInterval	O intervalo de tempo limite em milissegundos entre os quadros de áudio de fala sintetizados. O maior deste e 10 segundos é usado como um tempo limite de quadro rígido. Um tempo limite de síntese de fala ocorre se a) o tempo passado desde que o último quadro excede esse intervalo de tempo limite e o RTF (fator Real-Time) excede seu valor máximo, ou b) o tempo passado desde que o quadro mais recente excede o tempo limite do quadro rígido.
SpeechSynthesis_RtfTimeoutThreshold	O RTF (fator de Real-Time máximo) para síntese de fala. O RTF é calculado como RTF = f(d)/d, em que f(d) é o tempo necessário para sintetizar o áudio de fala da duração d.

Define ids de propriedade de fala. Alterado na versão 1.4.0.

enumeração OutputFormat

Valores	Descrições
Simples
Circunstanciado

Formato de saída.

enum ProfanityOption

Valores	Descrições
Mascarado	Substitui letras em palavras profanas por caracteres de estrela.
Removido	Remove palavras profanas.
Cru	Não faz nada para palavras profanas.

Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0.

enumeração ResultReason

Valores	Descrições
Sem correspondência	Indica que a fala não pôde ser reconhecida. Mais detalhes podem ser encontrados no objeto NoMatchDetails.
Cancelado	Indica que o reconhecimento foi cancelado. Mais detalhes podem ser encontrados usando o objeto CancellationDetails.
Reconhecendo a fala	Indica que o resultado da fala contém texto de hipótese.
Discurso Reconhecido	Indica que o resultado da fala contém o texto final que foi reconhecido. O Reconhecimento de Fala agora está completo para esta frase.
ReconhecendoIntent	Esse motivo de resultado está desatualizado e não é mais utilizado.
RecognizedIntent	Esse motivo de resultado está desatualizado e não é mais utilizado.
Discurso de tradução	Indica que o resultado da tradução contém texto de hipótese e suas traduções.
Discurso traduzido	Indica que o resultado da tradução contém o texto final e as traduções correspondentes. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase.
Sintetizando Áudio	Indica que o resultado do áudio sintetizado contém uma quantidade diferente de zero de dados de áudio.
SintetizandoÁudioConcluído	Indica que o áudio sintetizado agora está completo para esta frase.
Reconhecendo a palavra-chave	Indica que o resultado da fala contém texto de palavra-chave (não verificado). Adicionado na versão 1.3.0.
Palavra-chave reconhecida	Indica que o reconhecimento de palavra-chave foi concluído reconhecendo a palavra-chave fornecida. Adicionado na versão 1.3.0.
SintetizandoÁudioIniciado	Indica que a síntese de fala agora foi iniciada adicionada na versão 1.4.0.
TraduzindoParticipanteDiscurso	Indica que o resultado da transcrição contém o texto da hipótese e suas traduções para outros participantes na conversa. Adicionado na versão 1.8.0.
Discurso TraduzidoParticipante	Indica que o resultado da transcrição contém texto final e conversões correspondentes para outros participantes na conversa. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase. Adicionado na versão 1.8.0.
TranslatedInstantMessage	Indica que o resultado da transcrição contém a mensagem instantânea e as traduções correspondentes. Adicionado na versão 1.8.0.
TranslatedParticipantInstantMessage	Indica que o resultado da transcrição contém a mensagem instantânea para outros participantes na conversa e nas traduções correspondentes. Adicionado na versão 1.8.0.
InscrevendoVoiceProfile	Esse motivo de resultado está desatualizado e não é mais utilizado.
PerfilInscritoVoiceProfile	Esse motivo de resultado está desatualizado e não é mais utilizado.
Palestrantes reconhecidos	Esse motivo de resultado está desatualizado e não é mais utilizado.
RecognizedSpeaker	Esse motivo de resultado está desatualizado e não é mais utilizado.
ResetVoiceProfile	Esse motivo de resultado está desatualizado e não é mais utilizado.
Perfil de voz excluído	Esse motivo de resultado está desatualizado e não é mais utilizado.
Lista de Vozes Recuperada	Indica que a lista de vozes foi recuperada com êxito. Adicionado na versão 1.16.0.

Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.

enum CancellationReason

Valores	Descrições
Erro	Indica que ocorreu um erro durante o reconhecimento de fala.
Fim do Fluxo	Indica que o final do fluxo de áudio foi atingido.
CancelledByUser	Indica que a solicitação foi cancelada pelo usuário. Adicionado na versão 1.14.0.

Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.

enumeração CancellationErrorCode

Valores	Descrições
Noerror	Nenhum erro. Se CancellationReason for EndOfStream, CancellationErrorCode será definido como NoError.
Falha de autenticação	Indica um erro de autenticação. Ocorrerá um erro de autenticação se a chave de assinatura ou o token de autorização for inválido, tiver expirado ou não corresponder à região que está sendo usada.
SolicitaçãoInválida	Indica que um ou mais parâmetros de reconhecimento são inválidos ou não há suporte para o formato de áudio.
Muitas Solicitações	Indica que o número de solicitações paralelas excedeu o número de transcrições simultâneas permitidas para a assinatura.
Proibido	Indica que a assinatura gratuita usada pela solicitação ficou sem cota.
Falha de conexão	Indica um erro de conexão.
Tempo limite de serviço	Indica um erro de tempo limite ao aguardar a resposta do serviço.
Erro de Serviço	Indica que um erro é retornado pelo serviço.
ServiçoIndisponível	Indica que o serviço está indisponível no momento.
Erro de tempo de execução	Indica um erro de runtime inesperado.
Redirecionamento de ServiçoTemporário	Indica que o Serviço de Fala está solicitando temporariamente uma reconexão a um ponto de extremidade diferente.
Redirecionamento de ServiçoPermanente	Indica que o Serviço de Fala está solicitando permanentemente uma reconexão a um ponto de extremidade diferente.
EmbeddedModelError	Indica que o modelo de fala inserida (SR ou TTS) não está disponível ou corrompido.

Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0.

enumeração NoMatchReason

Valores	Descrições
Não reconhecido	Indica que a fala foi detectada, mas não reconhecida.
InitialSilenceTimeout	Indica que o início do fluxo de áudio continha apenas silêncio e o serviço atingiu o tempo limite aguardando fala.
InitialBabbleTimeout	Indica que o início do fluxo de áudio continha apenas ruído e o serviço atingiu o tempo limite aguardando fala.
Palavra-chaveNotRecognized	Indica que a palavra-chave detectada foi rejeitada pelo serviço de verificação de palavra-chave. Adicionado na versão 1.5.0.
EndSilenceTimeout	Indica que o fluxo de áudio continha apenas silêncio após a última frase reconhecida.

Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.

enum ActivityJSONType

Valores	Descrições
Zero
Objeto
Matriz
Corda
Dobrar
UInt
Int
booleano

Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0.

enumeração SpeechSynthesisOutputFormat

Valores	Descrições
Raw8Khz8BitMonoMULaw	RAW-8KHz-8bit-mono-mulaw
Riff16Khz16KbpsMonoSiren	riff-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor.
Áudio16Khz16KbpsMonoSiren	audio-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor.
Áudio16Khz32KBitRateMonoMp3	áudio-16kHz-32kbitrate-mono-mp3
Áudio16Khz128KBitRateMonoMp3	áudio-16kHz-128kbitrate-mono-mp3
Áudio16Khz64KBitRateMonoMp3	áudio-16kHz-64kBitrate-mono-mp3
Áudio24Khz48KBitRateMonoMp3	áudio-24kHz-48kbitrate-mono-mp3
Áudio24Khz96KBitRateMonoMp3	áudio-24kHz-96kbitrate-mono-mp3
Áudio24Khz160KBitRateMonoMp3	áudio-24khz-160kbps-mono-mp3
Raw16Khz16BitMonoTrueSilk	raw-16khz-16bit-mono-truesilk
Riff16Khz16BitMonoPcm	riff-16khz-16bit-mono-pcm
Riff8Khz16BitMonoPcm	riff-8khz-16bit-mono-pcm
Riff24Khz16BitMonoPcm	RIFF-24KHz-16Bit-Mono-PCM
Riff8Khz8BitMonoMULaw	riff-8khz-8bit-mono-mulaw
Raw16Khz16BitMonoPcm	RAW-16KHz-16Bit-Mono-PCM
Raw24Khz16BitMonoPcm	Raw-24KHz-16Bit-Mono-PCM
Raw8Khz16BitMonoPcm	Raw-8KHz-16Bit-Mono-PCM
Ogg16Khz16BitMonoOpus	OGG-16KHz-16Bit-Mono-OPUS
Ogg24Khz16BitMonoOpus	OGG-24KHz-16Bit-Mono-OPUS
Raw48Khz16BitMonoPcm	RAW-48KHz-16Bit-Mono-PCM
Riff48Khz16BitMonoPcm	RIFF-48KHz-16Bit-Mono-PCM
Áudio48Khz96KBitRateMonoMp3	áudio-48kHz-96kbitrate-mono-mp3
Áudio48Khz192KBitRateMonoMp3	áudio-48kHz-192kBitrate-mono-mp3
Ogg48Khz16BitMonoOpus	ogg-48khz-16bit-mono-opus adicionado na versão 1.16.0
Webm16Khz16BitMonoOpus	webm-16khz-16bit-mono-opus adicionado na versão 1.16.0
Webm24Khz16BitMonoOpus	webm-24khz-16bit-mono-opus adicionado na versão 1.16.0
Raw24Khz16BitMonoTrueSilk	raw-24khz-16bit-mono-truesilk Adicionado na versão 1.17.0
Raw8Khz8BitMonoALaw	raw-8khz-8bit-mono-alaw Adicionado na versão 1.17.0
Riff8Khz8BitMonoALaw	riff-8khz-8bit-mono-alaw Adicionado na versão 1.17.0
Webm24Khz16Bit24KbpsMonoOpus	Webm-24khz-16bit-24kbps-mono-opus Audio compactado pelo codec OPUS em um contêiner de WebM, com taxa de bits de 24kbps, otimizado para o cenário de IoT. (Adicionado em 1.19.0)
Áudio16Khz16Bit32KbpsMonoOpus	áudio-16khz-16bit-32kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 32kbps. (Adicionado em 1.20.0)
Áudio24Khz16Bit48KbpsMonoOpus	áudio-24khz-16bit-48kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 48kbps. (Adicionado em 1.20.0)
Áudio24Khz16Bit24KbpsMonoOpus	áudio-24khz-16bit-24kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 24kbps. (Adicionado em 1.20.0)
Raw22050Hz16BitMonoPcm	raw-22050hz-16bit-mono-pcm Áudio PCM bruto a 22050Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0)
Riff22050Hz16BitMonoPcm	riff-22050hz-16bit-mono-pcm PCM áudio a 22050Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0)
Raw44100Hz16BitMonoPcm	raw-44100hz-16bit-mono-pcm Áudio PCM bruto a 44100Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0)
Riff44100Hz16BitMonoPcm	riff-44100hz-16bit-mono-pcm áudio PCM a 44100Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0)
AmrWb16000Hz	amr-wb-16000hz AMR-WB áudio a uma taxa de amostragem de 16kHz. (Adicionado em 1.24.0)
G72216Khz64Kbps	g722-16khz-64kbps G.722 áudio a 16kHz taxa de amostragem e taxa de bits de 64kbps. (Adicionado em 1.38.0)

Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0.

enumeração StreamStatus

Valores	Descrições
Desconhecido	O status do fluxo de dados de áudio é desconhecido.
Sem Dados	O fluxo de dados de áudio não contém dados.
Dados parciais	O fluxo de dados de áudio contém dados parciais de uma solicitação de fala.
Todos os dados	O fluxo de dados de áudio contém todos os dados de uma solicitação de fala.
Cancelado	O fluxo de dados de áudio foi cancelado.

Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0.

enumeração ServicePropertyChannel

Valores	Descrições
UriQueryParameter	Usa o parâmetro de consulta URI para passar as configurações de propriedade para o serviço.
Cabeçalho HTTP	Usa HttpHeader para definir uma chave/valor em um cabeçalho HTTP.

Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0.

enumeração RecognitionFactorScope

Valores	Descrições
Frase Parcial	Um Fator de Reconhecimento será aplicado a gramáticas que podem ser referenciadas como frases parciais individuais.

Define o escopo ao qual um Fator de Reconhecimento é aplicado.

enumationAssessmentGradingSystem

Valores	Descrições
Cinco pontos	Calibragem de cinco pontos.
CemMarcos	Marca de cem.

Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0.

enumationAssessmentGranularity

Valores	Descrições
Fonema	Mostra a pontuação no nível completo de texto, palavra e phoneme.
Palavra	Mostra a pontuação no nível de texto e palavra completos.
Texto Completo	Mostra a pontuação somente no nível de texto completo.

Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0.

enumEração SynthesisVoiceType

Valores	Descrições
Neural Online	Voz neural online.
OnlinePadrão	Voz padrão online.
Off-line neural	Voz neural offline.
OfflinePadrão	Voz padrão offline.

Define o tipo de vozes de síntese adicionadas na versão 1.16.0.

enum SínteseVozGênero

Valores	Descrições
Desconhecido	Gênero desconhecido.
Fêmea	Voz feminina.
Macho	Voz masculina.
Neutro	Voz neutra.

Define o gênero das vozes de síntese adicionadas na versão 1.17.0.

enumErar SynthesisVoiceStatus

Valores	Descrições
Desconhecido	Status da voz desconhecido.
Disponibilidade geral	A voz está disponível em geral.
Versão Prévia	A voz está em versão prévia.
Deprecado	A voz foi preterida, não use.

Define o status das vozes de síntese.

enumeração SpeechSynthesisBoundaryType

Valores	Descrições
Palavra	Limite do Word.
Pontuação	Limite de pontuação.
Frase	Limite de sentença.

Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0.

Estratégia de Segmentação de Elementos

Valores	Descrições
Inadimplência	Use a estratégia e as configurações padrão, conforme determinado pelo Serviço de Fala. Use na maioria das situações.
Hora	Usa uma estratégia baseada em tempo em que a quantidade de silêncio entre a fala é usada para determinar quando gerar um resultado final.
Semântico	Usa um modelo de IA para deter o final de uma frase falada com base no conteúdo da frase.

A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".

Last updated on 2026-05-14