Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
Resumo
| Membros | Descrições |
|---|---|
| enumeração PropertyId | Define ids de propriedade de fala. Alterado na versão 1.4.0. |
| OutputFormat enum | Formato de saída. |
| enumeração ProfanityOption | Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0. |
| enumeração ResultReason | Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado. |
| enum CancellationReason | Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado. |
| enumeração CancellationErrorCode | Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0. |
| enumeração NoMatchReason | Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido. |
| ActivityJSONType enum | Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0. |
| SpeechSynthesisOutputFormat | Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0. |
| enumeração StreamStatus | Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0. |
| ServicePropertyChannel de enumeração | Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0. |
| RecognitionFactorScope enum | Define o escopo ao qual um Fator de Reconhecimento é aplicado. |
| enumeração PronúnciaAssessmentGradingSystem | Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0. |
| enumeração PronúnciaAssessmentGranularity |
Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0. |
| SynthesisVoiceType | Define o tipo de vozes de síntese adicionadas na versão 1.16.0. |
| |
Define o gênero das vozes de síntese adicionadas na versão 1.17.0. |
| enumeração SynthesisVoiceStatus | Define o status das vozes de síntese. |
| SpeechSynthesisBoundaryType | Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0. |
| segmentationStrategy | A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico". |
| classe AudioDataStream | Representa o fluxo de dados de áudio usado para operar dados de áudio como um fluxo. Adicionado na versão 1.4.0. |
| classe AutoDetectSourceLanguageConfig | Classe que define a configuração de origem de detecção automática atualizada em 1.13.0. |
| classe AutoDetectSourceLanguageResult | Contém o resultado do idioma de origem detectado automaticamente adicionado em 1.8.0. |
| classe ClassLanguageModel | Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0. |
| classe Connection | A conexão é uma classe proxy para gerenciar a conexão com o serviço de fala do Reconhecedor especificado. Por padrão, um Reconhecedor gerencia de forma autônoma a conexão com o serviço quando necessário. A classe Connection fornece métodos adicionais para que os usuários abram ou fechem explicitamente uma conexão e assinem as alterações de status da conexão. O uso da Conexão é opcional. Destina-se a cenários em que o ajuste fino do comportamento do aplicativo com base no status da conexão é necessário. Opcionalmente, os usuários podem chamar Open() para iniciar manualmente uma conexão de serviço antes de iniciar o reconhecimento no Reconhecedor associado a essa Conexão. Depois de iniciar um reconhecimento, a chamada de Open() ou Close() pode falhar. Isso não afetará o Reconhecedor ou o reconhecimento contínuo. A conexão pode ser suspensa por vários motivos, o Reconhecedor sempre tentará reinstituir a conexão conforme necessário para garantir operações em andamento. Em todos esses casos, eventos conectados/desconectados indicarão a alteração do status da conexão. Atualizado na versão 1.17.0. |
| classe ConnectionEventArgs | Fornece dados para o ConnectionEvent. Adicionado na versão 1.2.0. |
| classe ConnectionMessage | ConnectionMessage representa mensagens específicas de implementação enviadas e recebidas do serviço de fala. Essas mensagens são fornecidas para fins de depuração e não devem ser usadas para casos de uso de produção com o Serviço de Fala dos Serviços Cognitivos do Azure. As mensagens enviadas e recebidas do Serviço de Fala estão sujeitas a alterações sem aviso prévio. Isso inclui conteúdo de mensagens, cabeçalhos, conteúdos, pedidos etc. Adicionado na versão 1.10.0. |
| classe ConnectionMessageEventArgs | Fornece dados para o ConnectionMessageEvent. |
| classe EmbeddedSpeechConfig | Classe que define a configuração de fala inserida (offline). |
| classe EventArgs | Classe base para argumentos de evento. |
| eventSignal da classe |
Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos. |
| classe EventSignalBase | Os clientes podem se conectar ao sinal de evento para receber eventos ou desconectar-se do sinal de evento para interromper o recebimento de eventos. |
| classe Grammar | Representa a gramática de classe base para personalizar o reconhecimento de fala. Adicionado na versão 1.5.0. |
| classe GrammarList | Representa uma lista de gramáticas para cenários de gramática dinâmica. Adicionado na versão 1.7.0. |
| classe GrammarPhrase | Representa uma frase que pode ser dita pelo usuário. Adicionado na versão 1.5.0. |
| classe HybridSpeechConfig | Classe que define configurações híbridas (na nuvem e inseridas) para reconhecimento de fala ou síntese de fala. |
| classe KeywordRecognitionEventArgs | Classe para os eventos emmitidos pelo KeywordRecognizer. |
| classe KeywordRecognitionModel | Representa o modelo de reconhecimento de palavra-chave usado com métodos StartKeywordRecognitionAsync. |
| classe KeywordRecognitionResult | Classe que define os resultados emitidos pelo KeywordRecognizer. |
| classe KeywordRecognizer | Tipo de reconhecedor especializado para manipular apenas a ativação da palavra-chave. |
| classe PhraseListGrammar | Representa uma gramática de lista de frases para cenários de gramática dinâmica. Adicionado na versão 1.5.0. |
| classe PronunciationAssessmentConfig | Classe que define a configuração de avaliação de pronúncia adicionada em 1.14.0. |
| classe PronúnciaAssessmentResult | Classe para resultados da avaliação de pronúncia. |
| classe PropertyCollection | Classe para recuperar ou definir um valor de propriedade de uma coleção de propriedades. |
| classe AsyncRecognizer | Classe base abstrata AsyncRecognizer. |
| classe BaseAsyncRecognizer | Classe BaseAsyncRecognizer. |
| da classe |
Fornece dados para o RecognitionEvent. |
| classe RecognitionResult | Contém informações detalhadas sobre o resultado de uma operação de reconhecimento. |
| classe CancellationDetails | Contém informações detalhadas sobre por que um resultado foi cancelado. |
| classe NoMatchDetails | Contém informações detalhadas para resultados de reconhecimento noMatch. |
| do Reconhecedor de Classe | Classe base do reconhecedor. |
| classe SessionEventArgs | Classe base para argumentos de evento de sessão. |
| classe SmartHandle | Classe de identificador inteligente. |
| classe SourceLanguageConfig | Classe que define a configuração do idioma de origem, adicionada em 1.8.0. |
| classe SourceLanguageRecognizer | Classe para reconhecedores de idioma de origem. Você pode usar essa classe para detecção de idioma autônomo. Adicionado na versão 1.17.0. |
| classe SpeechConfig | Classe que define configurações para reconhecimento de voz ou síntese de voz. |
| classe SpeechRecognitionEventArgs | Classe para argumentos de evento de reconhecimento de fala. |
| classe SpeechRecognitionCanceledEventArgs | Classe para reconhecimento de fala cancelou argumentos de evento. |
| classe SpeechRecognitionModel | Informações do modelo de reconhecimento de fala. |
| classe SpeechRecognitionResult | Classe base para resultados de reconhecimento de fala. |
| classe SpeechRecognizer | Classe para reconhecedores de fala. |
| classe SpeechSynthesisBookmarkEventArgs | Classe para argumentos de evento de indicador de síntese de fala. Adicionado na versão 1.16.0. |
| classe SpeechSynthesisEventArgs | Classe para argumentos de evento de síntese de fala. Adicionado na versão 1.4.0. |
| classe SpeechSynthesisRequest | Classe que define a solicitação de síntese de fala. Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.37.0. |
| classe PersonalVoiceSynthesisRequest | Classe que define a solicitação de síntese de fala para voz pessoal (aka.ms/azureai/personal-voice). Essa classe está em versão prévia e está sujeita a alterações. Adicionado na versão 1.39.0. |
| classe SpeechSynthesisResult | Contém informações sobre o resultado da síntese de texto em fala. Adicionado na versão 1.4.0. |
| classe SpeechSynthesisCancellationDetails | Contém informações detalhadas sobre por que um resultado foi cancelado. Adicionado na versão 1.4.0. |
| classe SpeechSynthesisVisemeEventArgs | Classe para argumentos de evento de viseme de síntese de fala. Adicionado na versão 1.16.0. |
| classe SpeechSynthesisWordBoundaryEventArgs | Classe para argumentos de evento de limite de palavra de síntese de fala. Adicionado na versão 1.7.0. |
| classe SpeechSynthesizer | Classe para sintetizador de fala. Atualizado na versão 1.14.0. |
| classe SpeechTranslationModel | Informações do modelo de tradução de fala. |
| da classe |
Contém informações sobre o resultado da lista de vozes de sintetizadores de fala. Adicionado na versão 1.16.0. |
| classe VoiceInfo | Contém informações sobre informações de voz de síntese atualizadas na versão 1.17.0. |
Membros
enumeração PropertyId
| Valores | Descrições |
|---|---|
| SpeechServiceConnection_Key | A chave de assinatura do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription. |
| SpeechServiceConnection_Endpoint | O ponto de extremidade do Serviço de Fala dos Serviços Cognitivos (URL). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromEndpoint. OBSERVAÇÃO: esse ponto de extremidade não é o mesmo que o ponto de extremidade usado para obter um token de acesso. |
| SpeechServiceConnection_Region | A região do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromSubscription, SpeechConfig::FromEndpoint, SpeechConfig::FromHost, SpeechConfig::FromAuthorizationToken. |
| SpeechServiceAuthorization_Token | O token de autorização do Serviço de Fala dos Serviços Cognitivos (também conhecido como token de acesso). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromAuthorizationToken, SpeechRecognizer::SetAuthorizationToken ou TranslationRecognizer::SetAuthorizationToken. |
| SpeechServiceAuthorization_Type | O tipo de autorização do Serviço de Fala dos Serviços Cognitivos. Atualmente não utilizado. |
| SpeechServiceConnection_EndpointId | A ID do ponto de extremidade do Serviço de Voz Personalizado ou de Fala Personalizada dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetEndpointId. OBSERVAÇÃO: a ID do ponto de extremidade está disponível no Portal de Fala Personalizada, listado em Detalhes do Ponto de Extremidade. |
| SpeechServiceConnection_Host | O host (URL) do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::FromHost. |
| SpeechServiceConnection_ProxyHostName | O nome do host do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0. |
| SpeechServiceConnection_ProxyPort | A porta do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0. |
| SpeechServiceConnection_ProxyUserName | O nome de usuário do servidor proxy usado para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0. |
| SpeechServiceConnection_ProxyPassword | A senha do servidor proxy usada para se conectar ao Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetProxy. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.1.0. |
| SpeechServiceConnection_Url | A cadeia de caracteres de URL criada a partir da configuração de fala. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. OBSERVAÇÃO: adicionado na versão 1.5.0. |
| SpeechServiceConnection_ProxyHostBypass | Especifica a lista de hosts para os quais os proxies não devem ser usados. Essa configuração substitui todas as outras configurações. Os nomes de host são separados por vírgulas e são correspondidos de maneira que não diferencia maiúsculas de minúsculas. Não há suporte para curingas. |
| SpeechServiceConnection_TranslationToLanguages | A lista de idiomas separados por vírgulas usados como idiomas de tradução de destino. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::AddTargetLanguage e SpeechTranslationConfig::GetTargetLanguages. |
| SpeechServiceConnection_TranslationVoice | O nome da voz do Serviço Cognitivo de Texto em Fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechTranslationConfig::SetVoiceName. OBSERVAÇÃO: Nomes de voz válidos podem ser encontrados aqui. |
| SpeechServiceConnection_TranslationFeatures | Recursos de tradução. Para uso interno. |
| SpeechServiceConnection_RecoMode | O modo de reconhecimento do Serviço de Fala dos Serviços Cognitivos. Pode ser "INTERATIVO", "CONVERSA", "DITADO". Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. |
| SpeechServiceConnection_RecoLanguage | O idioma falado a ser reconhecido (no formato BCP-47). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetSpeechRecognitionLanguage. |
| Speech_SessionId | A ID da sessão. Essa ID é um identificador universalmente exclusivo (também conhecido como UUID) que representa uma associação específica de um fluxo de entrada de áudio e a instância de reconhecimento de fala subjacente à qual ela está associada. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SessionEventArgs::SessionId. |
| SpeechServiceConnection_UserDefinedQueryParameters | Os parâmetros de consulta fornecidos pelos usuários. Eles serão passados para o serviço como parâmetros de consulta de URL. Adicionado na versão 1.5.0. |
| SpeechServiceConnection_RecoBackend | A cadeia de caracteres para especificar o back-end a ser usado para reconhecimento de fala; as opções permitidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, a opção offline só é válida quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_RecoModelName | O nome do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_RecoModelKey | Essa propriedade foi preterida. |
| SpeechServiceConnection_RecoModelIniFile | O caminho para o arquivo ini do modelo a ser usado para reconhecimento de fala. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_SynthLanguage | O idioma falado a ser sintetizado (por exemplo, en-US) adicionado na versão 1.4.0. |
| SpeechServiceConnection_SynthVoice | O nome da voz TTS a ser usada para síntese de fala adicionada na versão 1.4.0. |
| SpeechServiceConnection_SynthOutputFormat | A cadeia de caracteres para especificar o formato de áudio de saída do TTS adicionado na versão 1.4.0. |
| SpeechServiceConnection_SynthEnableCompressedAudioTransmission | Indica se usar o formato de áudio compactado para transmissão de áudio de síntese de fala. Essa propriedade afeta somente quando SpeechServiceConnection_SynthOutputFormat é definido como um formato pcm. Se essa propriedade não estiver definida e o GStreamer estiver disponível, o SDK usará o formato compactado para transmissão de áudio sintetizada e a decodificará. Você pode definir essa propriedade como "false" para usar o formato pcm bruto para transmissão na transmissão. Adicionado na versão 1.16.0. |
| SpeechServiceConnection_SynthBackend | A cadeia de caracteres para especificar o back-end do TTS; as opções válidas estão online e offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths para definir o back-end de síntese como offline. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_SynthOfflineDataPath | Os caminhos do arquivo de dados para o mecanismo de síntese offline; válido somente quando o back-end de síntese está offline. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::FromPath ou EmbeddedSpeechConfig::FromPaths. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_SynthOfflineVoice | O nome da voz TTS offline a ser usada para síntese de fala em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use EmbeddedSpeechConfig::SetSpeechSynthesisVoice e EmbeddedSpeechConfig::GetSpeechSynthesisVoiceName. Adicionado na versão 1.19.0. |
| SpeechServiceConnection_SynthModelKey | Essa propriedade foi preterida. |
| SpeechServiceConnection_VoicesListEndpoint | O ponto de extremidade de API (URL) da lista de vozes do Serviço de Fala dos Serviços Cognitivos. Em circunstâncias normais, você não precisa especificar essa propriedade, o SDK a construirá com base na região/host/ponto de extremidade de SpeechConfig. Adicionado na versão 1.16.0. |
| SpeechServiceConnection_InitialSilenceTimeoutMs | O valor de tempo limite de silêncio inicial (em milissegundos) usado pelo serviço. Adicionado na versão 1.5.0. |
| SpeechServiceConnection_EndSilenceTimeoutMs | Essa propriedade foi preterida. Para obter informações atualizadas sobre tempos limite de silêncio, visite https://aka.ms/csspeech/timeouts. |
| SpeechServiceConnection_EnableAudioLogging | Um valor booliano que especifica se o log de áudio está habilitado no serviço ou não. Os logs de áudio e conteúdo são armazenados no armazenamento de propriedade da Microsoft ou em sua própria conta de armazenamento vinculada ao recurso de Fala habilitado para ByOS (Traga Seu Próprio Armazenamento). Adicionado na versão 1.5.0. |
| SpeechServiceConnection_LanguageIdMode | O modo de identificador de linguagem de conexão do serviço de fala. Pode ser "AtStart" (o padrão) ou "Contínuo". Consulte documento de Identificação de Idioma. Adicionado em 1.25.0. |
| SpeechServiceConnection_TranslationCategoryId | A categoryId de conversão de conexão do serviço de fala. |
| SpeechServiceConnection_AutoDetectSourceLanguages | Os idiomas de origem de detecção automática adicionados na versão 1.8.0. |
| SpeechServiceConnection_AutoDetectSourceLanguageResult | O resultado do idioma de origem de detecção automática adicionado na versão 1.8.0. |
| SpeechServiceResponse_RequestDetailedResultTrueFalse | O formato de saída de resposta do Serviço de Fala dos Serviços Cognitivos solicitado (simples ou detalhado). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use SpeechConfig::SetOutputFormat. |
| SpeechServiceResponse_RequestProfanityFilterTrueFalse | O nível de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitado. Atualmente não utilizado. |
| SpeechServiceResponse_ProfanityOption | A configuração de profanidade de saída da resposta do Serviço de Fala dos Serviços Cognitivos solicitada. Os valores permitidos são "mascarados", "removidos" e "brutos". Adicionado na versão 1.5.0. |
| SpeechServiceResponse_PostProcessingOption | Um valor de cadeia de caracteres que especifica qual opção de pós-processamento deve ser usada pelo serviço. Adicionado na versão 1.5.0. |
| SpeechServiceResponse_RequestWordLevelTimestamps | Um valor booliano que especifica se os carimbos de data/hora de nível de palavra devem ser incluídos no resultado da resposta. Adicionado na versão 1.5.0. |
| SpeechServiceResponse_StablePartialResultThreshold | O número de vezes que uma palavra precisa estar em resultados parciais a serem retornados. Adicionado na versão 1.5.0. |
| SpeechServiceResponse_OutputFormatOption | Um valor de cadeia de caracteres que especifica a opção de formato de saída no resultado da resposta. Somente uso interno. Adicionado na versão 1.5.0. |
| SpeechServiceResponse_RequestSnr | Um valor booliano que especifica se o SNR (taxa de sinal para ruído) deve ser incluído no resultado da resposta. Adicionado na versão 1.18.0. |
| SpeechServiceResponse_TranslationRequestStablePartialResult | Um valor booliano a ser solicitado para estabilizar os resultados parciais da tradução omitindo palavras no final. Adicionado na versão 1.5.0. |
| SpeechServiceResponse_RequestWordBoundary | Um valor booliano que especifica se os eventos WordBoundary devem ser solicitados. Adicionado na versão 1.21.0. |
| SpeechServiceResponse_RequestPunctuationBoundary | Um valor booliano que especifica se o limite de pontuação deve ser solicitado em Eventos WordBoundary. O padrão é verdadeiro. Adicionado na versão 1.21.0. |
| SpeechServiceResponse_RequestSentenceBoundary | Um valor booliano que especifica se o limite de sentença deve ser solicitado em Eventos WordBoundary. O padrão é false. Adicionado na versão 1.21.0. |
| SpeechServiceResponse_SynthesisEventsSyncToAudio | Um valor booliano que especifica se o SDK deve sincronizar eventos de metadados de síntese (por exemplo, limite de palavra, viseme etc.) com a reprodução de áudio. Isso só entra em vigor quando o áudio é reproduzido por meio do SDK. O padrão é verdadeiro. Se definido como false, o SDK disparará os eventos conforme eles vêm do serviço, o que pode estar fora de sincronia com a reprodução de áudio. Adicionado na versão 1.31.0. |
| SpeechServiceResponse_JsonResult | A saída de resposta do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Essa propriedade está disponível somente em objetos de resultado de reconhecimento. |
| SpeechServiceResponse_JsonErrorDetails | Os detalhes de erro do Serviço de Fala dos Serviços Cognitivos (no formato JSON). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use CancellationDetails::ErrorDetails. |
| SpeechServiceResponse_RecognitionLatencyMs | A latência de reconhecimento em milissegundos. Somente leitura, disponível nos resultados finais de fala/tradução. Isso mede a latência entre quando uma entrada de áudio é recebida pelo SDK e o momento em que o resultado final é recebido do serviço. O SDK calcula a diferença de tempo entre o último fragmento de áudio da entrada de áudio que está contribuindo para o resultado final e a hora em que o resultado final é recebido do serviço de fala. Adicionado na versão 1.3.0. |
| SpeechServiceResponse_RecognitionBackend | O back-end de reconhecimento. Somente leitura, disponível nos resultados do reconhecimento de fala. Isso indica se o reconhecimento de nuvem (online) ou incorporado (offline) foi usado para produzir o resultado. |
| SpeechServiceResponse_RequestId | O ID do pedido do serviço de fala para esse reconhecimento. Este é um identificador único para a solicitação. Somente leitura, disponível nos resultados finais de reconhecimento de fala/tradução. |
| SpeechServiceResponse_SynthesisFirstByteLatencyMs | A síntese de fala primeiro byte latência em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que o primeiro áudio de byte está disponível. Adicionado na versão 1.17.0. |
| SpeechServiceResponse_SynthesisFinishLatencyMs | A síntese de fala sintetiza a latência de todos os bytes em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que todo o áudio é sintetizado. Adicionado na versão 1.17.0. |
| SpeechServiceResponse_SynthesisUnderrunTimeMs | O tempo de execução inferior da síntese de fala em milissegundos. Somente leitura, disponível em resultados em eventos SynthesisCompleted. Isso mede o tempo total de subexecução de PropertyId::AudioConfig_PlaybackBufferLengthInMs é preenchido para a síntese concluída. Adicionado na versão 1.17.0. |
| SpeechServiceResponse_SynthesisConnectionLatencyMs | A latência de conexão de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede a latência entre quando a síntese é iniciada a ser processada e o momento em que a conexão HTTP/WebSocket é estabelecida. Adicionado na versão 1.26.0. |
| SpeechServiceResponse_SynthesisNetworkLatencyMs | A latência de rede de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de ida e volta da rede. Adicionado na versão 1.26.0. |
| SpeechServiceResponse_SynthesisServiceLatencyMs | A latência do serviço de síntese de fala em milissegundos. Somente leitura, disponível nos resultados finais da síntese de fala. Isso mede o tempo de processamento do serviço para sintetizar o primeiro byte de áudio. Adicionado na versão 1.26.0. |
| SpeechServiceResponse_SynthesisBackend | Indica por qual back-end a síntese foi concluída. Somente leitura, disponível nos resultados da síntese de fala, exceto pelo resultado no evento SynthesisStarted adicionado na versão 1.17.0. |
| SpeechServiceResponse_DiarizeIntermediateResults | Determina se os resultados intermediários contêm identificação do locutor. |
| CancellationDetails_Reason | O motivo do cancelamento. Atualmente não utilizado. |
| CancellationDetails_ReasonText | O texto de cancelamento. Atualmente não utilizado. |
| CancellationDetails_ReasonDetailedText | O texto detalhado do cancelamento. Atualmente não utilizado. |
| AudioConfig_DeviceNameForCapture | O nome do dispositivo para captura de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromMicrophoneInput. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0. |
| AudioConfig_NumberOfChannelsForCapture | O número de canais para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0. |
| AudioConfig_SampleRateForCapture | A taxa de exemplo (em Hz) para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0. |
| AudioConfig_BitsPerSampleForCapture | O número de bits de cada exemplo para captura de áudio. Somente uso interno. OBSERVAÇÃO: essa ID de propriedade foi adicionada na versão 1.3.0. |
| AudioConfig_AudioSource | A fonte de áudio. Os valores permitidos são "Microfones", "Arquivo" e "Fluxo". Adicionado na versão 1.3.0. |
| AudioConfig_DeviceNameForRender | O nome do dispositivo para renderização de áudio. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use AudioConfig::FromSpeakerOutput. Adicionado na versão 1.14.0. |
| AudioConfig_PlaybackBufferLengthInMs | Comprimento do buffer de reprodução em milissegundos, o padrão é 50 milissegundos. |
| AudioConfig_AudioProcessingOptions | Opções de processamento de áudio no formato JSON. |
| Speech_LogFilename | O nome do arquivo para gravar logs. Adicionado na versão 1.4.0. |
| Speech_SegmentationSilenceTimeoutMs | Uma duração do silêncio detectado, medida em milissegundos, após a qual a conversão de fala em texto determinará que uma frase falada terminou e gerará um resultado reconhecido final. Configurar esse tempo limite pode ser útil em situações em que a entrada falada é significativamente mais rápida ou mais lenta do que o normal e o comportamento de segmentação padrão produz consistentemente resultados que são muito longos ou muito curtos. Valores de tempo limite de segmentação inadequadamente altos ou baixos podem afetar negativamente a precisão de fala em texto; essa propriedade deve ser cuidadosamente configurada e o comportamento resultante deve ser validado minuciosamente conforme o esperado. O valor deve estar no intervalo [100,5000] milissegundos. |
| Speech_SegmentationMaximumTimeMs | O comprimento máximo de uma frase falada ao usar a estratégia de segmentação "Time". O valor de Speech_SegmentationSilenceTimeoutMs deve ser definido para usar essa configuração. À medida que o comprimento de uma frase falada se aproxima desse valor, o Speech_SegmentationSilenceTimeoutMs começará a ser reduzido até que o tempo limite do silêncio da frase seja atingido ou a frase atinja o comprimento máximo. O valor deve estar no intervalo [20000, 70000] milissegundos. |
| Speech_SegmentationStrategy | A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico". |
| Speech_StartEventSensitivity | Controle a rapidez com que o sistema sinaliza que uma possível fala começa após detectar atividade vocal. Essa configuração não altera o algoritmo subjacente de detecção de atividade de voz. Ele apenas ajusta os critérios de tempo para levantar um evento SpeechStartDetected. |
| Conversation_ApplicationId | Identificador usado para se conectar ao serviço de back-end. Adicionado na versão 1.5.0. |
| Conversation_DialogType | Tipo de back-end de caixa de diálogo ao qual se conectar. Adicionado na versão 1.7.0. |
| Conversation_Initial_Silence_Timeout | Tempo limite de silêncio para ouvir Adicionado na versão 1.5.0. |
| Conversation_From_Id | Da ID a ser usada nas atividades de reconhecimento de fala adicionadas na versão 1.5.0. |
| Conversation_Conversation_Id | ConversationId para a sessão. Adicionado na versão 1.8.0. |
| Conversation_Custom_Voice_Deployment_Ids | Lista separada por vírgulas de IDs de implantação de voz personalizada. Adicionado na versão 1.8.0. |
| Conversation_Speech_Activity_Template | Modelo de atividade de fala, propriedades de carimbo no modelo na atividade gerada pelo serviço de fala. Adicionado na versão 1.10.0. |
| Conversation_ParticipantId | O identificador do participante na conversa atual. Adicionado na versão 1.13.0. |
| Conversation_Request_Bot_Status_Messages | |
| Conversation_Connection_Id | |
| DataBuffer_TimeStamp | O carimbo de data/hora associado ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. O carimbo de data/hora é um valor de 64 bits com uma resolução de 90 kHz. É o mesmo que o carimbo de data/hora da apresentação em um fluxo de transporte MPEG. Consulte https://en.wikipedia.org/wiki/Presentation_timestamp Adicionado na versão 1.5.0. |
| DataBuffer_UserId | A ID do usuário associada ao buffer de dados gravado pelo cliente ao usar fluxos de entrada de áudio pull/push. Adicionado na versão 1.5.0. |
| PronunciationAssessment_ReferenceText | O texto de referência do áudio para avaliação de pronúncia. Para este e os seguintes parâmetros de avaliação de pronúncia, consulte a tabela parâmetros de avaliação de pronúncia. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Create ou PronúnciaAssessmentConfig::SetReferenceText. Adicionado na versão 1.14.0. |
| PronunciationAssessment_GradingSystem | O sistema de pontos para calibragem de pontuação de pronúncia (FivePoint ou HundredMark). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0. |
| PronunciationAssessment_Granularity | A granularidade da avaliação de pronúncia (Phoneme, Word ou FullText). Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0. |
| PronunciationAssessment_EnableMiscue | Define se habilitar o cálculo de erro. Com isso habilitado, as palavras pronunciadas serão comparadas ao texto de referência e serão marcadas com omissão/inserção com base na comparação. A configuração padrão é False. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0. |
| PronunciationAssessment_PhonemeAlphabet | O alfabeto phoneme de avaliação de pronúncia. Os valores válidos são "SAPI" (padrão) e "IPA" Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetPhonemeAlphabet. Adicionado na versão 1.20.0. |
| PronunciationAssessment_NBestPhonemeCount | A avaliação de pronúncia nbest phoneme count. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::SetNBestPhonemeCount. Adicionado na versão 1.20.0. |
| PronunciationAssessment_EnableProsodyAssessment | Se deseja habilitar a avaliação prosody. Em circunstâncias normais, você não deve usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::EnableProsodyAssessment. Adicionado na versão 1.33.0. |
| PronunciationAssessment_Json | A cadeia de caracteres json dos parâmetros de avaliação de pronúncia em circunstâncias normais, você não deve precisar usar essa propriedade diretamente. Em vez disso, use PronúnciaAssessmentConfig::Criar. Adicionado na versão 1.14.0. |
| PronunciationAssessment_Params | Parâmetros de avaliação de pronúncia. Esta propriedade destina-se a ser somente leitura. O SDK está usando-o internamente. Adicionado na versão 1.14.0. |
| SpeechTranslation_ModelName | O nome de um modelo a ser usado para tradução de fala. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. |
| SpeechTranslation_ModelKey | Essa propriedade foi preterida. |
| KeywordRecognition_ModelName | O nome de um modelo a ser usado para o reconhecimento de palavra-chave. Não use essa propriedade diretamente. Atualmente, isso só é válido quando EmbeddedSpeechConfig é usado. |
| KeywordRecognition_ModelKey | Essa propriedade foi preterida. |
| EmbeddedSpeech_EnablePerformanceMetrics | Habilite a coleção de métricas de desempenho de fala inseridas que podem ser usadas para avaliar a capacidade de um dispositivo usar fala inserida. Os dados coletados são incluídos nos resultados de cenários específicos, como o reconhecimento de fala. A configuração padrão é "false". Observe que as métricas podem não estar disponíveis em todos os cenários de fala inseridos. |
| SpeechSynthesisRequest_Pitch | O tom da fala sintetizada. |
| SpeechSynthesisRequest_Rate | A taxa da fala sintetizada. |
| SpeechSynthesisRequest_Volume | O volume da fala sintetizada. |
| SpeechSynthesisRequest_Style | O estilo da fala sintetizada. |
| SpeechSynthesisRequest_Temperature | A temperatura da fala sintetizada. O parâmetro de temperatura só entra em vigor quando a voz é uma voz HD. |
| SpeechSynthesisRequest_CustomLexiconUrl | A URL do léxico personalizado para a fala sintetizada. Isso fornece uma URL para um léxico de pronúncia personalizado a ser usado durante a síntese. |
| SpeechSynthesisRequest_PreferLocales | Os locais preferidos para a fala sintetizada. Lista separada por vírgulas de nomes de localidade em ordem de preferência. |
| SpeechSynthesis_FrameTimeoutInterval | O intervalo de tempo limite em milissegundos entre os quadros de áudio de fala sintetizados. O maior deste e 10 segundos é usado como um tempo limite de quadro rígido. Um tempo limite de síntese de fala ocorre se a) o tempo passado desde que o último quadro excede esse intervalo de tempo limite e o RTF (fator Real-Time) excede seu valor máximo, ou b) o tempo passado desde que o quadro mais recente excede o tempo limite do quadro rígido. |
| SpeechSynthesis_RtfTimeoutThreshold | O RTF (fator de Real-Time máximo) para síntese de fala. O RTF é calculado como RTF = f(d)/d, em que f(d) é o tempo necessário para sintetizar o áudio de fala da duração d. |
Define ids de propriedade de fala. Alterado na versão 1.4.0.
enumeração OutputFormat
| Valores | Descrições |
|---|---|
| Simples | |
| Circunstanciado |
Formato de saída.
enum ProfanityOption
| Valores | Descrições |
|---|---|
| Mascarado | Substitui letras em palavras profanas por caracteres de estrela. |
| Removido | Remove palavras profanas. |
| Cru | Não faz nada para palavras profanas. |
Remove palavrões (palavrões) ou substitui letras de palavras profanas por estrelas. Adicionado na versão 1.5.0.
enumeração ResultReason
| Valores | Descrições |
|---|---|
| Sem correspondência | Indica que a fala não pôde ser reconhecida. Mais detalhes podem ser encontrados no objeto NoMatchDetails. |
| Cancelado | Indica que o reconhecimento foi cancelado. Mais detalhes podem ser encontrados usando o objeto CancellationDetails. |
| Reconhecendo a fala | Indica que o resultado da fala contém texto de hipótese. |
| Discurso Reconhecido | Indica que o resultado da fala contém o texto final que foi reconhecido. O Reconhecimento de Fala agora está completo para esta frase. |
| ReconhecendoIntent | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| RecognizedIntent | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| Discurso de tradução | Indica que o resultado da tradução contém texto de hipótese e suas traduções. |
| Discurso traduzido | Indica que o resultado da tradução contém o texto final e as traduções correspondentes. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase. |
| Sintetizando Áudio | Indica que o resultado do áudio sintetizado contém uma quantidade diferente de zero de dados de áudio. |
| SintetizandoÁudioConcluído | Indica que o áudio sintetizado agora está completo para esta frase. |
| Reconhecendo a palavra-chave | Indica que o resultado da fala contém texto de palavra-chave (não verificado). Adicionado na versão 1.3.0. |
| Palavra-chave reconhecida | Indica que o reconhecimento de palavra-chave foi concluído reconhecendo a palavra-chave fornecida. Adicionado na versão 1.3.0. |
| SintetizandoÁudioIniciado | Indica que a síntese de fala agora foi iniciada adicionada na versão 1.4.0. |
| TraduzindoParticipanteDiscurso | Indica que o resultado da transcrição contém o texto da hipótese e suas traduções para outros participantes na conversa. Adicionado na versão 1.8.0. |
| Discurso TraduzidoParticipante | Indica que o resultado da transcrição contém texto final e conversões correspondentes para outros participantes na conversa. O Reconhecimento de Fala e a Tradução agora estão concluídos para esta frase. Adicionado na versão 1.8.0. |
| TranslatedInstantMessage | Indica que o resultado da transcrição contém a mensagem instantânea e as traduções correspondentes. Adicionado na versão 1.8.0. |
| TranslatedParticipantInstantMessage | Indica que o resultado da transcrição contém a mensagem instantânea para outros participantes na conversa e nas traduções correspondentes. Adicionado na versão 1.8.0. |
| InscrevendoVoiceProfile | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| PerfilInscritoVoiceProfile | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| Palestrantes reconhecidos | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| RecognizedSpeaker | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| ResetVoiceProfile | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| Perfil de voz excluído | Esse motivo de resultado está desatualizado e não é mais utilizado. |
| Lista de Vozes Recuperada | Indica que a lista de vozes foi recuperada com êxito. Adicionado na versão 1.16.0. |
Especifica os possíveis motivos pelos quais um resultado de reconhecimento pode ser gerado.
enum CancellationReason
| Valores | Descrições |
|---|---|
| Erro | Indica que ocorreu um erro durante o reconhecimento de fala. |
| Fim do Fluxo | Indica que o final do fluxo de áudio foi atingido. |
| CancelledByUser | Indica que a solicitação foi cancelada pelo usuário. Adicionado na versão 1.14.0. |
Define os possíveis motivos pelos quais um resultado de reconhecimento pode ser cancelado.
enumeração CancellationErrorCode
| Valores | Descrições |
|---|---|
| Noerror | Nenhum erro. Se CancellationReason for EndOfStream, CancellationErrorCode será definido como NoError. |
| Falha de autenticação | Indica um erro de autenticação. Ocorrerá um erro de autenticação se a chave de assinatura ou o token de autorização for inválido, tiver expirado ou não corresponder à região que está sendo usada. |
| SolicitaçãoInválida | Indica que um ou mais parâmetros de reconhecimento são inválidos ou não há suporte para o formato de áudio. |
| Muitas Solicitações | Indica que o número de solicitações paralelas excedeu o número de transcrições simultâneas permitidas para a assinatura. |
| Proibido | Indica que a assinatura gratuita usada pela solicitação ficou sem cota. |
| Falha de conexão | Indica um erro de conexão. |
| Tempo limite de serviço | Indica um erro de tempo limite ao aguardar a resposta do serviço. |
| Erro de Serviço | Indica que um erro é retornado pelo serviço. |
| ServiçoIndisponível | Indica que o serviço está indisponível no momento. |
| Erro de tempo de execução | Indica um erro de runtime inesperado. |
| Redirecionamento de ServiçoTemporário | Indica que o Serviço de Fala está solicitando temporariamente uma reconexão a um ponto de extremidade diferente. |
| Redirecionamento de ServiçoPermanente | Indica que o Serviço de Fala está solicitando permanentemente uma reconexão a um ponto de extremidade diferente. |
| EmbeddedModelError | Indica que o modelo de fala inserida (SR ou TTS) não está disponível ou corrompido. |
Define o código de erro caso CancellationReason seja Error. Adicionado na versão 1.1.0.
enumeração NoMatchReason
| Valores | Descrições |
|---|---|
| Não reconhecido | Indica que a fala foi detectada, mas não reconhecida. |
| InitialSilenceTimeout | Indica que o início do fluxo de áudio continha apenas silêncio e o serviço atingiu o tempo limite aguardando fala. |
| InitialBabbleTimeout | Indica que o início do fluxo de áudio continha apenas ruído e o serviço atingiu o tempo limite aguardando fala. |
| Palavra-chaveNotRecognized | Indica que a palavra-chave detectada foi rejeitada pelo serviço de verificação de palavra-chave. Adicionado na versão 1.5.0. |
| EndSilenceTimeout | Indica que o fluxo de áudio continha apenas silêncio após a última frase reconhecida. |
Define os possíveis motivos pelos quais um resultado de reconhecimento pode não ser reconhecido.
enum ActivityJSONType
| Valores | Descrições |
|---|---|
| Zero | |
| Objeto | |
| Matriz | |
| Corda | |
| Dobrar | |
| UInt | |
| Int | |
| booleano |
Define os tipos possíveis para um valor json de atividade. Adicionado na versão 1.5.0.
enumeração SpeechSynthesisOutputFormat
| Valores | Descrições |
|---|---|
| Raw8Khz8BitMonoMULaw | RAW-8KHz-8bit-mono-mulaw |
| Riff16Khz16KbpsMonoSiren | riff-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor. |
| Áudio16Khz16KbpsMonoSiren | audio-16khz-16kbps-mono-siren Sem suporte pelo serviço. Não use esse valor. |
| Áudio16Khz32KBitRateMonoMp3 | áudio-16kHz-32kbitrate-mono-mp3 |
| Áudio16Khz128KBitRateMonoMp3 | áudio-16kHz-128kbitrate-mono-mp3 |
| Áudio16Khz64KBitRateMonoMp3 | áudio-16kHz-64kBitrate-mono-mp3 |
| Áudio24Khz48KBitRateMonoMp3 | áudio-24kHz-48kbitrate-mono-mp3 |
| Áudio24Khz96KBitRateMonoMp3 | áudio-24kHz-96kbitrate-mono-mp3 |
| Áudio24Khz160KBitRateMonoMp3 | áudio-24khz-160kbps-mono-mp3 |
| Raw16Khz16BitMonoTrueSilk | raw-16khz-16bit-mono-truesilk |
| Riff16Khz16BitMonoPcm | riff-16khz-16bit-mono-pcm |
| Riff8Khz16BitMonoPcm | riff-8khz-16bit-mono-pcm |
| Riff24Khz16BitMonoPcm | RIFF-24KHz-16Bit-Mono-PCM |
| Riff8Khz8BitMonoMULaw | riff-8khz-8bit-mono-mulaw |
| Raw16Khz16BitMonoPcm | RAW-16KHz-16Bit-Mono-PCM |
| Raw24Khz16BitMonoPcm | Raw-24KHz-16Bit-Mono-PCM |
| Raw8Khz16BitMonoPcm | Raw-8KHz-16Bit-Mono-PCM |
| Ogg16Khz16BitMonoOpus | OGG-16KHz-16Bit-Mono-OPUS |
| Ogg24Khz16BitMonoOpus | OGG-24KHz-16Bit-Mono-OPUS |
| Raw48Khz16BitMonoPcm | RAW-48KHz-16Bit-Mono-PCM |
| Riff48Khz16BitMonoPcm | RIFF-48KHz-16Bit-Mono-PCM |
| Áudio48Khz96KBitRateMonoMp3 | áudio-48kHz-96kbitrate-mono-mp3 |
| Áudio48Khz192KBitRateMonoMp3 | áudio-48kHz-192kBitrate-mono-mp3 |
| Ogg48Khz16BitMonoOpus | ogg-48khz-16bit-mono-opus adicionado na versão 1.16.0 |
| Webm16Khz16BitMonoOpus | webm-16khz-16bit-mono-opus adicionado na versão 1.16.0 |
| Webm24Khz16BitMonoOpus | webm-24khz-16bit-mono-opus adicionado na versão 1.16.0 |
| Raw24Khz16BitMonoTrueSilk | raw-24khz-16bit-mono-truesilk Adicionado na versão 1.17.0 |
| Raw8Khz8BitMonoALaw | raw-8khz-8bit-mono-alaw Adicionado na versão 1.17.0 |
| Riff8Khz8BitMonoALaw | riff-8khz-8bit-mono-alaw Adicionado na versão 1.17.0 |
| Webm24Khz16Bit24KbpsMonoOpus | Webm-24khz-16bit-24kbps-mono-opus Audio compactado pelo codec OPUS em um contêiner de WebM, com taxa de bits de 24kbps, otimizado para o cenário de IoT. (Adicionado em 1.19.0) |
| Áudio16Khz16Bit32KbpsMonoOpus | áudio-16khz-16bit-32kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 32kbps. (Adicionado em 1.20.0) |
| Áudio24Khz16Bit48KbpsMonoOpus | áudio-24khz-16bit-48kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 48kbps. (Adicionado em 1.20.0) |
| Áudio24Khz16Bit24KbpsMonoOpus | áudio-24khz-16bit-24kbps-mono-opus Áudio compactado pelo codec OPUS sem contêiner, com taxa de bits de 24kbps. (Adicionado em 1.20.0) |
| Raw22050Hz16BitMonoPcm | raw-22050hz-16bit-mono-pcm Áudio PCM bruto a 22050Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0) |
| Riff22050Hz16BitMonoPcm | riff-22050hz-16bit-mono-pcm PCM áudio a 22050Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0) |
| Raw44100Hz16BitMonoPcm | raw-44100hz-16bit-mono-pcm Áudio PCM bruto a 44100Hz taxa de amostragem e profundidade de 16 bits. (Adicionado em 1.22.0) |
| Riff44100Hz16BitMonoPcm | riff-44100hz-16bit-mono-pcm áudio PCM a 44100Hz taxa de amostragem e profundidade de 16 bits, com cabeçalho RIFF. (Adicionado em 1.22.0) |
| AmrWb16000Hz | amr-wb-16000hz AMR-WB áudio a uma taxa de amostragem de 16kHz. (Adicionado em 1.24.0) |
| G72216Khz64Kbps | g722-16khz-64kbps G.722 áudio a 16kHz taxa de amostragem e taxa de bits de 64kbps. (Adicionado em 1.38.0) |
Define os possíveis formatos de áudio de saída de síntese de fala. Atualizado na versão 1.19.0.
enumeração StreamStatus
| Valores | Descrições |
|---|---|
| Desconhecido | O status do fluxo de dados de áudio é desconhecido. |
| Sem Dados | O fluxo de dados de áudio não contém dados. |
| Dados parciais | O fluxo de dados de áudio contém dados parciais de uma solicitação de fala. |
| Todos os dados | O fluxo de dados de áudio contém todos os dados de uma solicitação de fala. |
| Cancelado | O fluxo de dados de áudio foi cancelado. |
Define o status possível do fluxo de dados de áudio. Adicionado na versão 1.4.0.
enumeração ServicePropertyChannel
| Valores | Descrições |
|---|---|
| UriQueryParameter | Usa o parâmetro de consulta URI para passar as configurações de propriedade para o serviço. |
| Cabeçalho HTTP | Usa HttpHeader para definir uma chave/valor em um cabeçalho HTTP. |
Define os canais usados para passar as configurações de propriedade para o serviço. Adicionado na versão 1.5.0.
enumeração RecognitionFactorScope
| Valores | Descrições |
|---|---|
| Frase Parcial | Um Fator de Reconhecimento será aplicado a gramáticas que podem ser referenciadas como frases parciais individuais. |
Define o escopo ao qual um Fator de Reconhecimento é aplicado.
enumationAssessmentGradingSystem
| Valores | Descrições |
|---|---|
| Cinco pontos | Calibragem de cinco pontos. |
| CemMarcos | Marca de cem. |
Define o sistema de pontos para calibragem de pontuação de pronúncia; o valor padrão é FivePoint. Adicionado na versão 1.14.0.
enumationAssessmentGranularity
| Valores | Descrições |
|---|---|
| Fonema | Mostra a pontuação no nível completo de texto, palavra e phoneme. |
| Palavra | Mostra a pontuação no nível de texto e palavra completos. |
| Texto Completo | Mostra a pontuação somente no nível de texto completo. |
Define a granularidade da avaliação de pronúncia; o valor padrão é Phoneme. Adicionado na versão 1.14.0.
enumEração SynthesisVoiceType
| Valores | Descrições |
|---|---|
| Neural Online | Voz neural online. |
| OnlinePadrão | Voz padrão online. |
| Off-line neural | Voz neural offline. |
| OfflinePadrão | Voz padrão offline. |
Define o tipo de vozes de síntese adicionadas na versão 1.16.0.
enum SínteseVozGênero
| Valores | Descrições |
|---|---|
| Desconhecido | Gênero desconhecido. |
| Fêmea | Voz feminina. |
| Macho | Voz masculina. |
| Neutro | Voz neutra. |
Define o gênero das vozes de síntese adicionadas na versão 1.17.0.
enumErar SynthesisVoiceStatus
| Valores | Descrições |
|---|---|
| Desconhecido | Status da voz desconhecido. |
| Disponibilidade geral | A voz está disponível em geral. |
| Versão Prévia | A voz está em versão prévia. |
| Deprecado | A voz foi preterida, não use. |
Define o status das vozes de síntese.
enumeração SpeechSynthesisBoundaryType
| Valores | Descrições |
|---|---|
| Palavra | Limite do Word. |
| Pontuação | Limite de pontuação. |
| Frase | Limite de sentença. |
Define o tipo de limite do evento de limite de síntese de fala adicionado na versão 1.21.0.
Estratégia de Segmentação de Elementos
| Valores | Descrições |
|---|---|
| Inadimplência | Use a estratégia e as configurações padrão, conforme determinado pelo Serviço de Fala. Use na maioria das situações. |
| Hora | Usa uma estratégia baseada em tempo em que a quantidade de silêncio entre a fala é usada para determinar quando gerar um resultado final. |
| Semântico | Usa um modelo de IA para deter o final de uma frase falada com base no conteúdo da frase. |
A estratégia usada para determinar quando uma frase falada terminou e um resultado reconhecido final deve ser gerado. Os valores permitidos são "Padrão", "Tempo" e "Semântico".