Início rápido: Conversão de voz para texto com o modelo Azure OpenAI Whisper

Neste quickstart, transcreve a voz para texto usando o modelo Azure OpenAI Whisper. O modelo Whisper pode transcrever a fala humana em várias línguas e traduzir outras línguas para inglês.

Dica

Este início rápido demora aproximadamente 10 a 15 minutos a completar.

Pré-requisitos

Configuração

Recuperar chave e endpoint

Para fazer uma chamada com êxito para o Azure OpenAI, precisa de um endpoint e de uma chave.

Nome da variável Valor
AZURE_OPENAI_ENDPOINT O endpoint do serviço pode ser encontrado na secção Chaves & Endpoint ao examinar o seu recurso no portal do Azure. Em alternativa, pode encontrar o endpoint através da página Deployments no portal Microsoft Foundry. Um exemplo de ponto final é: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Este valor pode ser encontrado na secção Keys & Endpoint ao examinar o seu recurso no portal Azure. Pode usar tanto KEY1 como KEY2.

Aceda ao seu recurso no portal Azure. O Endpoint e as Chaves podem ser encontrados na secção de Gestão de Recursos. Copie o endpoint e a chave de acesso pois precisará de ambos para autenticar as suas chamadas de API. Pode usar tanto KEY1 como KEY2. Ter sempre duas chaves permite alternar e regenerar chaves de forma segura sem causar interrupção no serviço.

Captura de ecrã da interface de visão geral de um recurso OpenAI Azure no portal Azure com a localização do endpoint e das chaves de acesso circuladas a vermelho.

Variáveis ambientais

Cria e atribui variáveis persistentes de ambiente para a tua chave e endpoint.

Importante

Use as chaves API com cautela. Não incluas a chave API diretamente no teu código e nunca a publiques publicamente. Se usares uma chave API, guarda-a de forma segura no Azure Key Vault. Para mais informações sobre o uso seguro das chaves da API nas suas aplicações, consulte Chaves da API com Azure Key Vault.

Para mais informações sobre a segurança dos serviços de IA, consulte Autenticar pedidos para Serviços de IA do Azure.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Criar um pedido e resposta da API REST

Num bash shell, executa o comando seguinte. Tens de substituir YourDeploymentName pelo nome de implementação que escolheste quando implementaste o modelo Whisper. O nome da implementação não é necessariamente o mesmo que o nome do modelo. Inserir o nome do modelo resulta num erro, a menos que escolha um nome de implementação idêntico ao nome do modelo subjacente.

curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
 -H "api-key: $AZURE_OPENAI_API_KEY" \
 -H "Content-Type: multipart/form-data" \
 -F file="@./wikipediaOcelot.wav"

A primeira linha do comando anterior, com um exemplo de endpoint, apareceria da seguinte forma:

curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \

Importante

Para produção, armazene e acede às suas credenciais usando um método seguro, como Azure Key Vault. Para mais informações, consulte segurança de credenciais.

Verificar a saída

A resposta contém um text campo com a transcrição completa do seu ficheiro áudio. Deverias ver resultados semelhantes ao exemplo abaixo. Se encontrar erros:

  • Verifique se o nome do seu destacamento corresponde exatamente
  • Verifica se o caminho do teu ficheiro de áudio está correto
  • Garante que a tua chave API e endpoint são válidos

Produção

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Pré-requisitos

Configuração

Recuperar chave e endpoint

Para fazer uma chamada com êxito para o Azure OpenAI, precisa de um endpoint e de uma chave.

Nome da variável Valor
AZURE_OPENAI_ENDPOINT O endpoint do serviço pode ser encontrado na secção Chaves & Endpoint ao examinar o seu recurso no portal do Azure. Em alternativa, pode encontrar o endpoint através da página Deployments no portal Microsoft Foundry. Um exemplo de ponto final é: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Este valor pode ser encontrado na secção Keys & Endpoint ao examinar o seu recurso no portal Azure. Pode usar tanto KEY1 como KEY2.

Aceda ao seu recurso no portal Azure. O Endpoint e as Chaves podem ser encontrados na secção de Gestão de Recursos. Copie o seu endpoint e a chave de acesso, pois vai precisar de ambos para autenticar as suas chamadas API. Pode usar tanto KEY1 como KEY2. Ter sempre duas chaves permite alternar e regenerar chaves de forma segura sem causar interrupção no serviço.

Captura de ecrã da interface de visão geral de um recurso OpenAI Azure no portal Azure com a localização do endpoint e das chaves de acesso circuladas a vermelho.

Variáveis ambientais

Cria e atribui variáveis persistentes de ambiente para a tua chave e endpoint.

Importante

Use as chaves API com cautela. Não incluas a chave API diretamente no teu código e nunca a publiques publicamente. Se usares uma chave API, guarda-a de forma segura no Azure Key Vault. Para mais informações sobre o uso seguro das chaves da API nas suas aplicações, consulte Chaves da API com Azure Key Vault.

Para mais informações sobre a segurança dos serviços de IA, consulte Autenticar pedidos para Serviços de IA do Azure.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"

Importante

Recomenda-se a autenticação sem palavra-passe

Para autenticação sem palavra-passe, precisa de:

  1. Use o azure-identity pacote (pip install azure-identity).
  2. Atribui a Cognitive Services User função à tua conta de utilizador. Isto pode ser feito no portal Azure sob Controlo de Acesso (IAM)>Adicionar atribuição de funções.
  3. Inicia sessão com CLI do Azure como az login.

Criar um ambiente Python

Crie um novo diretório para o seu projeto e navegue até ele a partir de um terminal ou do prompt de comandos.

mkdir whisper-quickstart; cd whisper-quickstart

Crie e ative um ambiente virtual para este projeto.

python -m venv .venv
.venv\Scripts\activate

Instale a biblioteca cliente OpenAI Python com:

pip install openai

Criar a aplicação Python

  1. Crie um novo ficheiro Python chamado quickstart.py. Depois abre-o no teu editor ou IDE preferido.

  2. Substitua o conteúdo da quickstart.py pelo seguinte código. Modifique o código para adicionar o nome da sua implementação:

    import os
    from openai import AzureOpenAI
        
    client = AzureOpenAI(
        api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
        api_version="2024-02-01",
        azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )
    
    deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
    audio_test_file = "./wikipediaOcelot.wav"
    
    result = client.audio.transcriptions.create(
        file=open(audio_test_file, "rb"),            
        model=deployment_id
    )
    
    print(result)

Executa a aplicação usando o python comando no teu ficheiro de início rápido:

python quickstart.py

Importante

Para produção, armazene e acede às suas credenciais usando um método seguro, como Azure Key Vault. Para mais informações, consulte segurança de credenciais.

Verificar a saída

A resposta contém um text campo com a transcrição completa do seu ficheiro áudio. Deverias ver resultados semelhantes ao exemplo abaixo. Se encontrar erros:

  • Verifique se o nome do seu destacamento corresponde exatamente
  • Verifica se o caminho do teu ficheiro de áudio está correto
  • Garante que a tua chave API e endpoint são válidos

Produção

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Pré-requisitos

Pré-requisitos do Microsoft Entra ID

Para a autenticação sem chave recomendada com o Microsoft Entra ID, precisa:

  • Instale o CLI do Azure usado para autenticação sem chave com Microsoft Entra ID.
  • Atribui a Cognitive Services User função à tua conta de utilizador. Pode atribuir funções no portal Azure em Controlo de Acesso (IAM)>Adicionar atribuição de funções.

Configuração

  1. Crie uma nova pasta whisper-quickstart e vá à pasta de início rápido com o seguinte comando:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Crie uma nova aplicação de consola com o seguinte comando:

    dotnet new console
    
  3. Instale a biblioteca cliente OpenAI.NET com o comando dotnet add package:

    dotnet add package Azure.AI.OpenAI
    
  4. Para a autenticação sem chave recomendada com Microsoft Entra ID, instale o pacote Azure.Identity com:

    dotnet add package Azure.Identity
    
  5. Para a autenticação sem chave recomendada com Microsoft Entra ID, inicie sessão em Azure com o seguinte comando:

    az login
    

Recuperar informação de recursos

Precisa de obter a seguinte informação para autenticar a sua aplicação com o seu recurso Azure OpenAI:

Nome da variável Valor
AZURE_OPENAI_ENDPOINT Este valor pode ser encontrado na secção Keys e Endpoint ao examinar o seu recurso no portal Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Este valor corresponderá ao nome personalizado que escolheu para a sua implementação quando implementou um modelo. Este valor pode ser encontrado em Resource Management>Model Deployments no portal Azure.

Saiba mais sobre autenticação sem chave e definição de variáveis de ambiente.

Execute o início rápido

O código de exemplo neste quickstart utiliza o Microsoft Entra ID para a autenticação sem chave recomendada. Se preferir usar uma chave API, pode substituir o DefaultAzureCredential objeto por um AzureKeyCredential objeto.

AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 

Nota

Pode obter ficheiros de áudio de exemplo, como wikipediaOcelot.wav, do repositório Azure Speech no Foundry Tools SDK em GitHub.

Para executar o quickstart, siga estes passos:

  1. Substitua o conteúdo de Program.cs pelo seguinte código e atualize os valores provisórios pelos seus próprios.

    using Azure;
    using Azure.AI.OpenAI;
    using Azure.Identity; // Required for Passwordless auth
    
    
    string deploymentName = "whisper";
    
    string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/";
    string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>";
    
    // Use the recommended keyless credential instead of the AzureKeyCredential credential.
    AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 
    //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key));
    
    var audioFilePath = "<audio file path>"
    
    var audioClient = openAIClient.GetAudioClient(deploymentName);
    
    var result = await audioClient.TranscribeAudioAsync(audioFilePath);
    
    Console.WriteLine("Transcribed text:");
    foreach (var item in result.Value.Text)
    {
        Console.Write(item);
    }
    
  2. Execute a aplicação usando o comando dotnet run ou o botão run no topo de Visual Studio:

    dotnet run
    

Verificar a saída

A transcrição devolve uma resposta com a propriedade Text contendo a transcrição completa do seu ficheiro de áudio. Deverias ver resultados semelhantes ao exemplo abaixo. Se encontrar erros:

  • Verifique se o nome do seu destacamento corresponde exatamente
  • Verifica se o caminho do teu ficheiro de áudio está correto
  • Garante que a tua chave API e endpoint são válidos

Produção

Se estiveres a usar o ficheiro de áudio de exemplo, deves ver o seguinte texto impresso na consola:

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, 
Mexico, and Central and South America. This medium-sized cat is characterized by solid 
black spots and streaks on its coat, round ears...

Código-fonte | Package (npm) | Samples

Pré-requisitos

Pré-requisitos do Microsoft Entra ID

Para a autenticação sem chave recomendada com o Microsoft Entra ID, precisa:

  • Instale o CLI do Azure usado para autenticação sem chave com Microsoft Entra ID.
  • Atribui a Cognitive Services User função à tua conta de utilizador. Pode atribuir funções no portal Azure em Controlo de Acesso (IAM)>Adicionar atribuição de funções.

Configuração

  1. Crie uma nova pasta synthesis-quickstart e vá à pasta de início rápido com o seguinte comando:

    mkdir synthesis-quickstart && cd synthesis-quickstart
    
  2. Crie o package.json com o seguinte comando:

    npm init -y
    
  3. Instale a biblioteca cliente OpenAI para JavaScript com:

    npm install openai
    
  4. Para a autenticação sem palavra-passe recomendada :

    npm install @azure/identity
    

Recuperar informação de recursos

Precisa de obter a seguinte informação para autenticar a sua aplicação com o seu recurso Azure OpenAI:

Nome da variável Valor
AZURE_OPENAI_ENDPOINT Este valor pode ser encontrado na secção Keys e Endpoint ao examinar o seu recurso no portal Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Este valor corresponderá ao nome personalizado que escolheu para a sua implementação quando implementou um modelo. Este valor pode ser encontrado em Resource Management>Model Deployments no portal Azure.

Saiba mais sobre autenticação sem chave e definição de variáveis de ambiente.

Cautela

Para usar a autenticação sem chave recomendada com o SDK, certifique-se de que a AZURE_OPENAI_API_KEY variável ambiente não está definida.

Crie uma aplicação de exemplo

  1. Crie o index.js ficheiro com o seguinte código:

    const { createReadStream } = require("fs");
    const { AzureOpenAI } = require("openai");
    const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity");
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient() {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. Inicie sessão no Azure com o seguinte comando:

    az login
    
  3. Executa o ficheiro JavaScript.

    node index.js
    

Pode obter ficheiros de áudio de exemplo, como wikipediaOcelot.wav, do repositório Azure Speech no Foundry Tools SDK em GitHub.

Produção

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Código-fonte | Package (npm) | Samples

Pré-requisitos

Pré-requisitos do Microsoft Entra ID

Para a autenticação sem chave recomendada com o Microsoft Entra ID, precisa:

  • Instale o CLI do Azure usado para autenticação sem chave com Microsoft Entra ID.
  • Atribui a Cognitive Services User função à tua conta de utilizador. Pode atribuir funções no portal Azure em Controlo de Acesso (IAM)>Adicionar atribuição de funções.

Configuração

  1. Crie uma nova pasta whisper-quickstart e vá à pasta de início rápido com o seguinte comando:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Crie o package.json com o seguinte comando:

    npm init -y
    
  3. Atualize o package.json para ECMAScript com o seguinte comando:

    npm pkg set type=module
    
  4. Instale a biblioteca cliente OpenAI para JavaScript com:

    npm install openai
    
  5. Para a autenticação sem palavra-passe recomendada :

    npm install @azure/identity
    

Recuperar informação de recursos

Precisa de obter a seguinte informação para autenticar a sua aplicação com o seu recurso Azure OpenAI:

Nome da variável Valor
AZURE_OPENAI_ENDPOINT Este valor pode ser encontrado na secção Keys e Endpoint ao examinar o seu recurso no portal Azure.
AZURE_OPENAI_DEPLOYMENT_NAME Este valor corresponderá ao nome personalizado que escolheu para a sua implementação quando implementou um modelo. Este valor pode ser encontrado em Resource Management>Model Deployments no portal Azure.

Saiba mais sobre autenticação sem chave e definição de variáveis de ambiente.

Cautela

Para usar a autenticação sem chave recomendada com o SDK, certifique-se de que a AZURE_OPENAI_API_KEY variável ambiente não está definida.

Crie uma aplicação de exemplo

  1. Crie o index.ts ficheiro com o seguinte código:

    import { createReadStream } from "fs";
    import { AzureOpenAI } from "openai";
    import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient(): AzureOpenAI {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. Crie o tsconfig.json ficheiro para transpilar o código TypeScript e copie o seguinte código para ECMAScript.

    {
        "compilerOptions": {
          "module": "NodeNext",
          "target": "ES2022", // Supports top-level await
          "moduleResolution": "NodeNext",
          "skipLibCheck": true, // Avoid type errors from node_modules
          "strict": true // Enable strict type-checking options
        },
        "include": ["*.ts"]
    }
    
  3. Transpile de TypeScript para JavaScript.

    tsc
    
  4. Inicie sessão no Azure com o seguinte comando:

    az login
    
  5. Execute o código com o seguinte comando:

    node index.js
    

Pode obter ficheiros de áudio de exemplo, como wikipediaOcelot.wav, do repositório Azure Speech no Foundry Tools SDK em GitHub.

Importante

Use as chaves API com cautela. Não incluas a chave API diretamente no teu código e nunca a publiques publicamente. Se usares uma chave API, guarda-a de forma segura no Azure Key Vault. Para mais informações sobre o uso seguro das chaves da API nas suas aplicações, consulte Chaves da API com Azure Key Vault.

Para mais informações sobre a segurança dos serviços de IA, consulte Autenticar pedidos para Serviços de IA do Azure.

Produção

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Pré-requisitos

Configuração

Recuperar chave e endpoint

Para fazer uma chamada com êxito para o Azure OpenAI, precisa de um endpoint e de uma chave.

Nome da variável Valor
AZURE_OPENAI_ENDPOINT O endpoint do serviço pode ser encontrado na secção Chaves & Endpoint ao examinar o seu recurso no portal do Azure. Em alternativa, pode encontrar o endpoint através da página Deployments no portal Microsoft Foundry. Um exemplo de ponto final é: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Este valor pode ser encontrado na secção Keys & Endpoint ao examinar o seu recurso no portal Azure. Pode usar tanto KEY1 como KEY2.

Aceda ao seu recurso no portal Azure. O Endpoint e as Chaves podem ser encontrados na secção de Gestão de Recursos. Copie o seu endpoint e a chave de acesso, pois vai precisar de ambos para autenticar as suas chamadas API. Pode usar tanto KEY1 como KEY2. Ter sempre duas chaves permite alternar e regenerar chaves de forma segura sem causar interrupção no serviço.

Captura de ecrã da interface de visão geral de um recurso OpenAI Azure no portal Azure com a localização do endpoint e das chaves de acesso circuladas a vermelho.

Variáveis ambientais

Cria e atribui variáveis persistentes de ambiente para a tua chave e endpoint.

Importante

Use as chaves API com cautela. Não incluas a chave API diretamente no teu código e nunca a publiques publicamente. Se usares uma chave API, guarda-a de forma segura no Azure Key Vault. Para mais informações sobre o uso seguro das chaves da API nas suas aplicações, consulte Chaves da API com Azure Key Vault.

Para mais informações sobre a segurança dos serviços de IA, consulte Autenticar pedidos para Serviços de IA do Azure.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Criar uma aplicação PowerShell

Executa o seguinte comando. Tens de substituir YourDeploymentName pelo nome de implementação que escolheste quando implementaste o modelo Whisper. O nome da implementação não é necessariamente o mesmo que o nome do modelo. Inserir o nome do modelo resulta num erro, a menos que escolha um nome de implementação idêntico ao nome do modelo subjacente.

# Azure OpenAI metadata variables
$openai = @{
    api_key     = $Env:AZURE_OPENAI_API_KEY
    api_base    = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
    api_version = '2024-02-01' # this may change in the future
    name        = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}

# Header for authentication
$headers = [ordered]@{
    'api-key' = $openai.api_key
}

$form = @{ file = get-item -path './wikipediaOcelot.wav' }

# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"

$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text

Pode obter ficheiros de áudio de exemplo, como wikipediaOcelot.wav, do repositório Azure Speech no Foundry Tools SDK em GitHub.

Importante

Para produção, armazene e aceda às suas credenciais usando um método seguro, como The PowerShell Secret Management com Azure Key Vault. Para mais informações, consulte segurança de credenciais.

Produção

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.

Nota

Para informações sobre outros modelos de áudio que pode usar com Azure OpenAI, veja Modelos de áudio.

Dica

O limite de tamanho de ficheiro para o modelo Whisper é de 25 MB. Se precisares de transcrever um ficheiro com mais de 25 MB, podes usar a API Azure Speech no Foundry Tools batch transcription.

Resolução de problemas

Erros de autenticação

Se receber erros 401 não autorizados, verifique:

  • A sua chave API está corretamente definida nas variáveis de ambiente
  • O seu recurso Azure OpenAI está ativo
  • A sua conta tem o papel de Contribuidor de Serviços Cognitivos

Erros de formato de ficheiro

O modelo Whisper suporta formatos mp3, mp4, mpeg, mpga, m4a, wav e webm. Outros formatos devolvem um erro.

Limite de tamanho do ficheiro

Os ficheiros de áudio devem ter 25 MB ou menos. Para ficheiros maiores, utilize a API de transcrição em lote de voz Azure.

Implantação não encontrada

Verifique se o nome da sua implementação corresponde exatamente ao que criou no Azure OpenAI Studio. Os nomes de implementação são sensíveis a maiúsculas e minúsculas.

Liberar recursos

Se quiseres limpar e remover um recurso do Azure OpenAI, podes apagar o recurso. Antes de eliminar o recurso, deve primeiro eliminar quaisquer modelos implementados.

Próximos passos