Schnellstart: Sprache in Text mit dem Azure OpenAI Flüstermodell

In diesem Quickstart transkribieren Sie Sprache zu Text mit dem Azure OpenAI Flüstermodell. Das Flüstermodell kann die menschliche Sprache in zahlreichen Sprachen transkribieren und andere Sprachen in Englisch übersetzen.

Tipp

Diese Schnellstartanleitung dauert ungefähr 10 bis 15 Minuten.

Voraussetzungen

Konfiguration

Abrufen von Schlüssel und Endpunkt

Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.

Variablenname Wert
AZURE_OPENAI_ENDPOINT Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2.

Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.

Screenshot der Übersicht einer Azure OpenAI-Ressource im Azure-Portal mit der Position der Endpunkte und Zugriffsschlüssel rot eingekreist.

Umgebungsvariablen

Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.

Wichtig

Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.

Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Erstellen einer REST-API-Anforderung und -Antwort

Führen Sie in einer Bash-Shell den folgenden Befehl aus. Sie müssen YourDeploymentName durch den von Ihnen beim Bereitstellen des Flüstermodells ausgewählten Bereitstellungsnamen ersetzen. Der Bereitstellungsname entspricht nicht unbedingt dem Modellnamen. Die Eingabe des Modellnamens führt zu einem Fehler, es sei denn, Sie haben einen Bereitstellungsnamen ausgewählt, der mit dem zugrunde liegenden Modellnamen identisch ist.

curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
 -H "api-key: $AZURE_OPENAI_API_KEY" \
 -H "Content-Type: multipart/form-data" \
 -F file="@./wikipediaOcelot.wav"

Die erste Zeile des vorherigen Befehls mit einem Beispielendpunkt würde wie folgt angezeigt:

curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \

Wichtig

Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.

Überprüfen Sie die Ausgabe

Die Antwort enthält ein text Feld mit der vollständigen Transkription Ihrer Audiodatei. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:

  • Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
  • Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
  • Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind

Ausgabe

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Voraussetzungen

Konfiguration

Abrufen von Schlüssel und Endpunkt

Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.

Variablenname Wert
AZURE_OPENAI_ENDPOINT Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2.

Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.

Screenshot der Übersicht einer Azure OpenAI-Ressource im Azure-Portal mit der Position der Endpunkte und Zugriffsschlüssel rot eingekreist.

Umgebungsvariablen

Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.

Wichtig

Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.

Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"

Wichtig

Die kennwortlose Authentifizierung wird empfohlen.

Für die kennwortlose Authentifizierung müssen Sie:

  1. Verwenden Sie das azure-identity Paket (pip install azure-identity).
  2. Weisen Sie die Cognitive Services User Rolle Ihrem Benutzerkonto zu. Dies kann im Azure Portal unter Access control (IAM)>Add role assignment erfolgen.
  3. Melden Sie sich mit dem Azure CLI wie az login an.

Erstellen einer Python Umgebung

Erstellen Sie ein neues Verzeichnis für Ihr Projekt, und navigieren Sie über ein Terminal oder eine Eingabeaufforderung dorthin.

mkdir whisper-quickstart; cd whisper-quickstart

Erstellen und Aktivieren einer virtuellen Umgebung für dieses Projekt.

python -m venv .venv
.venv\Scripts\activate

Installieren Sie die OpenAI-Python-Clientbibliothek mit:

pip install openai

Erstellen der Python-App

  1. Erstellen Sie eine neue Python Datei namens quickstart.py. Öffnen Sie sie dann in Ihrem bevorzugten Editor oder ihrer IDE.

  2. Ersetzen Sie den Inhalt von quickstart.py durch den folgenden Code. Ändern Sie den Code, um Ihren Bereitstellungsnamen hinzuzufügen:

    import os
    from openai import AzureOpenAI
        
    client = AzureOpenAI(
        api_key=os.getenv("AZURE_OPENAI_API_KEY"),  
        api_version="2024-02-01",
        azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
    )
    
    deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
    audio_test_file = "./wikipediaOcelot.wav"
    
    result = client.audio.transcriptions.create(
        file=open(audio_test_file, "rb"),            
        model=deployment_id
    )
    
    print(result)

Führen Sie die Anwendung mit dem python Befehl in Der Schnellstartdatei aus:

python quickstart.py

Wichtig

Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.

Überprüfen Sie die Ausgabe

Die Antwort enthält ein text Feld mit der vollständigen Transkription Ihrer Audiodatei. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:

  • Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
  • Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
  • Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind

Ausgabe

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Voraussetzungen

Microsoft Entra ID Voraussetzungen

Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:

  • Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
  • Weisen Sie die Cognitive Services User Rolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.

Konfiguration

  1. Erstellen Sie einen neuen Ordner whisper-quickstart , und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Erstellen Sie eine neue Konsolenanwendung mit dem folgenden Befehl:

    dotnet new console
    
  3. Installieren Sie die OpenAI .NET Clientbibliothek mit dem Befehl dotnet add package:

    dotnet add package Azure.AI.OpenAI
    
  4. Installieren Sie für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID das Azure.Identity Paket mit:

    dotnet add package Azure.Identity
    
  5. Melden Sie sich für die recommended schlüssellose Authentifizierung mit Microsoft Entra ID mit dem folgenden Befehl bei Azure an:

    az login
    

Abrufen von Ressourceninformationen

Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:

Variablenname Wert
AZURE_OPENAI_ENDPOINT Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal.
AZURE_OPENAI_DEPLOYMENT_NAME Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal.

Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.

Schnellstart ausführen

Der Beispielcode in dieser Schnellstartanleitung verwendet Microsoft Entra ID für die empfohlene schlüssellose Authentifizierung. Wenn Sie einen API-Schlüssel verwenden möchten, können Sie das DefaultAzureCredential Objekt durch ein AzureKeyCredential Objekt ersetzen.

AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 

Hinweis

Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.

Führen Sie die folgenden Schritte aus, um die Schnellstartanleitung auszuführen:

  1. Ersetzen Sie den Inhalt Program.cs durch den folgenden Code, und aktualisieren Sie die Platzhalterwerte durch Ihren eigenen.

    using Azure;
    using Azure.AI.OpenAI;
    using Azure.Identity; // Required for Passwordless auth
    
    
    string deploymentName = "whisper";
    
    string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/";
    string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>";
    
    // Use the recommended keyless credential instead of the AzureKeyCredential credential.
    AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); 
    //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key));
    
    var audioFilePath = "<audio file path>"
    
    var audioClient = openAIClient.GetAudioClient(deploymentName);
    
    var result = await audioClient.TranscribeAudioAsync(audioFilePath);
    
    Console.WriteLine("Transcribed text:");
    foreach (var item in result.Value.Text)
    {
        Console.Write(item);
    }
    
  2. Führen Sie die Anwendung mit dem Befehl dotnet run oder der Schaltfläche "Ausführen" oben in Visual Studio aus:

    dotnet run
    

Überprüfen Sie die Ausgabe

Die Transkription gibt eine Antwort mit einer Text Eigenschaft zurück, die die vollständige Transkription Ihrer Audiodatei enthält. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:

  • Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
  • Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
  • Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind

Ausgabe

Wenn Sie die Beispielaudiodatei verwenden, sollte der folgende Text in der Konsole gedruckt werden:

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, 
Mexico, and Central and South America. This medium-sized cat is characterized by solid 
black spots and streaks on its coat, round ears...

Source-Code | Package (npm) | Samples

Voraussetzungen

Microsoft Entra ID Voraussetzungen

Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:

  • Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
  • Weisen Sie die Cognitive Services User Rolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.

Konfiguration

  1. Erstellen Sie einen neuen Ordner synthesis-quickstart , und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:

    mkdir synthesis-quickstart && cd synthesis-quickstart
    
  2. Erstellen Sie den package.json mit dem folgenden Befehl:

    npm init -y
    
  3. Installieren Sie die OpenAI-Clientbibliothek für JavaScript mit:

    npm install openai
    
  4. Für die empfohlene kennwortlose Authentifizierung:

    npm install @azure/identity
    

Abrufen von Ressourceninformationen

Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:

Variablenname Wert
AZURE_OPENAI_ENDPOINT Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal.
AZURE_OPENAI_DEPLOYMENT_NAME Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal.

Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.

Vorsicht

Um die empfohlene schlüssellose Authentifizierung mit dem SDK zu verwenden, stellen Sie sicher, dass die AZURE_OPENAI_API_KEY Umgebungsvariable nicht festgelegt ist.

Erstellen einer Beispielanwendung

  1. Erstellen Sie die index.js Datei mit dem folgenden Code:

    const { createReadStream } = require("fs");
    const { AzureOpenAI } = require("openai");
    const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity");
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient() {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. Melden Sie sich mit dem folgenden Befehl bei Azure an:

    az login
    
  3. Führen Sie die JavaScript-Datei aus.

    node index.js
    

Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.

Ausgabe

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Source-Code | Package (npm) | Samples

Voraussetzungen

Microsoft Entra ID Voraussetzungen

Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:

  • Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
  • Weisen Sie die Cognitive Services User Rolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.

Einrichten

  1. Erstellen Sie einen neuen Ordner whisper-quickstart , und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:

    mkdir whisper-quickstart && cd whisper-quickstart
    
  2. Erstellen Sie den package.json mit dem folgenden Befehl:

    npm init -y
    
  3. Aktualisieren Sie das package.json auf ECMAScript mit dem folgenden Befehl:

    npm pkg set type=module
    
  4. Installieren Sie die OpenAI-Clientbibliothek für JavaScript mit:

    npm install openai
    
  5. Für die empfohlene kennwortlose Authentifizierung:

    npm install @azure/identity
    

Abrufen von Ressourceninformationen

Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:

Variablenname Wert
AZURE_OPENAI_ENDPOINT Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal.
AZURE_OPENAI_DEPLOYMENT_NAME Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal.

Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.

Vorsicht

Um die empfohlene schlüssellose Authentifizierung mit dem SDK zu verwenden, stellen Sie sicher, dass die AZURE_OPENAI_API_KEY Umgebungsvariable nicht festgelegt ist.

Erstellen einer Beispielanwendung

  1. Erstellen Sie die index.ts Datei mit dem folgenden Code:

    import { createReadStream } from "fs";
    import { AzureOpenAI } from "openai";
    import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity";
    
    // You will need to set these environment variables or edit the following values
    const audioFilePath = "<audio file path>";
    const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint";
    
    // Required Azure OpenAI deployment name and API version
    const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview";
    const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper";
    
    // keyless authentication    
    const credential = new DefaultAzureCredential();
    const scope = "https://ai.azure.com/.default";
    const azureADTokenProvider = getBearerTokenProvider(credential, scope);
    
    function getClient(): AzureOpenAI {
      return new AzureOpenAI({
        endpoint,
        azureADTokenProvider,
        apiVersion,
        deployment: deploymentName,
      });
    }
    
    export async function main() {
      console.log("== Transcribe Audio Sample ==");
    
      const client = getClient();
      const result = await client.audio.transcriptions.create({
        model: "",
        file: createReadStream(audioFilePath),
      });
    
      console.log(`Transcription: ${result.text}`);
    }
    
    main().catch((err) => {
      console.error("The sample encountered an error:", err);
    });
    
  2. Erstellen Sie die tsconfig.json Datei zum Transpilieren des TypeScript-Codes, und kopieren Sie den folgenden Code für ECMAScript.

    {
        "compilerOptions": {
          "module": "NodeNext",
          "target": "ES2022", // Supports top-level await
          "moduleResolution": "NodeNext",
          "skipLibCheck": true, // Avoid type errors from node_modules
          "strict": true // Enable strict type-checking options
        },
        "include": ["*.ts"]
    }
    
  3. Transpilieren von TypeScript zu JavaScript.

    tsc
    
  4. Melden Sie sich mit dem folgenden Befehl bei Azure an:

    az login
    
  5. Führen Sie den Code mit dem folgenden Befehl aus:

    node index.js
    

Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.

Wichtig

Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.

Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.

Ausgabe

{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}

Voraussetzungen

Einrichten

Abrufen von Schlüssel und Endpunkt

Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.

Variablenname Wert
AZURE_OPENAI_ENDPOINT Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/.
AZURE_OPENAI_API_KEY Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2.

Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.

Screenshot der Übersicht einer Azure OpenAI-Ressource im Azure-Portal mit der Position der Endpunkte und Zugriffsschlüssel rot eingekreist.

Umgebungsvariablen

Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.

Wichtig

Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.

Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE" 
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE" 

Erstellen einer PowerShell-App

Führen Sie den folgenden Befehl aus. Sie müssen YourDeploymentName durch den von Ihnen beim Bereitstellen des Flüstermodells ausgewählten Bereitstellungsnamen ersetzen. Der Bereitstellungsname entspricht nicht unbedingt dem Modellnamen. Die Eingabe des Modellnamens führt zu einem Fehler, es sei denn, Sie haben einen Bereitstellungsnamen ausgewählt, der mit dem zugrunde liegenden Modellnamen identisch ist.

# Azure OpenAI metadata variables
$openai = @{
    api_key     = $Env:AZURE_OPENAI_API_KEY
    api_base    = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
    api_version = '2024-02-01' # this may change in the future
    name        = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}

# Header for authentication
$headers = [ordered]@{
    'api-key' = $openai.api_key
}

$form = @{ file = get-item -path './wikipediaOcelot.wav' }

# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"

$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text

Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.

Wichtig

Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Die geheime PowerShell-Verwaltung mit Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.

Ausgabe

The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.

Hinweis

Informationen zu anderen Audiomodellen, die Sie mit Azure OpenAI verwenden können, finden Sie unter Audiomodelle.

Tipp

Die Dateigrößenbeschränkung für das Flüstermodell beträgt 25 MB. Wenn Sie eine Datei mit mehr als 25 MB transkribieren müssen, können Sie die Azure Speech in Foundry Tools API zur Batch-Transkription verwenden.

Problembehandlung

Authentifizierungsfehler

Falls Sie 401 Unauthorized-Fehlermeldungen erhalten, überprüfen Sie:

  • Ihr API-Schlüssel ist in Umgebungsvariablen richtig festgelegt.
  • Ihre Azure OpenAI-Ressource ist aktiv
  • Ihr Konto umfasst die Rolle "Cognitive Services-Mitwirkender"

Dateiformatfehler

Das Flüstermodell unterstützt mp3-, mp4-, mpeg-, mpga-, m4a-, wav- und webm-Formate. Andere Formate geben einen Fehler zurück.

Dateigrößenbeschränkung

Audiodateien müssen 25 MB oder kleiner sein. Verwenden Sie für größere Dateien die API Azure Speech batch transcription API.

Bereitstellung nicht gefunden

Überprüfen Sie, ob der Bereitstellungsname genau dem entspricht, was Sie in Azure OpenAI Studio erstellt haben. Bei Bereitstellungsnamen wird die Groß-/Kleinschreibung beachtet.

Bereinigen von Ressourcen

Wenn Sie eine Azure OpenAI-Ressource bereinigen und entfernen möchten, können Sie die Ressource löschen. Bevor Sie die Ressource löschen, müssen Sie zuerst alle bereitgestellten Modelle löschen.

Nächste Schritte