Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Quickstart transkribieren Sie Sprache zu Text mit dem Azure OpenAI Flüstermodell. Das Flüstermodell kann die menschliche Sprache in zahlreichen Sprachen transkribieren und andere Sprachen in Englisch übersetzen.
Tipp
Diese Schnellstartanleitung dauert ungefähr 10 bis 15 Minuten.
Voraussetzungen
- Ein Azure-Abonnement – Create one for free.
- Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
- Stellen Sie sicher, dass Sie mindestens die Rolle Cognitive Services Contributor für die Azure OpenAI-Ressource zugewiesen sind.
- Eine Beispielaudiodatei. Sie können Beispielaudio, z. B. wikipediaOcelot.wav, aus dem Repository Azure Speech im Foundry Tools SDK-Repository unter GitHub abrufen.
Konfiguration
Abrufen von Schlüssel und Endpunkt
Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/. |
AZURE_OPENAI_API_KEY |
Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2. |
Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.
Umgebungsvariablen
Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.
Wichtig
Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.
Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Erstellen einer REST-API-Anforderung und -Antwort
Führen Sie in einer Bash-Shell den folgenden Befehl aus. Sie müssen YourDeploymentName durch den von Ihnen beim Bereitstellen des Flüstermodells ausgewählten Bereitstellungsnamen ersetzen. Der Bereitstellungsname entspricht nicht unbedingt dem Modellnamen. Die Eingabe des Modellnamens führt zu einem Fehler, es sei denn, Sie haben einen Bereitstellungsnamen ausgewählt, der mit dem zugrunde liegenden Modellnamen identisch ist.
curl $AZURE_OPENAI_ENDPOINT/openai/deployments/YourDeploymentName/audio/transcriptions?api-version=2024-02-01 \
-H "api-key: $AZURE_OPENAI_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F file="@./wikipediaOcelot.wav"
Die erste Zeile des vorherigen Befehls mit einem Beispielendpunkt würde wie folgt angezeigt:
curl https://aoai-docs.openai.azure.com/openai/deployments/{YourDeploymentName}/audio/transcriptions?api-version=2024-02-01 \
Wichtig
Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.
Überprüfen Sie die Ausgabe
Die Antwort enthält ein text Feld mit der vollständigen Transkription Ihrer Audiodatei. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:
- Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
- Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
- Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind
Ausgabe
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Voraussetzungen
- Ein Azure-Abonnement. Sie können eine kostenlos erstellen.
- Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
- Python 3,8 oder höher
- Die Azure CLI.
- Eine Beispielaudiodatei. Sie können Beispielaudio, z. B. wikipediaOcelot.wav, aus dem Repository Azure Speech im Foundry Tools SDK-Repository unter GitHub abrufen.
Konfiguration
Abrufen von Schlüssel und Endpunkt
Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/. |
AZURE_OPENAI_API_KEY |
Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2. |
Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.
Umgebungsvariablen
Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.
Wichtig
Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.
Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Wichtig
Die kennwortlose Authentifizierung wird empfohlen.
Für die kennwortlose Authentifizierung müssen Sie:
- Verwenden Sie das
azure-identityPaket (pip install azure-identity). - Weisen Sie die
Cognitive Services UserRolle Ihrem Benutzerkonto zu. Dies kann im Azure Portal unter Access control (IAM)>Add role assignment erfolgen. - Melden Sie sich mit dem Azure CLI wie
az loginan.
Erstellen einer Python Umgebung
Erstellen Sie ein neues Verzeichnis für Ihr Projekt, und navigieren Sie über ein Terminal oder eine Eingabeaufforderung dorthin.
mkdir whisper-quickstart; cd whisper-quickstart
Erstellen und Aktivieren einer virtuellen Umgebung für dieses Projekt.
python -m venv .venv
.venv\Scripts\activate
Installieren Sie die OpenAI-Python-Clientbibliothek mit:
pip install openai
Erstellen der Python-App
Erstellen Sie eine neue Python Datei namens quickstart.py. Öffnen Sie sie dann in Ihrem bevorzugten Editor oder ihrer IDE.
Ersetzen Sie den Inhalt von quickstart.py durch den folgenden Code. Ändern Sie den Code, um Ihren Bereitstellungsnamen hinzuzufügen:
import os
from openai import AzureOpenAI
client = AzureOpenAI(
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-02-01",
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
)
deployment_id = "YOUR-DEPLOYMENT-NAME-HERE" #This will correspond to the custom name you chose for your deployment when you deployed a model."
audio_test_file = "./wikipediaOcelot.wav"
result = client.audio.transcriptions.create(
file=open(audio_test_file, "rb"),
model=deployment_id
)
print(result)
Führen Sie die Anwendung mit dem python Befehl in Der Schnellstartdatei aus:
python quickstart.py
Wichtig
Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.
Überprüfen Sie die Ausgabe
Die Antwort enthält ein text Feld mit der vollständigen Transkription Ihrer Audiodatei. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:
- Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
- Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
- Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind
Ausgabe
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Voraussetzungen
- Ein Azure-Abonnement. Sie können eine kostenlos erstellen.
- Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
- Die .NET 8.0 SDK
Microsoft Entra ID Voraussetzungen
Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:
- Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
- Weisen Sie die
Cognitive Services UserRolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.
Konfiguration
Erstellen Sie einen neuen Ordner
whisper-quickstart, und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:mkdir whisper-quickstart && cd whisper-quickstartErstellen Sie eine neue Konsolenanwendung mit dem folgenden Befehl:
dotnet new consoleInstallieren Sie die OpenAI .NET Clientbibliothek mit dem Befehl dotnet add package:
dotnet add package Azure.AI.OpenAIInstallieren Sie für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID das Azure.Identity Paket mit:
dotnet add package Azure.IdentityMelden Sie sich für die recommended schlüssellose Authentifizierung mit Microsoft Entra ID mit dem folgenden Befehl bei Azure an:
az login
Abrufen von Ressourceninformationen
Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal. |
Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.
Schnellstart ausführen
Der Beispielcode in dieser Schnellstartanleitung verwendet Microsoft Entra ID für die empfohlene schlüssellose Authentifizierung. Wenn Sie einen API-Schlüssel verwenden möchten, können Sie das DefaultAzureCredential Objekt durch ein AzureKeyCredential Objekt ersetzen.
AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential());
Hinweis
Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.
Führen Sie die folgenden Schritte aus, um die Schnellstartanleitung auszuführen:
Ersetzen Sie den Inhalt
Program.csdurch den folgenden Code, und aktualisieren Sie die Platzhalterwerte durch Ihren eigenen.using Azure; using Azure.AI.OpenAI; using Azure.Identity; // Required for Passwordless auth string deploymentName = "whisper"; string endpoint = Environment.GetEnvironmentVariable("AZURE_OPENAI_ENDPOINT") ?? "https://<your-resource-name>.openai.azure.com/"; string key = Environment.GetEnvironmentVariable("AZURE_OPENAI_API_KEY") ?? "<your-key>"; // Use the recommended keyless credential instead of the AzureKeyCredential credential. AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new DefaultAzureCredential()); //AzureOpenAIClient openAIClient = new AzureOpenAIClient(new Uri(endpoint), new AzureKeyCredential(key)); var audioFilePath = "<audio file path>" var audioClient = openAIClient.GetAudioClient(deploymentName); var result = await audioClient.TranscribeAudioAsync(audioFilePath); Console.WriteLine("Transcribed text:"); foreach (var item in result.Value.Text) { Console.Write(item); }Führen Sie die Anwendung mit dem Befehl
dotnet runoder der Schaltfläche "Ausführen" oben in Visual Studio aus:dotnet run
Überprüfen Sie die Ausgabe
Die Transkription gibt eine Antwort mit einer Text Eigenschaft zurück, die die vollständige Transkription Ihrer Audiodatei enthält. Die Ausgabe sollte dem unten stehenden Beispiel ähneln. Wenn Fehler auftreten:
- Bitte überprüfen Sie, ob Ihr Bereitstellungsname genau übereinstimmt.
- Überprüfen Sie, ob ihr Audiodateipfad korrekt ist.
- Sicherstellen, dass Der API-Schlüssel und der Endpunkt gültig sind
Ausgabe
Wenn Sie die Beispielaudiodatei verwenden, sollte der folgende Text in der Konsole gedruckt werden:
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States,
Mexico, and Central and South America. This medium-sized cat is characterized by solid
black spots and streaks on its coat, round ears...
Source-Code | Package (npm) | Samples
Voraussetzungen
- Ein Azure-Abonnement – Create one for free
- LTS-Versionen von Node.js
- Azure CLI für die kennwortlose Authentifizierung in einer lokalen Entwicklungsumgebung verwendet, erstellen Sie den erforderlichen Kontext, indem Sie sich mit dem Azure CLI anmelden.
- Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
Microsoft Entra ID Voraussetzungen
Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:
- Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
- Weisen Sie die
Cognitive Services UserRolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.
Konfiguration
Erstellen Sie einen neuen Ordner
synthesis-quickstart, und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:mkdir synthesis-quickstart && cd synthesis-quickstartErstellen Sie den
package.jsonmit dem folgenden Befehl:npm init -yInstallieren Sie die OpenAI-Clientbibliothek für JavaScript mit:
npm install openaiFür die empfohlene kennwortlose Authentifizierung:
npm install @azure/identity
Abrufen von Ressourceninformationen
Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal. |
Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.
Vorsicht
Um die empfohlene schlüssellose Authentifizierung mit dem SDK zu verwenden, stellen Sie sicher, dass die AZURE_OPENAI_API_KEY Umgebungsvariable nicht festgelegt ist.
Erstellen einer Beispielanwendung
Erstellen Sie die
index.jsDatei mit dem folgenden Code:const { createReadStream } = require("fs"); const { AzureOpenAI } = require("openai"); const { DefaultAzureCredential, getBearerTokenProvider } = require("@azure/identity"); // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://ai.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient() { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });Melden Sie sich mit dem folgenden Befehl bei Azure an:
az loginFühren Sie die JavaScript-Datei aus.
node index.js
Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.
Ausgabe
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Source-Code | Package (npm) | Samples
Voraussetzungen
- Ein Azure-Abonnement – Create one for free
- LTS-Versionen von Node.js
- Typescript
- Azure CLI für die kennwortlose Authentifizierung in einer lokalen Entwicklungsumgebung verwendet, erstellen Sie den erforderlichen Kontext, indem Sie sich mit dem Azure CLI anmelden.
- Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
Microsoft Entra ID Voraussetzungen
Für die empfohlene schlüssellose Authentifizierung mit Microsoft Entra ID müssen Sie:
- Installieren Sie die Azure CLI, die für die schlüssellose Authentifizierung mit Microsoft Entra ID verwendet wird.
- Weisen Sie die
Cognitive Services UserRolle Ihrem Benutzerkonto zu. Sie können rollen im Azure-Portal unter Access control (IAM)>Add role assignment zuweisen.
Einrichten
Erstellen Sie einen neuen Ordner
whisper-quickstart, und wechseln Sie mit dem folgenden Befehl zum Schnellstartordner:mkdir whisper-quickstart && cd whisper-quickstartErstellen Sie den
package.jsonmit dem folgenden Befehl:npm init -yAktualisieren Sie das
package.jsonauf ECMAScript mit dem folgenden Befehl:npm pkg set type=moduleInstallieren Sie die OpenAI-Clientbibliothek für JavaScript mit:
npm install openaiFür die empfohlene kennwortlose Authentifizierung:
npm install @azure/identity
Abrufen von Ressourceninformationen
Sie müssen die folgenden Informationen abrufen, um Ihre Anwendung mit Ihrer Azure OpenAI-Ressource zu authentifizieren:
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Dieser Wert befindet sich im Abschnitt Keys and Endpoint beim Untersuchen der Ressource aus dem Azure-Portal. |
AZURE_OPENAI_DEPLOYMENT_NAME |
Dieser Wert entspricht dem benutzerdefinierten Namen, den Sie bei der Bereitstellung eines Modells ausgewählt haben. Dieser Wert befindet sich unter Resource Management>Model Deployments im Azure-Portal. |
Erfahren Sie mehr über schlüssellose Authentifizierung und Festlegen von Umgebungsvariablen.
Vorsicht
Um die empfohlene schlüssellose Authentifizierung mit dem SDK zu verwenden, stellen Sie sicher, dass die AZURE_OPENAI_API_KEY Umgebungsvariable nicht festgelegt ist.
Erstellen einer Beispielanwendung
Erstellen Sie die
index.tsDatei mit dem folgenden Code:import { createReadStream } from "fs"; import { AzureOpenAI } from "openai"; import { DefaultAzureCredential, getBearerTokenProvider } from "@azure/identity"; // You will need to set these environment variables or edit the following values const audioFilePath = "<audio file path>"; const endpoint = process.env.AZURE_OPENAI_ENDPOINT || "Your endpoint"; // Required Azure OpenAI deployment name and API version const apiVersion = process.env.OPENAI_API_VERSION || "2024-08-01-preview"; const deploymentName = process.env.AZURE_OPENAI_DEPLOYMENT_NAME || "whisper"; // keyless authentication const credential = new DefaultAzureCredential(); const scope = "https://ai.azure.com/.default"; const azureADTokenProvider = getBearerTokenProvider(credential, scope); function getClient(): AzureOpenAI { return new AzureOpenAI({ endpoint, azureADTokenProvider, apiVersion, deployment: deploymentName, }); } export async function main() { console.log("== Transcribe Audio Sample =="); const client = getClient(); const result = await client.audio.transcriptions.create({ model: "", file: createReadStream(audioFilePath), }); console.log(`Transcription: ${result.text}`); } main().catch((err) => { console.error("The sample encountered an error:", err); });Erstellen Sie die
tsconfig.jsonDatei zum Transpilieren des TypeScript-Codes, und kopieren Sie den folgenden Code für ECMAScript.{ "compilerOptions": { "module": "NodeNext", "target": "ES2022", // Supports top-level await "moduleResolution": "NodeNext", "skipLibCheck": true, // Avoid type errors from node_modules "strict": true // Enable strict type-checking options }, "include": ["*.ts"] }Transpilieren von TypeScript zu JavaScript.
tscMelden Sie sich mit dem folgenden Befehl bei Azure an:
az loginFühren Sie den Code mit dem folgenden Befehl aus:
node index.js
Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.
Wichtig
Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.
Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.
Ausgabe
{"text":"The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs."}
Voraussetzungen
- Ein Azure-Abonnement – Create one for free
Sie können entweder die neueste Version, PowerShell 7 oder Windows PowerShell 5.1. - Eine Azure OpenAI-Ressource mit einem Sprach-zu-Text-Modell, die in einer unterstützten Region bereitgestellt wird. Weitere Informationen finden Sie unter Create a resource and deploy a model with Azure OpenAI.
Einrichten
Abrufen von Schlüssel und Endpunkt
Um erfolgreich Azure OpenAI aufzurufen, benötigen Sie einen endpoint und einen key.
| Variablenname | Wert |
|---|---|
AZURE_OPENAI_ENDPOINT |
Der Dienst-Endpunkt befindet sich im Keys und Endpunkt Abschnitt bei Einsicht in Ihre Ressource im Azure-Portal. Alternativ können Sie den Endpunkt über die Seite Deployments im Microsoft Foundry-Portal finden. Ein Beispielendpunkt ist: https://docs-test-001.openai.azure.com/. |
AZURE_OPENAI_API_KEY |
Dieser Wert befindet sich im Keys & Endpoint Abschnitt, wenn Sie Ihre Ressource im Azure-Portal untersuchen. Sie können entweder KEY1 oder KEY2. |
Wechseln Sie im Azure-Portal zu Ihrer Ressource. Der Endpunkt und die Schlüssel finden Sie im Abschnitt "Ressourcenverwaltung ". Kopieren Sie Ihren Endpunkt und den Zugriffsschlüssel, da Sie beide zum Authentifizieren Ihrer API-Aufrufe benötigen. Sie können entweder KEY1 oder KEY2. Das Vorhandensein von zwei Schlüsseln ermöglicht es Ihnen, Schlüssel sicher zu rotieren und neu zu generieren, ohne den Dienst zu unterbrechen.
Umgebungsvariablen
Erstellen und Zuweisen persistenter Umgebungsvariablen für Ihren Schlüssel und Endpunkt.
Wichtig
Verwenden Sie API-Schlüssel mit Vorsicht. Fügen Sie den API-Schlüssel nicht direkt in Ihren Code ein, und veröffentlichen Sie ihn nie öffentlich. Wenn Sie einen API-Schlüssel verwenden, speichern Sie ihn sicher in Azure Key Vault. Weitere Informationen zur sicheren Verwendung von API-Schlüsseln in Ihren Apps finden Sie unter API-Schlüssel mit Azure Key Vault.
Weitere Informationen zur Sicherheit von AI-Diensten finden Sie unter Authenticate-Anforderungen an Azure KI Services.
setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"
setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"
Erstellen einer PowerShell-App
Führen Sie den folgenden Befehl aus. Sie müssen YourDeploymentName durch den von Ihnen beim Bereitstellen des Flüstermodells ausgewählten Bereitstellungsnamen ersetzen. Der Bereitstellungsname entspricht nicht unbedingt dem Modellnamen. Die Eingabe des Modellnamens führt zu einem Fehler, es sei denn, Sie haben einen Bereitstellungsnamen ausgewählt, der mit dem zugrunde liegenden Modellnamen identisch ist.
# Azure OpenAI metadata variables
$openai = @{
api_key = $Env:AZURE_OPENAI_API_KEY
api_base = $Env:AZURE_OPENAI_ENDPOINT # your endpoint should look like the following https://YOUR_RESOURCE_NAME.openai.azure.com/
api_version = '2024-02-01' # this may change in the future
name = 'YourDeploymentName' #This will correspond to the custom name you chose for your deployment when you deployed a model.
}
# Header for authentication
$headers = [ordered]@{
'api-key' = $openai.api_key
}
$form = @{ file = get-item -path './wikipediaOcelot.wav' }
# Send a completion call to generate an answer
$url = "$($openai.api_base)/openai/deployments/$($openai.name)/audio/transcriptions?api-version=$($openai.api_version)"
$response = Invoke-RestMethod -Uri $url -Headers $headers -Form $form -Method Post -ContentType 'multipart/form-data'
return $response.text
Sie können Beispiel-Audiodateien wie wikipediaOcelot.wav aus dem Azure Speech in Foundry Tools SDK-Repository auf GitHub herunterladen.
Wichtig
Speichern und zugreifen Sie für die Produktion ihre Anmeldeinformationen mithilfe einer sicheren Methode, z. B. Die geheime PowerShell-Verwaltung mit Azure Key Vault. Weitere Informationen finden Sie unter Sicherheit der Anmeldeinformationen.
Ausgabe
The ocelot, Lepardus paradalis, is a small wild cat native to the southwestern United States, Mexico, and Central and South America. This medium-sized cat is characterized by solid black spots and streaks on its coat, round ears, and white neck and undersides. It weighs between 8 and 15.5 kilograms, 18 and 34 pounds, and reaches 40 to 50 centimeters 16 to 20 inches at the shoulders. It was first described by Carl Linnaeus in 1758. Two subspecies are recognized, L. p. paradalis and L. p. mitis. Typically active during twilight and at night, the ocelot tends to be solitary and territorial. It is efficient at climbing, leaping, and swimming. It preys on small terrestrial mammals such as armadillo, opossum, and lagomorphs.
Hinweis
Informationen zu anderen Audiomodellen, die Sie mit Azure OpenAI verwenden können, finden Sie unter Audiomodelle.
Tipp
Die Dateigrößenbeschränkung für das Flüstermodell beträgt 25 MB. Wenn Sie eine Datei mit mehr als 25 MB transkribieren müssen, können Sie die Azure Speech in Foundry Tools API zur Batch-Transkription verwenden.
Problembehandlung
Authentifizierungsfehler
Falls Sie 401 Unauthorized-Fehlermeldungen erhalten, überprüfen Sie:
- Ihr API-Schlüssel ist in Umgebungsvariablen richtig festgelegt.
- Ihre Azure OpenAI-Ressource ist aktiv
- Ihr Konto umfasst die Rolle "Cognitive Services-Mitwirkender"
Dateiformatfehler
Das Flüstermodell unterstützt mp3-, mp4-, mpeg-, mpga-, m4a-, wav- und webm-Formate. Andere Formate geben einen Fehler zurück.
Dateigrößenbeschränkung
Audiodateien müssen 25 MB oder kleiner sein. Verwenden Sie für größere Dateien die API Azure Speech batch transcription API.
Bereitstellung nicht gefunden
Überprüfen Sie, ob der Bereitstellungsname genau dem entspricht, was Sie in Azure OpenAI Studio erstellt haben. Bei Bereitstellungsnamen wird die Groß-/Kleinschreibung beachtet.
Bereinigen von Ressourcen
Wenn Sie eine Azure OpenAI-Ressource bereinigen und entfernen möchten, können Sie die Ressource löschen. Bevor Sie die Ressource löschen, müssen Sie zuerst alle bereitgestellten Modelle löschen.
Nächste Schritte
- Informationen zum Konvertieren von Audiodaten in Text in Batches finden Sie unter Erstellen einer Batchtranskription.
- Weitere Beispiele finden Sie unter Azure OpenAI Samples GitHub Repository.