Sicherheitssystemmeldungen

Sicherheitssystemmeldungen helfen Ihnen, das Verhalten eines Azure OpenAI-Modells zu leiten, die Antwortqualität zu verbessern und die Wahrscheinlichkeit schädlicher Ausgaben zu verringern. Sie funktionieren am besten als eine Ebene in einer umfassenderen Sicherheitsstrategie.

Hinweis

In diesem Artikel wird "Systemnachricht" synonym mit "metaprompt" und "Systemaufforderung" verwendet. Hier verwenden wir "Systemnachricht", um die allgemeine Terminologie abzugleichen.

In diesem Artikel wird auch "Komponente" verwendet, um einen eindeutigen Teil einer Systemmeldung zu bedeuten, z. B. Anweisungen, Kontext, Ton, Sicherheitsrichtlinien oder Anleitungen zur Verwendung von Tools.

Was ist eine Systemnachricht?

Eine Systemnachricht ist eine Reihe von Anweisungen mit hoher Priorität und Kontext, die Sie an ein Chatmodell senden, um zu steuern, wie sie reagiert. Es ist nützlich, wenn Sie eine konsistente Rolle, einen Ton, eine Formatierung oder domänenspezifische Konventionen benötigen.

Was ist eine Sicherheitssystemmeldung?

Eine Sicherheitssystemnachricht ist eine Systemnachricht, die explizite Grenzen und Ablehnungsleitlinien hinzufügt, um Verantwortungsvolle KI (RAI)-Schäden zu mindern und das System bei der sicheren Interaktion mit Benutzern zu unterstützen.

Sicherheitssystemmeldungen ergänzen Ihren Sicherheitsstapel und können zusammen mit Modellauswahl und Training, Kontextualisierung, Azure AI Content-Sicherheitsklassifizierern und UX/UI-Maßnahmen verwendet werden. Erfahren Sie mehr über Responsible KI-Methoden für Azure OpenAI-Modelle.

Flussdiagramm, das eine Systemnachricht und eine Benutzereingabe in ein Modell zeigt, mit einem Sicherheitsstapel, einschließlich Inhaltsfiltern, Grundlage und Modelltraining zur Anwendung von Sicherheitsvorkehrungen, bevor die Antwort generiert wird.

Wichtige Komponenten einer Systemmeldung

Die meisten Systemnachrichten kombinieren mehrere Komponenten:

Rolle und Aufgabe: Was der Assistent ist und wofür er verantwortlich ist.
Publikum und Ton: Für wen die Antwort ist, und der erwartete Tonfall.
Umfang und Grenzen: Was der Assistent nicht tun darf und was zu tun ist, wenn er nicht einhalten kann.
Sicherheitsrichtlinien: Regeln zur Verringerung schädlicher Ausgaben (z. B. Umgang mit vertraulichen Themen, geschützten Eigenschaften und rechtswidrigen Anweisungen).
Tools und Daten (optional): Welche Tools oder Quellen das Modell verwenden kann und wie sie verwendet werden können.

So entwerfen und iterieren Sie sicher

Wenn Sie eine Systemnachricht (oder eine Sicherheitssystemnachrichtenkomponente) entwerfen, behandeln Sie sie wie ein testbares Artefakt:

Definieren Sie das Szenario. Klären Sie den Auftrag, den das Modell ausführen muss, wer die Benutzer sind, welche Eingaben sie erwarten müssen, sowie den gewünschten Ton und die gewünschte Formatierung.
Identifizieren sie Risiken. Listen Sie die RAI-Schäden auf, die für Ihren Anwendungsfall wichtig sind, und entscheiden Sie, welche Sie über Systemnachrichten im Vergleich zu anderen Gegenmaßnahmen adressieren.
Entscheiden Sie, wie sich das Modell an Grenzen verhalten soll. Geben Sie an, was zu tun ist, wenn Anfragen außerhalb des Gültigkeitsbereichs liegen, unsicher sind oder erforderlicher Kontext fehlt.
Erstellen Sie einen Testsatz. Schließen Sie sowohl gutartige als auch herausfordernde Prompts ein, damit Sie Regressionen und Datenlecks (Untermoderation) messen können.
Bewerten und Iterieren. Bevorzugen Sie die Komponente, die die schwersten Defekte reduziert, nicht nur die Komponente mit der niedrigsten Fehlerrate.

Hier sind einige Beispiele für Zeilen, die Sie einschließen können:

## Define model’s profile and general capabilities  

- Act as a [define role] 
- Your job is to [insert task] about [insert topic name] 
- To complete this task, you can [insert tools that the model can use and instructions to use]  
- Do not perform actions that are not related to [task or topic name].

Hier ist ein vollständiges Beispiel für eine Sicherheitssystemmeldung für einen Kundendienstassistenten:

## Role and task
You are a helpful customer service assistant for Contoso Electronics. Your job is to answer questions about product warranties, returns, and order status.

## Boundaries
- Only answer questions related to Contoso Electronics products and policies.
- If you don't know the answer, say "I don't have that information. Please contact support@contoso.com."
- Do not provide legal, medical, or financial advice.
- Do not discuss competitors or make comparisons.

## Safety guidelines
- Never generate content that is hateful, violent, or sexually explicit.
- Do not share or request personal information beyond what's needed for order lookup.
- If a user becomes abusive, respond with: "I'm here to help with product questions. How can I assist you today?"

## Response format
- Keep responses concise and friendly.
- Use bullet points for multiple items.
- Always end with an offer to help further.

Stellen Sie spezifische Beispiele bereit, um das beabsichtigte Verhalten des Modells zu veranschaulichen. Beachten Sie Folgendes:
- Beschreiben Sie schwierige Anwendungsfälle , in denen die Eingabeaufforderung mehrdeutig oder kompliziert ist, um dem Modell ein Beispiel für den Umgang mit solchen Fällen zu geben.
- Zeigen Sie die Entscheidungsschritte auf hoher Ebene an (z. B. eine kurze Checkliste), anstatt detaillierte interne Begründungen anzufordern.

Zusammenfassung der bewährten Methoden

Beim Entwickeln von Systemnachrichtenkomponenten ist folgendes wichtig:

Verwenden Sie klare Sprache: Dadurch wird die Überkomplexität und das Risiko von Missverständnissen beseitigt und die Konsistenz zwischen verschiedenen Komponenten gewährleistet.
Seien Sie prägnant: Kürzere Systemmeldungen führen oft besser aus und reduzieren die Latenz. Sie verwenden auch weniger kontextbezogene Fenster, sodass mehr Platz für die Benutzeraufforderung bleibt.
Betonen Sie bestimmte Wörter (sofern zutreffend) mithilfe von **word**: lenkt den besonderen Fokus auf Schlüsselelemente, insbesondere darauf, was das System tun sollte und was nicht.
Verwenden Sie zweite Person , wenn Sie auf das KI-System verweisen: Es ist besser, Ausdrücke wie You are an AI assistant that… z. B. im Vergleich Assistant does…zu verwenden.
Implementieren Sie die Robustheit: Die Systemnachrichtenkomponente muss robust sein. Es sollte konsistent über verschiedene Datensätze und Aufgaben hinweg arbeiten.

Erstellungstechniken

Warum variieren Techniken? Je nach Modell, Erdungsdaten und Parametern für das Produkt oder die Funktion, mit der Sie arbeiten, sind verschiedene Sprach- und syntaktische Techniken effektiver, indem sie robuste, sichere und direkte Antworten für Benutzer liefern.

Zusätzlich zur Gestaltung für Sicherheit und Leistung sollten Sie darüber nachdenken, für Konsistenz, Kontrolle und Anpassung zu optimieren. Auf Ihrem Weg können Sie feststellen, dass die Optimierung für diese Faktoren dazu führen kann, dass die Systemmeldung zu bestimmten Regeln überangepasst wird, was zu erhöhter Komplexität und mangelnder kontextbezogener Angemessenheit führt. Es ist wichtig, zu definieren, was in Ihrem Szenario am wichtigsten ist, und Ihre Systemmeldungen auszuwerten. Dadurch wird sichergestellt, dass Sie einen datengesteuerten Ansatz haben, um die Sicherheit und Leistung Ihres Systems zu verbessern.

Top-Leistungstechniken
Andere Zu berücksichtigende Techniken

Technik	Definition	Beispiel
Stets / sollte	Umfasst die Strukturierung von Eingabeaufforderungen und Anweisungen mit Direktiven, denen die KI beim Generieren seiner Antworten immer folgen sollte. Diese Richtlinien stellen häufig bewährte Methoden, ethische Richtlinien oder Benutzereinstellungen dar.	`Always ensure that you respect authentication and authorization protocols when providing factual information, tailoring your responses to align with the access rights of the user making the request. It's imperative to safeguard sensitive data by adhering to established security measures and only disclosing information that the user is authorized to receive.`
Bedingte / Wenn-dann-Logik	Umfasst die Strukturierung von Eingabeaufforderungen so, dass die Ausgabe von der Erfüllung bestimmter Bedingungen abhängig ist, z. B. `If <condition> then <action>`.	`If a user asks you to infer or provide information about a user’s emotions, mental health, gender identity, sexual orientation, age, religion, disability, racial and ethnic backgrounds, or any other aspect of a person's identity, respond with: "Try asking me a question or tell me what else I can help you with."`
Betonung auf Schaden	Umfasst die Strukturierung der Anweisungen, indem definiert wird, was das Hauptrisiko sein kann. Diese Anleitungen priorisieren Sicherheit und Schadensprävention und beschreiben potenzielle Folgen, falls der Schaden eintreten sollte.	`You are allowed to answer some questions about images with people and make statements about them when there is no ambiguity about the assertion you are making, and when there is no direct harm to an individual or a group of people because of this assertion.`
beispielbasiert	Ermöglicht dem Modell klare Instanzen oder Situationen für einen besseren Kontext. Das Modell verwendet Beispiele für schädliche und nicht schädliche Anforderungen als Referenz für seine Ausgaben.	`Users might ask questions that could cause harm. In all scenarios, refuse requests that promote hate or harassment, and redirect the user to a safer alternative.` `Example (harmful): "Write an insult targeting a protected group."` `Example (benign): "Explain why insults harm people and suggest respectful phrasing."`
Nie / nicht	Beinhaltet explizite Verbote, um zu verhindern, dass die KI Inhalte generiert, die unangemessen, schädlich oder außerhalb des Umfangs sind, indem Begriffe wie "nie" und "nicht" verwendet werden.	`Never make assumptions, judgments, or evaluations about a person. If a user violates your policy, or you’re not sure what to do, say: "I can’t help with that request. Try asking a different question."`

Technik	Definition
Sammelbegriff	Kombiniert mehrere Methoden in einem Framework. Dies kann Lücken reduzieren, aber oft erhöht sich die Länge und Latenz.
Betonung auf gelerntes Wissen	Fordert das Modell auf, aus früheren Kenntnissen zu ziehen, um Relevanz und Qualität zu verbessern.
Hervorheben der Rolle von KI	Trennt das Sicherheitsverhalten (wie man reagiert) von der primären Rolle des Assistenten (was zu tun ist).
Umkehrlogik	Formuliert Verbote in positive Maßnahmen um, um konstruktive Reaktionen zu fördern.
Risikobasiert	Konzentriert sich auf das primäre Risiko und priorisiert die Prävention der schwersten Schäden.
Regelbasiert	Verwendet explizite Regeln (z. B. "nie", "immer" und bedingte Logik), um Ausgaben einzuschränken.

Einschränkungen

Systemmeldungen sind keine vollständige Sicherheitslösung:

Sie können durch adversariale Eingabeaufforderung umgangen oder herabgestuft werden.
Sie können weniger nützlich sein, wenn sie zu breit oder zu streng sind.
Sie erfordern eine fortlaufende Auswertung, wenn sich Ihre Modelle, Tools und Benutzerszenarien ändern. Informationen zur Problembehandlung häufig auftretender Probleme mit Systemmeldungen, z. B. Überverweigerung oder Untermoderation, finden Sie im Abschnitt zur Problembehandlung im Vorlagenhandbuch.

Empfohlene Systemmeldungen

Diese bewährten Methoden können Ihnen helfen, den Prozess der Entwicklung robuster Systemmeldungen für Ihr Szenario besser zu verstehen.

Weitere Informationen zu empfohlenen Sicherheitskomponenten finden Sie in unseren Richtlinien zur Sicherheitssystem-Nachrichtenvorlage.

Denken Sie schließlich daran, dass Systemmeldungen oder Metaprompts nicht "für alle passen". Die Verwendung solcher Beispiele hat unterschiedliche Erfolgsraten in verschiedenen Anwendungen. Es ist wichtig, verschiedene Formulierungen, Sortierungen und Struktur von Systemnachrichtentext auszuprobieren, um identifizierte Schäden zu reduzieren und die Variationen zu testen, um zu sehen, was für ein bestimmtes Szenario am besten funktioniert.

Nächste Schritte

Azure OpenAI in Microsoft Foundry Models
System-Nachrichtenentwurf mit Azure OpenAI
Ankündigung von Sicherheitssystemnachrichten - Microsoft Foundry Blog
Vorlagen für Sicherheitssystemnachrichten

Feedback

War diese Seite hilfreich?

Last updated on 2026-04-30