Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La detección de fundamentación en Seguridad del contenido de Azure AI le ayuda a garantizar que las respuestas del modelo de lenguaje extenso (LLM) se basen en el material de origen proporcionado, lo que reduce el riesgo de respuestas no fácticas o fabricadas.
La falta de fundamentos se refiere a situaciones donde los LLMs generan información que no es veraz o es inexacta respecto a lo que estaba presente en los materiales originales.
La detección de la relevancia requiere incorporación y formato de documentos.
Para comprender la detección de fundamentación, resulta útil estar familiarizado con estos conceptos fundamentales.
Términos clave
- Generación aumentada mediante recuperación (RAG): RAG es una técnica para aumentar el conocimiento de LLM con otros datos. Los LLM pueden razonar sobre temas de gran alcance, pero su conocimiento se limita a los datos públicos que estaban disponibles en el momento en que se entrenaron. Si desea crear aplicaciones de inteligencia artificial que puedan razonar sobre los datos privados o los datos introducidos después de la fecha límite de un modelo, debe proporcionar al modelo esa información específica. El proceso de traer la información adecuada e insertarla en la solicitud del modelo se conoce como Generación aumentada de recuperación (RAG). Para obtener más información, consulte Generación aumentada de recuperación (RAG).
- Fundamentos y falta de fundamentos LLM: hace referencia a la medida en que los resultados del modelo se basan en la información proporcionada o reflejan fuentes de confianza de forma precisa. Una respuesta fundamentada se adhiere estrechamente a la información dada, evitando especulación o fabricación. En las medidas de la base, la información de origen es fundamental y actúa como origen de base.
Modos de detección
La detección de la fundamentación ofrece dos modos para equilibrar la velocidad con la interpretabilidad.
- Modo sin razonamiento: detección rápida para aplicaciones en línea. Devuelve resultados binarios con o sin fundamentos sin explicaciones detalladas.
- Modo de razonamiento: proporciona explicaciones detalladas para segmentos sin fundamento detectados. Mejor para comprender las causas principales y las estrategias de mitigación.
Elija el modo de no razonamiento para las aplicaciones en tiempo real en las que importa la latencia. Utilice el modo razonamiento durante el desarrollo y la depuración para comprender por qué se marca el contenido.
Selección de dominio
Elija un dominio para optimizar la detección de su caso de uso:
- Médico: optimizado para contenido médico, sanitario y científico en el que la precisión es crítica
- Genérico: adecuado para contenido de uso general, como soporte técnico al cliente, documentación y comunicaciones empresariales
La selección de dominio ajusta la sensibilidad y el comportamiento de corrección del modelo de detección para la terminología y los patrones específicos del dominio.
Especificación de tareas
Especifique el tipo de tarea para optimizar la detección:
- Resumen: para validar resúmenes generados en documentos de origen
- QnA: para validar las respuestas de preguntas y respuestas con respecto a bases de conocimiento
La selección de tareas ajusta la sensibilidad de detección y la lógica de corrección para patrones específicos de la tarea.
Corrección de la base (versión preliminar)
La API de detección de fundamentos incluye una característica de corrección opcional que no solo detecta contenido sin fundamentos, sino que lo corrige automáticamente de acuerdo con sus orígenes de referencia. Esto es útil para:
- Corregir automáticamente errores fácticos en resúmenes generados
- Asegurarse de que las respuestas de inteligencia artificial se alineen con el material de origen
- Reducción del tiempo de revisión manual para contenido de gran volumen
Escenarios de usuario
La detección de fundamento apoya tareas de resumen y preguntas y respuestas basadas en texto para garantizar que los resúmenes o respuestas generados sean precisos y confiables.
Tareas de resumir:
- Resumen médico: en el contexto de los artículos de noticias médicas, la detección de groundedness se puede usar para asegurarse de que el resumen no contiene información fabricada o engañosa, garantizando que los lectores obtengan información médica precisa y confiable.
- Resumen de documentos académicos: cuando el modelo genera resúmenes de artículos académicos o artículos de investigación, la función puede ayudar a garantizar que el contenido resumido represente con precisión las conclusiones y contribuciones clave sin introducir afirmaciones falsas.
Tareas de QnA:
- Bots de chat de soporte al cliente: en el soporte técnico al cliente, la función se puede usar para validar las respuestas proporcionadas por bots de chat de IA, lo que garantiza que los clientes reciban información precisa y confiable cuando hagan preguntas sobre productos o servicios.
- QnA médica: para la QnA médica, la función ayuda a comprobar la precisión de las respuestas médicas y los consejos proporcionados por los sistemas de inteligencia artificial a los profesionales sanitarios y a los pacientes, lo que reduce el riesgo de errores médicos.
- QnA educativo: en la configuración educativa, la función se puede aplicar a las tareas de QnA para confirmar que las respuestas a preguntas académicas o consultas de preparación de pruebas son objetivamente precisas, lo que apoya el proceso de aprendizaje.
A continuación, vea varios escenarios comunes que ilustran cómo y cuándo aplicar estas características para lograr los mejores resultados.
Resumen en contextos médicos
Va a resumir documentos médicos y es fundamental que los nombres de los pacientes de los resúmenes sean precisos y coherentes con las fuentes de base proporcionadas.
Solicitud de API de ejemplo:
{
"domain": "Medical",
"task": "Summarization",
"text": "The patient name is Kevin.",
"groundingSources": [
"The patient name is Jane."
],
}
Resultado esperado:
La función de corrección detecta que Kevin está sin fundamento porque conflicta con la fuente de fundamento Jane. La API devuelve el texto corregido: "The patient name is Jane."
Tarea de preguntas y respuestas (QnA) con datos de soporte técnico al cliente
Va a implementar un sistema QnA para un bot de chat de soporte al cliente. Es esencial que las respuestas proporcionadas por la inteligencia artificial se alineen con la información más reciente y precisa disponible.
Solicitud de API de ejemplo:
{
"domain": "Generic",
"task": "QnA",
"qna": {
"query": "What is the current interest rate?"
},
"text": "The interest rate is 5%.",
"groundingSources": [
"As of July 2024, the interest rate is 4.5%."
],
}
Resultado esperado:
La API detecta que 5% está sin conexión a tierra porque no coincide con la fuente de conexión a tierra proporcionada 4.5%. La respuesta incluye el texto de corrección: "The interest rate is 4.5%."
Creación de contenido con datos históricos
Va a crear contenido que implique datos históricos o eventos, donde la precisión es fundamental para mantener la credibilidad y evitar errores de información.
Solicitud de API de ejemplo:
{
"domain": "Generic",
"task": "Summarization",
"text": "The Battle of Hastings occurred in 1065.",
"groundingSources": [
"The Battle of Hastings occurred in 1066."
],
}
Resultado esperado:
La API detecta la fecha sin referencia 1065 y la corrige a 1066 según la fuente de referencia. La respuesta incluye el texto corregido: "The Battle of Hastings occurred in 1066."
Resumen de documentación interna
Va a resumir documentos internos en los que los nombres de producto, los números de versión u otros puntos de datos específicos deben ser coherentes.
Solicitud de API de ejemplo:
{
"domain": "Generic",
"task": "Summarization",
"text": "Our latest product is SuperWidget v2.1.",
"groundingSources": [
"Our latest product is SuperWidget v2.2."
],
}
Resultado esperado:
La función de corrección identifica SuperWidget v2.1 como sin conexión a tierra y actualiza a SuperWidget v2.2 en la respuesta. La respuesta devuelve el texto corregido: "Our latest product is SuperWidget v2.2."
Limitaciones
Disponibilidad del idioma
Actualmente, la detección de solidez solo admite contenido en inglés. Aunque la API no restringe los envíos no en inglés, la precisión y la calidad están optimizadas para inglés.
Limitaciones de longitud de texto
La longitud máxima del texto varía según el modo. Consulte Requisitos de entrada para conocer los límites actuales.
Disponibilidad de regiones
La detección de fundamento está disponible en regiones específicas de Azure. Consulte Disponibilidad de regiones para las regiones compatibles.
Limitaciones de velocidad
Se aplican límites de frecuencia de consulta predeterminados. Para obtener requisitos de rendimiento más altos, póngase en contacto con el soporte técnico de Seguridad del contenido.