Fundamentar los sistemas de IA

5 minutos

La puesta en tierra es el proceso de conectar las respuestas de un sistema de inteligencia artificial a datos comprobados y reales en lugar de confiar únicamente en el conocimiento de entrenamiento general del modelo. Sin conexión a tierra, los modelos de IA generativos se extraen exclusivamente de patrones aprendidos durante el entrenamiento, que pueden ser obsoletos, incompletos o incorrectos para un caso de uso específico. La puesta a tierra es un control de calidad y un control de seguridad.

¿Por qué es importante la puesta a tierra para la seguridad?

Desde una perspectiva de seguridad, los sistemas de inteligencia artificial sin base plantean varios riesgos:

Salidas fabricadas: es más probable que un modelo sin fundamento genere afirmaciones incorrectas con seguridad, sobre la cual los usuarios pueden actuar sin verificación.
Información obsoleta: los modelos entrenados sobre datos de meses o años atrás pueden proporcionar instrucciones obsoletas, especialmente peligrosas para asesoramiento de seguridad, requisitos de cumplimiento o documentación del producto.
Ámbito sin restricciones: sin conexión a tierra, un modelo puede responder a preguntas sobre cualquier tema, incluidas las áreas en las que carece de conocimientos suficientes para ser confiables.

La puesta en tierra restringe el modelo para trabajar con orígenes de datos específicos y comprobados, lo que reduce la superficie expuesta a ataques para los riesgos de salida fabricados y ayuda a aplicar los límites definidos en la solicitud del sistema.

Técnicas de puesta a tierra

Varias técnicas se usan normalmente para poner en tierra sistemas de inteligencia artificial en datos comprobados:

Generación aumentada por recuperación (RAG)

RAG es la técnica de anclaje más adoptada. Funciona por:

Recuperación de documentos o datos relevantes de una base de conocimiento, una base de datos o un índice de búsqueda en función de la consulta del usuario
Aumentando el indicador con esta información recuperada
Generación de una respuesta informada por las funcionalidades del modelo y los datos recuperados específicos

RAG permite que la inteligencia artificial proporcione respuestas actuales específicas del contexto sin necesidad de volver a entrenar el modelo. Por ejemplo, un asistente de inteligencia artificial con RAG puede responder preguntas sobre las directivas internas de una organización mediante la recuperación de los documentos de directivas más recientes en el momento de la consulta.

Entre las consideraciones de seguridad para las implementaciones de RAG se incluyen:

Control de acceso en los datos de origen: asegúrese de que el sistema de recuperación respeta los mismos controles de acceso que el usuario. La inteligencia artificial no debe recuperar los documentos que el usuario no tiene autorización para ver.
Integridad de datos de origen: proteja la base de conocimiento frente a alteraciones. Si un atacante puede modificar los datos de puesta a tierra, puede influir en las respuestas de la inteligencia artificial, una forma de manipulación indirecta.
Cita y rastreabilidad: configure el sistema para citar qué orígenes informaron a cada respuesta, lo que permite comprobar la precisión y detectar cuándo el modelo se aleja de sus datos de base.

Instrucciones de ingeniería para la puesta en tierra

Las técnicas avanzadas de ingeniería de avisos complementan RAG al indicar al modelo cómo usar sus datos de base:

Incluir instrucciones explícitas para basar las respuestas solo en el contexto proporcionado
Defina cómo debe responder el modelo cuando los datos de base no contengan la respuesta ("En función de la información disponible, no tengo una respuesta a esa pregunta")
Establecer reglas para cómo el modelo debe controlar la información en conflicto entre orígenes

Detección de la base de datos

Algunas plataformas de inteligencia artificial ofrecen detección de fundamento como una funcionalidad integrada. Esta característica evalúa las afirmaciones del modelo con respecto a los materiales de origen proporcionados, señalando las respuestas que contienen información no respaldada por los datos base. La detección de solidez actúa como una comprobación de seguridad posterior a la generación, capturando salidas fabricadas que pasaron por otros controles.

Procedimientos recomendados para la puesta en tierra

Al implementar la fundamentación en sistemas de inteligencia artificial:

Mantener actualizados los datos de referencia: Establezca procesos para actualizar periódicamente la base de conocimiento. Los datos de puesta a tierra obsoletos pueden ser tan problemáticos como sin datos de puesta a tierra.
Validar la calidad de la fuente: use solo fuentes autoritativas y comprobadas para la fundamentación. Basarse en transferencias de datos no confiables transfiere esa falta de confiabilidad a las respuestas de la inteligencia artificial.
Supervisar métricas de groundedness: Monitoree la frecuencia con la que las respuestas del modelo están fundamentadas frente a las que no lo están. Un aumento de las respuestas no fundamentadas puede indicar un problema con el proceso de recuperación o con los datos de referencia.
Combinar con filtros de contenido: use la detección de fundamentación junto con los filtros de contenido y las instrucciones de metaprompt para un enfoque de defensa en capas.

Comentarios

¿Le ha resultado útil esta página?