Revisión de las bibliotecas de código abierto de IA

5 minutos

El software de código abierto (OSS) es una parte integral del desarrollo de software moderno y los sistemas de inteligencia artificial no son ninguna excepción. Normalmente, los proyectos de inteligencia artificial dependen de marcos de código abierto, bibliotecas de modelos, modelos entrenados previamente y herramientas de procesamiento de datos. Al igual que otros componentes del sistema operativo, las bibliotecas específicas de inteligencia artificial presentan riesgos de cadena de suministro que requieren una revisión de seguridad completa antes de la adopción.

¿Por qué las bibliotecas de código abierto de IA necesitan especial atención?

Las bibliotecas del sistema operativo de IA conllevan algunos riesgos que van más allá de los de las dependencias de software tradicionales:

Modelos entrenados previamente: muchas bibliotecas de IA se envían con o descargan modelos previamente entrenados. Un modelo en peligro puede contener puertas traseras o comportamiento sesgado que es difícil de detectar a través de la revisión de código por sí sola.
Dependencias de canalización de datos: las bibliotecas de inteligencia artificial suelen controlar la carga, transformación y extracción de características de los datos. Las vulnerabilidades de estos componentes pueden exponer datos de entrenamiento o permitir la intoxicación de datos.
Riesgos deserialización: los modelos de IA se guardan y cargan con frecuencia mediante formatos de serialización (como pickle en Python). La deserialización de archivos de modelo que no son de confianza puede provocar la ejecución arbitraria del código.
Ciclos de versión rápidos: las bibliotecas de IA evolucionan rápidamente, con cambios importantes frecuentes. Las organizaciones que anclan a versiones anteriores pueden perder revisiones de seguridad críticas.

Evaluación de la idoneidad de las bibliotecas del software de código abierto

Antes de adoptar una biblioteca OSS de IA, evalúela desde las perspectivas funcionales y de seguridad.

Contexto y propósito: defina por qué está revisando esta biblioteca. ¿La integra en un sistema de producción, la usa para la experimentación o la evaluación de las alternativas? Establecer criterios claros de aceptación para la revisión.
Evaluación de riesgos: considere los posibles riesgos de usar la biblioteca. Use el modelado de amenazas para identificar vectores de ataque: ¿cómo encaja esta biblioteca en la superficie expuesta a ataques de la aplicación? ¿Qué ocurre si la biblioteca está en peligro?
Cumplimiento de licencias: compruebe que la licencia de la biblioteca es compatible con las directivas de su organización, especialmente para uso comercial o gubernamental.
Salud del mantenimiento: Compruebe cómo se mantiene activamente la biblioteca. Examine la frecuencia de confirmación, los tiempos de respuesta del problema y el número de colaboradores activos. Las bibliotecas abandonadas o mínimamente mantenidas son de mayor riesgo.

Revisión de código y análisis de dependencias

Realice una revisión técnica del código de la biblioteca y su cadena de dependencias:

Inspección de código: examine el código fuente de la biblioteca para detectar errores de seguridad, como vulnerabilidades de inyección, prácticas criptográficas no seguras y deserialización no segura. Preste atención a los mecanismos de autenticación, la validación de entrada y el control de errores.
Evaluación de dependencias: evalúe las dependencias transitivas de la biblioteca. Los componentes obsoletos o vulnerables del árbol de dependencias pueden presentar riesgos incluso si el código propio de la biblioteca es seguro.
Análisis de composición de software (SCA): use herramientas de SCA automatizadas para identificar vulnerabilidades conocidas (CVE) en la biblioteca y sus dependencias. Muchas organizaciones integran estas herramientas en su canalización de CI/CD para detectar problemas al principio.

Controles específicos de IA para la cadena de suministro

Más allá de los procedimientos de revisión estándar de OSS, aplique estos controles específicos de IA:

Comprobación de la procedencia del modelo: cuando una biblioteca incluye modelos entrenados previamente, compruebe dónde procede el modelo, quién lo entrenó y si se documentan los datos de entrenamiento y el proceso. Una lista de materiales de inteligencia artificial (AI-BOM) (un inventario estructurado de componentes del modelo, orígenes de datos de entrenamiento y dependencias) ayuda a establecer confianza.
Examen de modelos: examine los archivos de modelo descargados para cargas malintencionadas conocidas antes de cargarlos. Evite deserializar los archivos de modelo de orígenes que no son de confianza.
Comprobaciones de reproducibilidad: siempre que sea posible, compruebe que los modelos se pueden reproducir desde configuraciones y datos de entrenamiento documentados. Esto ayuda a confirmar que el modelo no se ha alterado.
Evaluación en entorno seguro: pruebe las nuevas bibliotecas de IA en entornos aislados antes de implementarlas en producción para contener cualquier comportamiento inesperado.

Examen y corrección de vulnerabilidades

No suponga que otros usuarios han realizado comprobaciones de vulnerabilidad. Aplique su propia cadena de herramientas de evaluación:

Exámenes completos: use escáneres de vulnerabilidades para identificar posibles puntos débiles de seguridad en la biblioteca y sus dependencias.
Corrección prioritaria: si se detectan vulnerabilidades, evalúe su impacto y vulnerabilidad. Priorice las correcciones en función de la gravedad y la exposición.
Supervisión continua: las bases de datos de vulnerabilidades del sistema operativo se actualizan periódicamente. Configura alertas automatizadas para nuevos CVE que afectan a las bibliotecas de tu pila de inteligencia artificial.

Comentarios

¿Le ha resultado útil esta página?