Question 1

¿Qué es el pentest de IA o de LLM?

Accepted Answer

Es poner a prueba tus sistemas de inteligencia artificial atacándolos como lo haría un adversario real: engañar al modelo con instrucciones escondidas, sacarle datos que no debería dar y, si tiene herramientas conectadas, hacerle ejecutar acciones por ti. A diferencia del pentest clásico, aquí no se entra por la fuerza, se convence al modelo.

Question 2

¿Esto es lo mismo que una auditoría de seguridad de IA?

Accepted Answer

Sí, es su versión ofensiva. Una auditoría de seguridad de IA revisa y comprueba; nosotros, además, atacamos: hacemos hacking ético sobre tu inteligencia artificial para demostrar con pruebas qué fallos se explotan de verdad. El nombre cambia según quién lo pida, pentesting de IA, auditoría de seguridad o red teaming de IA, pero el trabajo es el mismo: ponerla a prueba como lo haría un adversario real.

Question 3

¿Qué es una inyección de prompt?

Accepted Answer

Es la técnica estrella contra los LLM: colar instrucciones que el modelo obedece como si vinieran de su dueño. Puede ser directa, en lo que escribe el usuario, o indirecta, escondida en un documento, una web o un correo que el modelo lee. Con ella se le hace ignorar sus reglas, revelar datos o usar mal sus herramientas.

Question 4

¿Probáis agentes de IA y servidores MCP?

Accepted Answer

Sí, y es de lo más importante ahora. Cuando la IA no solo responde sino que actúa, usando herramientas, llamando a APIs o conectándose por MCP, un fallo deja de ser una respuesta indebida y pasa a ser una acción real en tus sistemas. Probamos el abuso de herramientas, los agentes con demasiados permisos y la seguridad de los servidores MCP.

Question 5

¿Qué es el RAG y por qué se ataca?

Accepted Answer

El RAG es cuando el modelo responde leyendo tus documentos o tu base de conocimiento. Si un atacante consigue meter contenido en esa fuente, manipula lo que el modelo recupera y, con ello, lo que responde. Probamos el envenenamiento de la fuente y la fuga de datos por la vía de recuperación.

Question 6

¿Seguís algún marco de referencia?

Accepted Answer

Sí. Nos apoyamos en el OWASP Top 10 para LLM y en MITRE ATLAS, que son los catálogos de referencia de las técnicas de ataque contra la IA. Nos dan una base común, pero lo interesante suele estar en cómo encaja tu sistema concreto.

Question 7

¿Me sirve para el AI Act o la ISO 42001?

Accepted Answer

Sí, y es una de sus mayores ventajas. Los hallazgos demuestran riesgos reales de tus sistemas de IA, así que valen como evidencia para tu cumplimiento del AI Act y para tu ISO 42001. La misma IA que gobiernas con esas normas, aquí la pones a prueba: gobierno y ataque se complementan.

Question 8

¿En qué se diferencia del pentest de aplicaciones normal?

Accepted Answer

Una aplicación con IA es también una aplicación, así que el pentest de aplicaciones cubre su parte clásica y este se ocupa de lo que es propio del modelo. Y como lo que encontramos demuestra riesgos reales, se convierte en evidencia para tu AI Act y tu ISO 42001: el mismo trabajo gobierna y ataca tu IA.

Y lo que aquí destapamos, con Sondriva, nuestro SOC, lo vigilamos después: detectamos los intentos de abuso contra tu IA en tiempo real, mientras tu equipo cierra los fallos.

Question 9

¿Es seguro hacerlo sobre una IA en producción?

Accepted Answer

Lo acordamos antes y trabajamos con cuidado, igual que en cualquier prueba. Cuando hay riesgo de afectar a datos reales o a la operación, usamos un entorno equivalente. La prioridad es demostrar el fallo sin causar daño.

Pentest de IA y LLM: ponemos a prueba tu inteligencia artificial como un atacante

El atacante ya no entra: convence

Qué ponemos a prueba

Aplicaciones con LLM

RAG y bases de conocimiento

Agentes, herramientas y MCP

Pocos gobiernan tu IA. Menos aún la atacan

Cuándo necesitas poner a prueba tu IA

Antes de ponerla en producción

Tu IA toca datos o sistemas

Te aplica el AI Act o la ISO 42001

Usas agentes o MCP

Cómo trabajamos

Alcance y reglas

Ataque

Hallazgos con prueba

Verificación

No termina en el informe

Preguntas frecuentes