Situación del cliente
Uno de los mayores bancos españoles —líder en el ranking de transformación tecnológica del sector financiero europeo— opera una plataforma de datos sobre Amazon Web Services de escala excepcional: más de 8 petabytes de datos, 30.000 tablas activas y 6.500 usuarios concurrentes entre analistas, científicos de datos, equipos de riesgo y tecnología. La plataforma es el núcleo tecnológico del banco y el habilitador de su posición de liderazgo en analítica y toma de decisiones basada en datos.
El banco afrontaba el momento estratégico de definir el siguiente salto tecnológico de esta plataforma: la adopción de inteligencia artificial generativa y agéntica como nueva capa de valor sobre los datos existentes. La dirección de Cloud Banking Technology encargó el Plan Director para definir la hoja de ruta de adopción de GenAI con Amazon Bedrock, la estrategia de gobierno de datos para entornos regulados y el modelo de operación de la plataforma cloud para los próximos años.
Retos
- Diseñar la hoja de ruta de adopción de IA generativa y agéntica sobre Amazon Bedrock a partir de una plataforma de datos existente de 8+ PB, identificando los casos de uso de mayor valor para el banco ordenados por viabilidad técnica, impacto de negocio y riesgo regulatorio
- Definir la estrategia de gobierno de datos para entornos regulados bancarios que habilitara el uso de GenAI sobre datos sensibles de clientes y transacciones, cumpliendo con los requisitos del Banco de España, la BCE y el AI Act europeo sin bloquear la adopción de la tecnología
- Diseñar el modelo de operación del Cloud Banking Technology para los próximos años: organización del equipo, procesos de ciclo de vida de la plataforma, modelo de servicio interno para los equipos del banco y estrategia de FinOps para una plataforma de datos de este tamaño
- Evaluar la arquitectura técnica de Amazon Bedrock para el caso de uso bancario: modelos disponibles, opciones de fine-tuning vs. RAG, latencia de inferencia sobre datos de la plataforma existente, cifrado y residencia de datos en la región AWS elegida
- Establecer el modelo de gobierno de modelos de IA generativa que cumpliera con los requisitos del AI Act (clasificación de riesgo, transparencia, supervisión humana) y los estándares internos del banco para el despliegue de modelos de IA en producción
Solución en diseño
- Hoja de ruta GenAI sobre Amazon Bedrock: inventario y priorización de 40+ casos de uso de IA generativa identificados en los talleres con los equipos del banco, clasificados en cuatro olas según valor de negocio y riesgo regulatorio (ola 1: asistentes internos de productividad y análisis de datos; ola 2: automatización de procesos de back-office; ola 3: aplicaciones cliente con supervisión humana; ola 4: decisiones automatizadas con AI Act compliance completo)
- Estrategia RAG sobre la plataforma de 8 PB: arquitectura de Retrieval-Augmented Generation sobre el Data Lake existente con Amazon Bedrock Knowledge Bases, incluyendo el modelo de indexación selectiva de los 30.000 tablas (qué datos son elegibles para RAG según el nivel de sensibilidad y el caso de uso), la gestión de metadatos semánticos y el control de acceso a los datos indexados basado en el modelo de permisos existente de la plataforma
- Gobierno de datos para GenAI regulado: framework de evaluación de elegibilidad de datos para casos de uso de IA (clasificación de sensibilidad, evaluación de sesgo, requisitos de linaje para auditoría regulatoria), proceso de validación de modelos de IA antes del despliegue en producción y modelo de monitorización continua de comportamiento de modelos en producción con alertas automáticas de deriva
- Modelo de operación Cloud Banking Technology: organización del equipo en tres capas (Plataforma Core, Servicios Compartidos e Innovación), ciclo de vida de la plataforma con releases trimestrales, modelo de servicio interno con SLAs por tipo de carga de trabajo, y estrategia de FinOps para optimizar el coste de una plataforma de 8 PB con 6.500 usuarios mediante Reserved Instances, S3 Intelligent-Tiering y compute savings plans
- AI Act compliance para banca: clasificación de cada caso de uso de IA generativa según el AI Act (sistema de IA de alto riesgo para decisiones de crédito y riesgo, riesgo limitado para asistentes internos), requisitos de transparencia y explicabilidad para cada clasificación, e integración del gobierno de modelos de IA en el marco de riesgo operacional existente del banco
Resultados en curso
Patrón de arquitectura
Plan Director Cloud Banking Technology para banco líder español: plataforma de datos AWS existente de 8+ PB (S3, Redshift con 6.500 usuarios, EMR, Glue con Lake Formation) como base para la adopción de IA generativa con Amazon Bedrock, Knowledge Bases para RAG sobre los 30.000 tablas con indexación selectiva por sensibilidad de dato, Bedrock Agents para casos de uso agénticos, y framework de gobierno IA con clasificación AI Act, Model Registry y FinOps de plataforma con chargeback interno.
- RAG sobre un Data Lake de 8 PB no es indexar todo, es indexar lo correcto — indexar los 30.000 tablas en un vector store es técnicamente posible pero operativamente inviable: el coste de indexación e inferencia sería prohibitivo y la relevancia de las respuestas se degradaría por el ruido. La arquitectura correcta es un modelo de elegibilidad de datos que define qué tablas son candidatas a RAG según el caso de uso, la sensibilidad del dato y los permisos del usuario solicitante.
- Lake Formation es el control de acceso para GenAI, no solo para analítica — cuando Bedrock Knowledge Bases accede al Data Lake para un caso de uso de GenAI, debe respetar exactamente los mismos permisos que el usuario que lanzó la consulta tendría si accediera directamente a Redshift o Athena. Lake Formation con column-level security y row-level filters son la única forma de garantizar que el modelo no devuelve datos a los que el usuario no tiene acceso.
- El AI Act clasifica los casos de uso bancarios de GenAI, no las tecnologías — un sistema de IA que asiste a un analista en la búsqueda de información en los datos del banco (baja autonomía, supervisión humana alta) puede ser de riesgo limitado aunque use exactamente el mismo modelo que un sistema de decisión automatizada de crédito (alto riesgo). La clasificación del AI Act se aplica al caso de uso y su nivel de autonomía, no al modelo o tecnología usada.
- El FinOps de una plataforma de 8 PB con 6.500 usuarios requiere chargeback interno para crear incentivos — sin un modelo de asignación de costes por equipo o área de negocio, los equipos optimizan para sus propias métricas de productividad sin considerar el coste de la plataforma. El chargeback por consumo (queries Redshift, compute EMR, inferencia Bedrock) alinea los incentivos y hace que las optimizaciones de eficiencia surjan de los propios equipos.
- La monitorización de deriva de modelos GenAI es diferente a la de modelos tradicionales de ML — los modelos de ML tradicionales se degradan cuando cambia la distribución de los datos de entrada. Los modelos GenAI se degradan cuando la base de conocimiento sobre la que responden queda desactualizada (los datos indexados ya no reflejan la realidad del banco) o cuando el comportamiento del modelo base del proveedor cambia con actualizaciones. La monitorización debe cubrir ambos vectores.
- El modelo de operación Cloud Banking Technology necesita un equipo de Platform Engineering, no solo Ops — una plataforma de datos de 8 PB con 6.500 usuarios internos es un producto tecnológico, no solo infraestructura. El modelo de operación correcto incluye un equipo de Platform Engineering que desarrolla las capacidades de la plataforma (nuevos servicios, integraciones, experiencia de usuario de los analistas) además del equipo de Ops que garantiza la disponibilidad y el rendimiento.