Nubank no está jugando al mismo juego que el resto de la banca

8–12 minutos

read

Mientras muchos siguen discutiendo si usan XGBoost o redes neuronales para ajustar un score, ellos construyeron algo distinto, estratégicamente más peligroso para cualquiera que compita con ellos: un cerebro de comportamiento financiero propio.

Ese cerebro se llama nuFormer. Si dirigís un banco o una fintech grande y no entendés qué significa esto, estás entrando a un partido que ya empezó, con el marcador en contra.

1. Qué es realmente nuFormer

nuFormer no es “un modelo más”.

Es un modelo de base de tipo Transformer, propietario de Nubank, entrenado sobre años de datos de transacciones, uso de la app y comportamiento financiero real de sus clientes.

En vez de tener veinte modelos separados que miran planillas distintas, Nubank construyó un foundation model de datos financieros. Un único modelo que aprende el patrón de vida financiera de las personas y produce algo muy valioso: una representación numérica de cada cliente. Un embedding de comportamiento que luego se reutiliza en muchos casos de negocio.

Ese embedding alimenta decisiones de riesgo, de límites, de oferta de productos, de engagement, de cobranza. No importa si el problema final es supervisado o no, el punto es que todos parten de la misma “mirada profunda” del comportamiento.

En términos simples, nuFormer es el “GPT de los datos financieros” de Nubank. No porque genere texto, sino porque cumple el mismo rol estratégico: es la capa de comprensión sobre la que se construyen el resto de los modelos.

2. Cómo funciona, sin maqueta de vendor

La base técnica es un Transformer, la misma clase de arquitectura que usan los grandes modelos de lenguaje.

Pero en lugar de procesar frases, procesa la película completa del comportamiento financiero de cada cliente.

2.1. Qué entra al modelo

nuFormer consume, entre otros:

Transacciones de tarjeta y cuenta. Eventos de la app y del resto de canales. Atributos numéricos y categóricos, fechas, montos, ubicaciones, descripciones.

Cada transacción o evento se convierte en algo similar a un token. No es una palabra, es un paquete de información: qué pasó, cuándo, cuánto, en qué contexto. Luego se ordena todo cronológicamente y se arma una secuencia temporal de comportamiento.

En vez de ver “gasto total del mes”, el modelo ve la secuencia completa de cómo entra y sale el dinero, cómo se usan los límites, en qué momento del ciclo se tensiona la capacidad de pago, cómo se combinan ingresos y egresos, qué hábitos se repiten.

2.2. Cómo aprende

nuFormer se entrena con self supervised learning.

No necesita que un humano etiquete cada transacción con “buena” o “mala”. Aprende a partir de tareas internas, como predecir la próxima parte de la secuencia o reconstruir información parcial. Igual que un modelo de lenguaje que aprende a completar frases, pero con hábitos de gasto e ingreso.

De ese entrenamiento surge una representación densa del comportamiento, un vector por cliente que condensa patrones de:

Estabilidad de ingresos. Ciclos y estacionalidades. Sensibilidad a cambios de precio o de contexto. Respuestas pasadas a ofertas, avisos, aumentos de límite, etc.

2.3. Cómo se usa en el negocio

Ese embedding no se queda en un paper. Es el input de lujo para muchos modelos supervisados:

Modelos de aprobación de crédito. Modelos de asignación y ajuste de límites. Modelos de recomendación de productos. Modelos de riesgo y cobranza. Modelos de detección de anomalías.

Se combina con las features tabulares tradicionales y el resultado supera sistemáticamente a los modelos que solo veían agregados estáticos. El salto no viene de inventar nuevos datos, viene de mirar los mismos datos con una lente mucho más rica.

3. Qué resultados declara Nubank

En su comunicación a inversores, Nubank es muy claro con el mensaje: nuFormer logra mejoras de AUC que triplican el uplift promedio que conseguían con upgrades clásicos de modelos de machine learning.

No publican todos los números en detalle, pero sí la idea central:

cada vez que antes se hacía una iteración más sobre modelos tabulares, el avance era incremental; con nuFormer se movió el techo de rendimiento.

Además, vinculan explícitamente este modelo con:

Mejoras en decisiones de límite y originación, manteniendo controlado el riesgo. Mejores capacidades de recomendación, con impacto en uso de productos y aumento de relación con el cliente. La construcción de una plataforma AI first para escalar a Brasil, México y Colombia con un stack de decisión consistente.

No están vendiendo “tenemos un modelo nuevo”. Están diciendo “tenemos una infraestructura de IA propia, diseñada para datos financieros, que eleva todos nuestros modelos de negocio al mismo tiempo”.

4. Qué cambia frente al enfoque clásico de la banca

Comparemos con la realidad de la mayoría de los bancos.

4.1. Antes, el zoológico de modelos

Lo habitual es:

Un modelo de originación. Otro de comportamiento. Otro de límite. Varios modelos de campaña. Alguno de fraude.

Cada uno se alimenta de un set de features tabulares diferentes. Cada equipo hace su propio feature engineering. Hay solapamientos, inconsistencias, información duplicada y versiones distintas de la realidad de un mismo cliente.

La mirada del cliente termina siendo una colección de resúmenes:

gasto total, saldo promedio, ratio de pago mínimo, etc. Son fotos estáticas de datos ya agregados.

4.2. Con nuFormer, la película completa

El cambio de paradigma es claro:

Hay un solo modelo de representación del comportamiento, que ve la secuencia granular, no solo el agregado. Todos los modelos de negocio comparten esa representación base. Cada caso de uso agrega lo suyo, pero arranca desde una comprensión profunda común.

Eso genera tres efectos inmediatos:

Consistencia. El banco deja de tomar decisiones contradictorias sobre el mismo cliente porque todos parten de la misma lectura de hábitos. Velocidad de despliegue. Cada nuevo modelo de negocio no empieza de cero. Arranca con embeddings ya entrenados, probados y gobernados. Productividad de los equipos de datos. Menos tiempo inventando features manuales, más tiempo afinando objetivos y políticas.

nuFormer convierte el dato transaccional en un activo compartido, no en materia prima que cada equipo reprocesa a su manera.

5. La ventaja competitiva que genera

Si lo mirás con ojos de directorio, nuFormer es un moat de datos e IA.

5.1. Moat de representación

Cualquier competidor puede contratar la misma nube, la misma herramienta de AutoML y hasta el mismo proveedor de consultoría. Lo que no puede copiar es:

La historia de datos transaccionales que Nubank ya acumuló. La forma en que esa historia fue comprimida en un espacio de representación propio.

Esa representación es la pieza que se vuelve intraducible. Incluso si otro jugador accede al paper y replica la arquitectura, su modelo no verá los mismos patrones ni tendrá la misma riqueza de señales.

5.2. Impacto en economía unitaria

Mejor AUC no es un capricho técnico. Es:

Menos pérdidas crediticias a igualdad de crecimiento. Más crecimiento a igualdad de riesgo, si se quiere usar el margen. Mejor segmentación para ofrecer productos, por lo tanto mayor ARPAC y mejor uso de capital.

En negocios de spread ajustado y presión regulatoria, ese tipo de ventaja compuesta se acumula. Año a año, un modelo más fino se traduce en un portafolio más sano y más rentable.

5.3. Diferenciación frente a modelos genéricos

Otra pieza importante. Nubank no se limitó a “consumir IA” de terceros. Construyó una infraestructura de IA de dominio propio. Eso le da tres cosas:

Control sobre los outputs y la posibilidad de ajustar el modelo a la realidad regulatoria de cada país. Independencia relativa del roadmap de cualquier vendor externo. Un relato de innovación que sí es creíble para inversores y reguladores, porque se apoya en capacidades concretas y no en buzzwords.

6. Los riesgos y desafíos de este enfoque

Nada de esto es gratis ni trivial. Un modelo como nuFormer exige un nivel de madurez que muchas organizaciones aún no tienen.

6.1. Gobernanza de modelos

Cuando un foundation model alimenta muchos casos de uso, el modelo de riesgo se vuelve multicapa:

Tenés que monitorear el modelo base. Tenés que monitorear cada modelo derivado. Tenés que entender cómo cambios en el foundation model impactan en cascada.

Eso implica procesos robustos de validación, backtesting, monitoreo de drift, documentación, comités de modelos, etc.

6.2. Bias y fairness

Un modelo que aprende de historia puede amplificar sesgos de esa historia. En crédito y servicios financieros, esto no es solo un tema reputacional, es un tema regulatorio y social.

Hay que poder responder preguntas como:

Qué grupos de clientes reciben sistemáticamente peores condiciones. Qué patrones de comportamiento está priorizando el modelo. Cómo aseguramos que inclusión financiera y riesgo responsable no se vuelvan objetivos en conflicto.

6.3. Explicabilidad

Un Transformer no es una regresión logística. Explicar por qué una combinación de atenciones internas llevó al resultado que llevó no es trivial.

Hay que invertir en:

Herramientas de interpretabilidad. Documentación comprensible para supervisores y áreas de control. Material que conecte el lenguaje técnico de embeddings con políticas claras para el negocio.

6.4. Costos e infraestructura

nuFormer implica:

Pipelines estables de datos de eventos y transacciones en tiempo casi real. Equipos especializados en deep learning y MLOps. Capacidad de cómputo relevante para entrenar y reentrenar.

No es una hoja de Excel con un score. Es infraestructura crítica.

7. Qué debería preguntarse hoy un C level de banca

Visto todo esto, la pregunta no es si te gusta Nubank o no. La pregunta es dónde está tu organización frente a esta lógica.

Las preguntas incómodas que conviene poner sobre la mesa:

Quién tiene hoy la mejor “lectura” del comportamiento financiero de nuestros clientes. Nosotros o un tercero. Si tu arquitectura de datos está fragmentada, la respuesta no te va a gustar. Cuántos modelos estamos manteniendo y cuánta información comparten realmente. Si cada equipo tiene su zoológico de features, estás pagando caro en inconsistencia y costo. Qué parte de nuestra ventaja competitiva futura va a venir de modelos propios frente a modelos genéricos. Consumir IA de terceros puede ser táctico. No tener una estrategia de representación propia es un riesgo estratégico. Qué marco de gobernanza tenemos para sostener algo tipo nuFormer. No se trata de copiar la arquitectura, se trata de ver si la organización tiene cintura de datos, riesgo, compliance y tecnología para operarla.

8. Cómo se replica el espíritu de nuFormer sin copiar a Nubank

No se trata de clonar el modelo. Se trata de adoptar la lógica de diseño.

Un roadmap serio se parece a esto:

Unificar la película del cliente Consolidar transacciones, eventos de canales, interacciones de servicio y comportamiento digital en una única línea de tiempo por cliente. No un data mart por área, una narrativa completa. Construir tu propio modelo de representación Diseñar un modelo de tipo Transformer o equivalente que aprenda hábitos financieros y genere embeddings reutilizables como primer producto, no como experimento de laboratorio. Acoplar esa representación a los casos de negocio de alto impacto Empezar por originación, asignación de límites y recomendación de producto principal. Donde cada punto de AUC adicional tiene impacto directo en P&L. Montar el marco de gobernanza y explicabilidad desde el día uno Comité de modelos, métricas de fairness, documentación para supervisores, procesos de aprobación y de cambio. Si esto se arma después, siempre llega tarde. Medir como Nubank No te enamores de la métrica de laboratorio. Medí uplift de AUC frente al modelo actual, y traducilo a NPL, pérdida esperada, crecimiento, ARPAC y retorno sobre capital.

Ese es el terreno de juego real.

nuFormer no es sólo el nombre de un modelo, es el síntoma de que una organización decidió que la representación del comportamiento financiero de sus clientes es un activo estratégico de primer orden, y actuó en consecuencia.

La pregunta incómoda que queda es simple:

¿tu banco tiene ya su nuFormer, o sigue discutiendo qué versión de Excel usar para el próximo modelo de crédito?

Te ayudo ?

Diego San Esteban

Descubre más desde DIEGO San Esteban

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo