Los modelos de imagen se han convertido en el principal motor de descargas para las apps móviles de IA, muy por delante de las actualizaciones más tradicionales.
Ese cambio marca una diferencia clara frente a una etapa anterior, cuando el tirón venía más por nuevos modelos conversacionales o por funciones como los chats por voz. Ahora el interés se desplaza hacia lo visual: la promesa de generar imágenes dentro de la app parece empujar a mucha más gente a instalarla, probarla y ver hasta dónde llega en el uso real.
La imagen vende más instalaciones que las mejoras habituales
El dato más contundente del informe de Appfigures es que los lanzamientos de modelos de imagen generan 6,5 veces más descargas que las actualizaciones tradicionales de modelo. No es un matiz menor. En la práctica, esto sugiere que para el usuario medio resulta mucho más fácil entender el valor inmediato de una función visual que el de una mejora interna en un modelo de lenguaje.
Se ve con claridad en los casos analizados. Google lanzó Gemini 2.5 Flash en agosto y su modelo de imagen, conocido como Nano Banana, sumó más de 22 millones de descargas adicionales en los 28 días posteriores. En ese mismo periodo, las descargas de Gemini crecieron más de 4x. Es un salto muy visible: una persona puede abrir la app para pedir una imagen concreta, probar estilos o generar contenido visual en segundos. Ese tipo de uso tiene un gancho inmediato que una mejora más abstracta en comprensión o razonamiento no siempre consigue transmitir.
ChatGPT mostró un efecto parecido. Cuando introdujo el modelo de imagen GPT-4o en marzo del año pasado, la app añadió más de 12 millones de instalaciones incrementales en 28 días. Appfigures calcula que ese volumen fue aproximadamente 4,5 veces superior al obtenido con los lanzamientos de GPT-4o, GPT-4.5 y GPT-5. La diferencia es reveladora: incluso en una app ya masiva, una función visual puede mover más a la acción que varias actualizaciones potentes de modelo general.
Meta AI también aparece en el análisis, aunque con un enfoque algo distinto. Su feed de vídeo con IA Vibes, lanzado en septiembre de 2025, añadió una estimación de 2,6 millones de descargas incrementales en 28 días. No se trata exactamente de un modelo de imagen, pero sí de una función ligada al contenido visual y no solo al texto. El patrón, por tanto, se mantiene: cuando la novedad se puede ver, compartir o probar de forma muy tangible, la instalación sube.
Descargar no es lo mismo que pagar
La parte menos espectacular está en el negocio. Más descargas no significan automáticamente más ingresos móviles. Que una función de imagen despierte curiosidad y lleve al usuario a instalar la app no garantiza que después acabe pagando una suscripción.
Gemini es un buen ejemplo de esa distancia entre interés y monetización. Pese al empuje de Nano Banana, el gasto bruto de consumidores en los 28 días posteriores fue de solo 181.000 dólares. En Meta AI, el informe va aún más lejos: hubo descargas adicionales tras Vibes, pero sin ingresos relevantes. Es decir, la función visual sirve para atraer atención, pero no necesariamente para convertirla en negocio móvil.
El caso distinto fue ChatGPT. Su modelo de generación de imágenes 4o produjo una estimación de 70 millones de dólares en gasto bruto de consumidores durante los 28 días posteriores al lanzamiento, frente a su nivel base previo. De los tres casos analizados, fue el único que logró transformar el interés por la imagen en ingresos realmente significativos.
Para el usuario, esto deja una lectura práctica bastante clara. Las funciones visuales sí cambian algo en el día a día porque hacen más evidente para qué abrir la app: crear una imagen, experimentar con una idea o probar una herramienta que ofrece un resultado inmediato. Pero ese atractivo inicial no siempre significa que la experiencia completa merezca pagar por ella. Muchas instalaciones parecen responder más a la curiosidad que a un uso estable o a una decisión de compra.
El caso de DeepSeek va por otro camino
Appfigures también estudió DeepSeek, pero aquí la dinámica fue diferente. DeepSeek R1 impulsó 28 millones de descargas tras su lanzamiento en enero de 2025, aunque el informe aclara que no encaja en el mismo patrón. No fue un fenómeno vinculado a un modelo de imagen, sino al momento en que la app dejó de ser relativamente desconocida y pasó a ganar notoriedad rápida dentro de la industria tecnológica.
En este caso, el interés estuvo ligado a la curiosidad por las técnicas con las que entrenó sus modelos de IA a una fracción del coste de sus competidores. No fue tanto una función visual la que empujó la instalación, sino la sensación de estar ante una nueva protagonista del sector.
Lo que queda es una tendencia bastante nítida: en móvil, las novedades visuales son más fáciles de vender que las mejoras de fondo. Funcionan porque se entienden al instante y porque invitan a probar. Otra cosa es que, pasado ese primer impulso, la app acabe ocupando un hueco real en la rutina del usuario. Ahí es donde se separan las descargas llamativas de los productos que de verdad consiguen quedarse.