ChatGPT en Android quiere leer texto y botones visibles con Accesibilidad en vez de capturar pantalla

La app de OpenAI prueba en Android un sistema para entender lo que aparece en pantalla mediante Accesibilidad y una burbuja flotante, en lugar de la captura continua actual, aunque plantea dudas de privacidad y no tiene fecha de lanzamiento.

02 de mayo de 2026 a las 15:41h
ChatGPT en Android quiere leer texto y botones visibles con Accesibilidad en vez de capturar pantalla
ChatGPT en Android quiere leer texto y botones visibles con Accesibilidad en vez de capturar pantalla

ChatGPT para Android prepara un nuevo sistema para leer lo que aparece en pantalla sin depender del método actual de captura continua, pero su utilidad práctica llega acompañada de un permiso especialmente sensible Accesibilidad.

La novedad ha aparecido en la versión 1.2026.118 de la app para Android. OpenAI trabaja en una alternativa al sistema que ChatGPT usa hoy para "ver" la pantalla, basado en la API MediaProjection, la misma que se emplea para grabar pantalla o enviar la imagen a un monitor externo. Ese enfoque funciona, pero también implica una captura continua que puede resultar más pesada para el hardware del teléfono y además obliga a convivir con diálogos de permisos y avisos emergentes.

Qué cambia y cómo se usaría en el día a día

El nuevo flujo pasaría por los ajustes de Accesibilidad de Android. En concreto, habría que activar una opción llamada "ChatGPT screen help", descrita como un permiso para que la app pueda "read visible text, buttons, and screen details". A eso se sumarían dos requisitos más habilitar las notificaciones y permitir las conversation bubbles de ChatGPT.

En la práctica, la idea es bastante clara. Una vez concedidos esos permisos, aparecería una burbuja flotante en pantalla y ChatGPT podría ver lo que hay visible tanto en la pantalla de inicio como dentro de otras aplicaciones. El usuario tocaría esa burbuja para preguntar algo concreto sobre lo que tiene delante. Por ejemplo, entender un menú confuso, identificar qué botón pulsar en una app o pedir contexto sobre un texto que aparece en pantalla. Es un uso más inmediato y más cercano al "qué estoy viendo ahora mismo" que al de una conversación larga dentro del chat.

Ese matiz importa porque este sistema, tal y como está planteado, ignoraría el contexto del chat ya existente y se centraría solo en lo que está viendo en ese instante. Eso puede ser una ventaja si lo que se busca es una ayuda puntual y rápida. También puede ser una limitación si alguien espera que ChatGPT conecte lo que hay en pantalla con una conversación anterior o con instrucciones más amplias.

Menos fricción técnica, pero más dudas de privacidad

Sobre el papel, el cambio tiene sentido. Si se sustituye la captura continua de MediaProjection por un acceso apoyado en Accesibilidad y en una burbuja persistente, la experiencia podría ser más ligera y menos intrusiva a nivel de avisos del sistema. También ayudaría a que la app no sea cerrada por Android mientras está activa en segundo plano, algo clave si la propuesta es consultar a ChatGPT sobre lo que aparece en pantalla en cualquier momento.

Ahora bien, dar acceso de Accesibilidad a un chatbot no es un detalle menor. Para muchos usuarios, ese permiso tiene un peso especial porque permite a una app leer elementos visibles de la interfaz, como texto, botones y otros detalles de la pantalla. Aunque la función pueda resultar útil, es razonable que genere recelos. No es el tipo de ajuste que se activa sin pensar dos veces.

También queda en el aire la compatibilidad real. La función Bubbles se introdujo como característica en Android 17, aunque su API existe desde al menos Android 11. Eso abre la puerta a que el sistema pueda funcionar en móviles con versiones anteriores, pero por ahora no hay confirmación oficial sobre qué dispositivos lo soportarán finalmente ni en qué condiciones.

Lo más importante es que todavía no hay fecha de lanzamiento confirmada. Todo lo conocido procede de un APK teardown, así que la función podría cambiar, retrasarse o no publicarse nunca. Si acaba llegando, puede convertirse en una forma más práctica de pedir ayuda contextual dentro del móvil. Si no, se quedará como otro experimento interesante que apuntaba a una interacción más natural con ChatGPT en Android, pero que nunca salió del laboratorio.

Sobre el autor
Redacción
Ver biografía