screen-reader-testing
por wshobsonscreen-reader-testing es una skill práctica para auditorías de UX y QA de accesibilidad. Aprende a usarla para probar aplicaciones web con VoiceOver, NVDA y JAWS, priorizar la cobertura por navegador y plataforma, y revisar formularios, comportamiento ARIA, gestión del foco y anuncios dinámicos.
Esta skill obtiene una puntuación de 76/100, lo que la convierte en una candidata sólida para el directorio: ofrece una guía clara, bien delimitada y sustancial sobre cuándo aplicar pruebas con lectores de pantalla, y es probable que un agente rinda mejor con ella que con un prompt genérico de accesibilidad. Su principal limitación es que es solo documentación, por lo que quienes la adopten deberán aportar su propia configuración de herramientas y entorno de ejecución.
- Alta capacidad de activación: la descripción y la sección "When to Use" enmarcan con claridad la compatibilidad con lectores de pantalla, la validación de ARIA, la accesibilidad de formularios, los anuncios dinámicos y las pruebas de navegación.
- Contenido operativo sustancial: la skill incluye los principales lectores de pantalla, prioridades de prueba, modos y una guía estructurada y extensa en muchas secciones, en lugar de un simple placeholder.
- Buen aprovechamiento para agentes: recomendaciones concretas de cobertura, como NVDA + Firefox y VoiceOver + Safari, dan a los agentes planes de prueba predeterminados mejores que los de un prompt genérico.
- No se proporcionan comandos de instalación, scripts, referencias ni archivos de soporte, por lo que la ejecución depende de la configuración de lectores de pantalla del usuario y de su conocimiento previo de la plataforma.
- Las señales del repositorio muestran metadatos explícitos limitados sobre flujos de trabajo y restricciones, lo que puede dejar implícitas algunas decisiones de casos límite y supuestos del entorno.
Visión general de la skill screen-reader-testing
Qué hace la skill screen-reader-testing
La skill screen-reader-testing es una guía práctica de pruebas para comprobar cómo se comporta una app web con lectores de pantalla reales, no solo con escáneres automatizados de accesibilidad. Está pensada para auditorías UX, QA de accesibilidad, validación de ARIA, pruebas de formularios y depuración de casos en los que una página se ve correcta visualmente pero falla para las personas que usan tecnologías de apoyo.
Quién debería instalarla
Esta skill screen-reader-testing encaja especialmente bien para:
- auditores UX que necesitan un flujo de trabajo manual de accesibilidad que sea repetible
- ingenieros frontend que están depurando problemas de teclado y anuncios del lector
- diseñadores que quieren validar patrones de interacción antes del lanzamiento
- equipos de QA que añaden comprobaciones con tecnologías de apoyo a las pruebas de aceptación
- equipos que se preparan para revisiones centradas en WCAG donde las comprobaciones automáticas no bastan
La necesidad real que resuelve
La mayoría de usuarios no necesita una charla genérica sobre accesibilidad. Necesita una forma de responder preguntas como:
- ¿Qué combinaciones de lector de pantalla y navegador importan primero?
- ¿Cómo pruebo de forma realista formularios, diálogos, menús y actualizaciones dinámicas?
- ¿Qué debería escuchar mientras navego?
- ¿Cómo convierto una petición vaga de “revisar accesibilidad” en una auditoría UX enfocada?
La skill screen-reader-testing ayuda a estructurar ese trabajo de prueba manual.
Por qué esta skill resulta más útil que un prompt genérico
Un prompt genérico puede enumerar buenas prácticas de accesibilidad. Esta skill resulta más útil cuando necesitas una guía de screen-reader-testing orientada a la ejecución con:
- prioridades concretas de cobertura por plataforma
- diferenciación entre lectores de pantalla principales como VoiceOver, NVDA, JAWS, TalkBack y Narrator
- foco de prueba en modo lectura frente a modo interacción
- casos prácticos como formularios, comportamiento ARIA, anuncios dinámicos y navegación
Qué importa antes de adoptarla
El valor principal está en el apoyo a la toma de decisiones y en la estructura del flujo de trabajo, no en la automatización. Esta skill no sustituye la ejecución del lector de pantalla real en la plataforma objetivo. Instálala si quieres planificar mejor las pruebas, redactar mejores prompts para un agente y reducir puntos ciegos durante una revisión de compatibilidad con lectores de pantalla.
Cómo usar la skill screen-reader-testing
Contexto de instalación de screen-reader-testing
Instala la skill desde el repositorio wshobson/agents en tu entorno con skills habilitadas:
npx skills add https://github.com/wshobson/agents --skill screen-reader-testing
Si tu entorno de agentes usa otro cargador de skills, adapta el paso de instalación a esa herramienta. Lo importante es extraer la skill screen-reader-testing desde la ruta plugins/accessibility-compliance/skills/screen-reader-testing del repositorio.
Lee primero este archivo
Empieza por:
SKILL.md
Este fragmento del repositorio solo expone SKILL.md, así que la decisión de adopción depende sobre todo de si su marco de pruebas encaja con tu flujo de trabajo. Aquí no recibes scripts auxiliares ni archivos de referencia, así que cuenta con aportar tú mismo el contexto de tu app, los flujos objetivo y las restricciones de plataforma.
Qué información necesita la skill para funcionar bien
La skill screen-reader-testing rinde mucho mejor cuando proporcionas:
- el tipo de producto: sitio de marketing, app SaaS, dashboard, checkout, flujo cargado de formularios
- el flujo de usuario objetivo: iniciar sesión, buscar, comprar, crear registro, enviar formulario
- las plataformas objetivo: Windows, macOS, iOS, Android
- las restricciones de navegador: Safari, Firefox, Chrome, Edge
- los tipos de componentes implicados: modal, tabs, menu button, combobox, live region, data table
- problemas conocidos o sospechas: etiquetas ausentes, orden de tabulación roto, anuncios duplicados, actualizaciones silenciosas
Entrada débil:
- “Test my site for screen readers.”
Entrada sólida:
- “Use the screen-reader-testing skill to review our signup flow for NVDA + Firefox and VoiceOver + Safari. Focus on field labels, error announcements, password requirements, focus movement after validation, and whether success feedback is announced.”
Elige cobertura por plataforma en lugar de probarlo todo
La skill ofrece un modelo de prioridades útil. En la práctica, empieza por:
NVDA + Firefoxen WindowsVoiceOver + Safarien macOSVoiceOver + Safarien iOS
Amplía a JAWS + Chrome, TalkBack + Chrome y Narrator + Edge solo cuando el riesgo del producto, la base de usuarios o el requisito de cumplimiento justifiquen una cobertura más amplia. Esto ahorra tiempo y mantiene la auditoría UX en un terreno realista.
Convierte un objetivo difuso en un mejor prompt
Un buen prompt de screen-reader-testing usage debería indicar:
- el flujo
- la pareja de tecnología de apoyo
- los tipos de interacción
- el formato de salida esperado
Ejemplo:
“Use the screen-reader-testing skill for a UX audit of our checkout flow. Prioritize NVDA + Firefox and VoiceOver + Safari. Test browse reading, form entry, validation errors, shipping method radio groups, promo code updates, and payment confirmation announcements. Return findings by severity, reproduction steps, expected screen reader behavior, and likely markup causes.”
Ese prompt es mejor porque define alcance, cobertura y estructura de reporte.
Usa la skill para los tipos de problemas adecuados
Esta guía screen-reader-testing encaja especialmente bien para:
- validación de implementación ARIA
- comportamiento de etiquetas y errores de formularios
- comprobaciones de anuncios de contenido dinámico
- revisiones de gestión del foco
- usabilidad de navegación y landmarks
- comprobar si widgets personalizados se comportan como controles nativos
Resulta menos útil como herramienta independiente para contraste de color, revisión de diseño visual o mapeo completo de cumplimiento legal, salvo que la combines con otras comprobaciones de accesibilidad.
Flujo práctico de screen-reader-testing para una auditoría UX
Un flujo sólido se parece a esto:
- Identifica los recorridos de usuario principales.
- Elige la cobertura mínima de lectores de pantalla.
- Prueba primero el orden de lectura y la estructura de la página.
- Después prueba los controles interactivos.
- Activa todos los estados de validación y actualización dinámica.
- Registra qué se anuncia, qué se omite, qué se duplica o qué resulta confuso.
- Convierte las observaciones en notas de remediación orientadas al código.
Este orden importa porque muchos equipos se lanzan a los detalles de los componentes antes de revisar headings, landmarks, títulos de página y flujo de lectura.
Qué conviene escuchar durante las pruebas
La skill es más eficaz cuando registras de forma activa:
- si los headings crean un esquema con sentido
- si los landmarks ayudan a orientarse
- si los enlaces y botones tienen nombres diferenciados
- si los campos de formulario exponen etiquetas, instrucciones y errores
- si se anuncian los cambios de estado
- si el foco cae donde el usuario espera tras abrir diálogos, enviar formularios o cambiar de vista
Estas observaciones producen hallazgos más accionables que una simple lista de aprobado/suspenso.
Comprende los modos del lector de pantalla antes de probar widgets
El material de origen diferencia entre modo lectura y modo interacción. Esto importa porque muchos widgets parecen “correctos” al leerlos, pero fallan durante el uso real. Pide al agente que pruebe ambos:
- descubrimiento de contenido en browse o virtual mode
- interacción directa en focus o forms mode
Esto es especialmente importante para menús, comboboxes, modal dialogs, date pickers y custom dropdowns.
La mejor forma de usar la salida con el equipo de ingeniería
Pide los hallazgos en un formato sobre el que ingeniería pueda actuar:
- resumen del problema
- lector de pantalla y navegador afectados
- ruta exacta de reproducción
- anuncio o comportamiento observado
- comportamiento esperado
- causa técnica probable, como nombre ausente, role incorrecto, gestión de foco rota o live region ausente
Así conviertes la screen-reader-testing skill de una guía general en una ayuda real para depuración.
Preguntas frecuentes sobre la skill screen-reader-testing
¿screen-reader-testing basta para hacer pruebas de accesibilidad?
No. La skill screen-reader-testing cubre una capa importante de pruebas manuales, pero debe ir junto con pruebas de teclado, revisión de HTML semántico, comprobaciones automatizadas y revisión de accesibilidad a nivel de diseño. Úsala cuando te importe específicamente la experiencia con tecnologías de apoyo.
¿Es una skill apta para principiantes?
Sí, con límites. Ofrece prioridades y conceptos de prueba útiles, pero da por hecho que puedes acceder a pruebas reales o simularlas en las plataformas pertinentes. Las personas principiantes pueden usarla para estructurar una revisión, pero quizá necesiten además orientación específica para manejar NVDA, VoiceOver o JAWS con soltura.
¿Cuándo encaja mal screen-reader-testing?
Evita esta skill si lo que necesitas principalmente es:
- linting automatizado
- escaneo de código
- accesibilidad de productos no web
- revisión UX solo visual
- una matriz completa de conformidad WCAG
En esos casos, screen-reader-testing puede apoyar el proceso, pero no debería ser tu único método.
¿En qué se diferencia de un prompt de accesibilidad corriente?
Los prompts corrientes suelen generar recomendaciones amplias. La decisión de instalación de screen-reader-testing install tiene sentido cuando quieres un marco de pruebas reutilizable centrado en el comportamiento real del lector de pantalla, la prioridad de cobertura y un flujo de auditoría práctico. Reduce la incertidumbre sobre qué probar primero y qué combinaciones importan más.
¿Puedo usar screen-reader-testing para una revisión de diseño?
Sí, pero solo de forma indirecta. Funciona mejor cuando se aplica a interfaces implementadas o prototipos realistas donde se puedan evaluar el orden de navegación, las etiquetas, los anuncios y los cambios de estado. En revisiones tempranas de diseño, úsala para someter a presión los patrones de interacción antes del desarrollo.
Cómo mejorar la skill screen-reader-testing
Dale a la skill un alcance más acotado para obtener mejores resultados
La forma más rápida de mejorar la calidad de salida de screen-reader-testing es reducir la ambigüedad. Pídele que revise un flujo, un conjunto de plataformas y una clase de problemas cada vez. “Audit our app” es demasiado amplio. “Test our account recovery flow for VoiceOver + Safari focusing on heading structure, field instructions, error messaging, and confirmation announcements” es mucho más sólido.
Proporciona el comportamiento esperado, no solo la UI actual
Si le dices al agente qué deberían poder hacer los usuarios, los hallazgos serán más precisos. Incluye expectativas como:
- el foco debe entrar en la modal al abrirse
- el resumen de errores debe anunciarse tras enviar
- la finalización de la carga debe exponerse sin obligar a volver a navegar
Esto ayuda a la guía screen-reader-testing a distinguir entre fallos de implementación y variaciones inocuas.
Incluye el inventario de componentes y los detalles de widgets personalizados
Los controles UI personalizados son donde suelen concentrarse los problemas con lectores de pantalla. Si tu página usa:
- menús select personalizados
- sistemas de tabs
- secciones expandibles
- alternativas a drag-and-drop
- dashboards con actualización en vivo
menciónalos de forma explícita. Así la skill puede centrarse en patrones de mayor riesgo en lugar de gastar tiempo en contenido estático de bajo riesgo.
Pide modos de fallo y estados límite
No limites las pruebas al happy path. Para mejorar la utilidad de screen-reader-testing usage, solicita comprobaciones de:
- resultados vacíos
- entradas no válidas
- avisos de expiración de sesión
- controles deshabilitados
- actualizaciones asíncronas
- cambios de ruta en single-page apps
Estos estados suelen revelar fallos silenciosos que las demos estándar no muestran.
Itera después de la primera salida
Tras la primera pasada, haz preguntas de seguimiento como:
- “Which findings are most likely caused by incorrect accessible names?”
- “Which issues are specific to VoiceOver versus cross-screen-reader?”
- “What should we retest after fixing focus management?”
- “Which findings block task completion versus just causing confusion?”
Esto convierte una auditoría estática en un flujo de remediación priorizado.
Combina screen-reader-testing con captura de evidencias
Para los equipos, la mejor mejora es documentar:
- la URL exacta de la página o la build
- la versión del lector de pantalla y del navegador
- la ruta de navegación
- las pulsaciones o gestos utilizados
- el texto del anuncio observado
Aunque la skill en sí sea solo de texto, pedir esta estructura hace que la salida sea mucho más fácil de verificar y transferir.
Ten clara la limitación principal antes de depender de ella
La mayor restricción es que la skill screen-reader-testing aporta mucha guía, pero muy poco soporte desde el repositorio. En esta carpeta de skill no hay scripts incluidos, referencias ni helpers de automatización. Su valor depende de lo bien que aportes contexto y de la disciplina con la que ejecutes el plan de prueba manual.
Mejora tu prompt: de genérico a listo para auditoría
Un prompt final de alta calidad suele incluir:
- producto y flujo
- parejas objetivo de lector de pantalla/navegador
- componentes prioritarios
- estados a probar
- formato de salida
- modelo de severidad
Ejemplo:
“Use the screen-reader-testing skill to perform a UX audit of our billing settings flow. Prioritize NVDA + Firefox and VoiceOver + Safari. Test heading navigation, landmark clarity, form labels, inline validation, success and error announcements, dialog focus trapping, and dynamic plan-price updates. Return a table with issue, severity, affected AT/browser, reproduction steps, observed behavior, expected behavior, and likely code-level cause.”
Ese es el nivel de especificidad que hace que la skill sea materialmente más útil que una petición genérica de accesibilidad.
