screen-reader-testing

作者 wshobson

screen-reader-testing 是一项适用于 UX 审核和无障碍 QA 的实用技能。你可以用它结合 VoiceOver、NVDA 和 JAWS 测试 Web 应用，确定浏览器与平台覆盖优先级，并系统检查表单、ARIA 行为、焦点管理以及动态播报等关键无障碍细节。

Stars32.5k

收录时间2026年3月30日

分类UX 审计

安装命令

npx skills add wshobson/agents --skill screen-reader-testing

编辑评分

该技能评分为 76/100，说明它是一个质量扎实、适合收录的目录条目：它清晰界定了应在何时开展屏幕阅读器测试，内容也足够完整；相比只给一个泛泛的无障碍提示词，代理在使用这项技能时通常能得到更好的执行效果。其主要限制在于它仅提供文档说明，不包含可直接运行的工具链，因此采用者需要自行准备测试工具配置和执行环境。

76/100

亮点

触发场景明确：简介和 “When to Use” 部分清楚界定了屏幕阅读器兼容性、ARIA 验证、表单无障碍、动态播报和导航测试等适用场景。
操作内容扎实：技能覆盖主流屏幕阅读器、测试优先级、不同模式，并通过多个结构化章节提供了较完整的实践指导，而不是薄弱的占位内容。
对代理有实际增益：像 NVDA + Firefox、VoiceOver + Safari 这样的具体覆盖建议，比通用提示词更能帮助代理快速制定默认测试方案。

注意点

未提供安装命令、脚本、参考资源或支持文件，因此实际执行依赖用户自行完成屏幕阅读器配置，并具备相应的平台使用经验。
仓库层面的流程与约束元数据展示得不够充分，一些边界场景下的判断方式和环境假设可能仍是隐含的。

Accessibility A11y Wcag Screen Reader Testing 测试前端 UI/UX

概览

screen-reader-testing 是一份偏实战的测试指南，用来检查 Web 应用在真实屏幕阅读器中的实际表现，而不只是依赖自动化无障碍扫描工具。它适用于 UX 审核、无障碍 QA、ARIA 验证、表单测试，以及那些“视觉上看起来没问题、但辅助技术用户用起来会出错”的排查场景。

谁适合安装

这个 screen-reader-testing 技能尤其适合：

需要可重复人工无障碍测试流程的 UX 审核人员
正在排查键盘操作和播报问题的前端工程师
希望在发布前验证交互模式的设计师
想把辅助技术检查纳入验收测试的 QA 团队
正在准备 WCAG 相关评审、且明白自动化检查不够用的团队

它真正解决的工作问题

大多数用户并不需要一份泛泛而谈的无障碍科普。他们真正需要的是一套方法，来回答这些问题：

应该优先测试哪些屏幕阅读器和浏览器组合？
如何更贴近真实使用情境地测试表单、对话框、菜单和动态更新？
在导航过程中，应该重点听哪些内容？
怎么把一句模糊的“检查一下无障碍”变成有范围、有重点的 UX 审核？

screen-reader-testing 技能的价值就在于把这类人工测试工作组织起来。

为什么它比通用提示词更有用

通用提示词往往只能列出一些无障碍最佳实践。而这个技能更适合需要“可执行”的 screen-reader-testing 指南的场景，因为它提供了：

明确的平台覆盖优先级
对 VoiceOver、NVDA、JAWS、TalkBack、Narrator 等主流屏幕阅读器的区分
将测试重点拆分为阅读模式与交互模式
面向真实问题的测试场景，例如表单、ARIA 行为、动态播报和导航

采用前最需要看清的一点

它的核心价值在于辅助决策和梳理测试流程，而不是自动化本身。这个技能不能替代你在目标平台上实际运行屏幕阅读器。若你希望获得更清晰的测试规划、更高质量的 agent 提示词，以及在屏幕阅读器兼容性评审中减少盲区，那么它值得安装。

从 wshobson/agents 仓库将该技能安装到支持 skills 的环境中：

npx skills add https://github.com/wshobson/agents --skill screen-reader-testing

如果你的 agent 环境使用的是别的 skill loader，就按对应工具调整安装步骤。关键点是从仓库中的 plugins/accessibility-compliance/skills/screen-reader-testing 路径拉取 screen-reader-testing 技能。

先看这个文件

先从这里开始：

SKILL.md

这个仓库切片目前只暴露了 SKILL.md，因此是否采用，主要取决于其中的测试框架是否符合你的工作流。这里没有附带 helper scripts 或参考文件，所以你需要自行提供应用上下文、目标流程和平台限制。

想让技能发挥效果，需要提供哪些输入

如果你提供以下信息，screen-reader-testing 技能的表现会明显更好：

产品类型：marketing site、SaaS app、dashboard、checkout、form-heavy workflow
目标用户流程：sign in、search、checkout、create record、submit form
目标平台：Windows、macOS、iOS、Android
浏览器限制：Safari、Firefox、Chrome、Edge
涉及的组件类型：modal、tabs、menu button、combobox、live region、data table
已知问题或怀疑点：missing labels、broken tab order、duplicate announcements、silent updates

较弱的输入：

“Test my site for screen readers.”

更强的输入：

“Use the screen-reader-testing skill to review our signup flow for NVDA + Firefox and VoiceOver + Safari. Focus on field labels, error announcements, password requirements, focus movement after validation, and whether success feedback is announced.”

优先选择平台覆盖，而不是一开始全测

这个技能给出了一套很实用的优先级模型。实际操作里，建议先从下面几组开始：

NVDA + Firefox on Windows
VoiceOver + Safari on macOS
VoiceOver + Safari on iOS

只有当产品风险、用户群体或合规要求确实需要更广覆盖时，再扩展到 JAWS + Chrome、TalkBack + Chrome 和 Narrator + Edge。这样更省时间，也能让 UX 审核保持现实可执行。

把模糊目标改写成更好的提示词

一个好的 screen-reader-testing usage 提示词，应该明确写出：

流程
辅助技术组合
交互类型
期望的输出格式

例如：

“Use the screen-reader-testing skill for a UX audit of our checkout flow. Prioritize NVDA + Firefox and VoiceOver + Safari. Test browse reading, form entry, validation errors, shipping method radio groups, promo code updates, and payment confirmation announcements. Return findings by severity, reproduction steps, expected screen reader behavior, and likely markup causes.”

这个提示词更好，是因为它把范围、覆盖面和报告结构都说清楚了。

把技能用在对的问题上

这个 screen-reader-testing 指南尤其适合以下场景：

ARIA 实现验证
表单标签与错误提示行为检查
动态内容播报检查
焦点管理评审
导航与 landmark 可用性检查
验证自定义组件是否像原生控件一样可用

但如果你把它当作独立工具来处理 color contrast、视觉布局评审，或完整的法律/规范合规映射，它就没那么合适了，除非你同时结合其他无障碍检查方法。

一套更稳妥的工作流通常是：

先识别最重要的用户旅程。
选定最小必要的屏幕阅读器覆盖范围。
先测阅读顺序和页面结构。
再测交互控件。
触发所有校验和动态更新状态。
记录哪些内容被播报、被跳过、重复出现或让人困惑。
把观察结果转成面向代码整改的说明。

这个顺序很重要，因为很多团队会一上来就钻进组件细节，却没有先检查 heading、landmark、page title 和整体阅读流。

测试时应该重点听什么

如果你在测试中主动捕捉这些内容，这个技能会更有效：

headings 是否形成有意义的大纲
landmarks 是否帮助用户建立方位感
links 和 buttons 是否有清晰且彼此可区分的名称
表单字段是否暴露了 labels、instructions 和 errors
状态变化是否被播报出来
打开对话框、提交表单或切换视图后，焦点是否落在用户预期的位置

和简单的通过/失败清单相比，这类观察更容易产出可执行的问题结论。

测试组件前，先理解屏幕阅读器模式

源材料特别区分了阅读模式和交互模式。这一点很关键，因为很多组件在“读内容”时看上去没问题，但一到真实操作就出错。让 agent 同时测试这两种情况：

在 browse 或 virtual mode 下发现内容
在 focus 或 forms mode 下直接交互

这对 menus、comboboxes、modal dialogs、date pickers 和自定义 dropdowns 尤其重要。

怎样把输出更好地交给工程师处理

建议要求输出采用工程团队可直接消费的格式：

问题摘要
受影响的屏幕阅读器和浏览器
精确复现路径
实际播报或实际行为
期望行为
可能的技术原因，例如 missing name、wrong role、broken focus management 或 absent live region

这样一来，screen-reader-testing skill 就不只是泛泛的指导，而会变成真正能辅助排障的工具。

不够。screen-reader-testing 技能覆盖的是一层很重要的人工测试，但它应该与 keyboard testing、semantic HTML review、automated checks 和设计层面的无障碍评审一起使用。当你特别关注辅助技术用户体验时，它很有价值。

这个技能对新手友好吗？

友好，但有边界。它能提供有用的测试优先级和核心概念，但前提是你能在相关平台上接触或模拟真实测试。新手可以用它来搭建评审框架，但如果想高效操作 NVDA、VoiceOver 或 JAWS，通常还需要额外的上手指导。

如果你的需求主要是下面这些，就不建议把它作为首选：

automated linting
code scanning
非 Web 产品的无障碍
纯视觉 UX 评审
完整的 WCAG conformance matrix

在这些场景里，screen-reader-testing 可以辅助流程，但不应该是唯一方法。

它和普通的 accessibility 提示词有什么区别？

普通提示词通常只会产出宽泛建议。只有当你需要一套可复用的测试框架，并且重点围绕真实屏幕阅读器行为、覆盖优先级和实际审核流程时，screen-reader-testing install 才真正值得考虑。它能减少“先测什么、哪些组合最重要”这类判断上的猜测。

可以，但更多是间接使用。它最适合已经实现的界面，或者足够真实的原型，因为这时才能评估导航顺序、标签、播报和状态变化。对于偏早期的设计评审，可以用它来提前检验交互模式是否站得住脚，再进入开发。

提升 screen-reader-testing 输出质量最快的方法，就是减少模糊性。一次只让它审一个流程、一组平台和一类问题。“Audit our app” 范围太大；而“Test our account recovery flow for VoiceOver + Safari focusing on heading structure, field instructions, error messaging, and confirmation announcements” 就强得多。

不只描述当前 UI，也要给出期望行为

如果你明确告诉 agent“用户本应能做到什么”，结论会更锐利。可以加入这类预期：

打开 modal 后，focus 应进入对话框内部
submit 之后，error summary 应被播报
loading 完成后，应能感知到完成状态，而不需要强制重新导航

这能帮助 screen-reader-testing 指南分辨哪些是实现缺陷，哪些只是无害的差异。

提供组件清单和自定义控件细节

自定义 UI 控件往往是屏幕阅读器问题最集中的地方。如果你的页面使用了：

custom select menus
tab systems
expandable sections
drag-and-drop alternatives
live-updating dashboards

请明确写出来。这样技能就能把重点放在高风险模式上，而不是把时间花在低风险的静态内容上。

主动要求覆盖失败路径和边界状态

不要只测 happy path。为了让 screen-reader-testing usage 更有价值，应该要求它检查：

empty results
invalid input
session timeout warnings
disabled controls
async updates
单页应用中的 route changes

这些状态经常会暴露出标准演示流程里看不到的“静默失败”。

拿到第一轮结果后继续追问

首轮输出之后，可以继续问这类问题：

“Which findings are most likely caused by incorrect accessible names?”
“Which issues are specific to VoiceOver versus cross-screen-reader?”
“What should we retest after fixing focus management?”
“Which findings block task completion versus just causing confusion?”

这样可以把一次性审计，变成有优先级的持续整改流程。

对团队协作来说，最有效的提升方式之一是把这些信息记录下来：

精确页面 URL 或构建版本
屏幕阅读器和浏览器版本
导航路径
使用的按键或手势
实际听到的播报文本

即便这个技能本身是纯文本的，只要你要求按这种结构输出，结果也会更容易核验和移交。

依赖它之前，先了解最大的限制

最大的约束是，screen-reader-testing 技能“重指导、轻仓库内容”。这个技能目录里没有附带 scripts、参考资料或自动化 helper。它的价值有多大，很大程度上取决于你提供上下文的质量，以及你执行人工测试计划时是否足够严谨。

把你的提示词从泛泛请求升级为可审计输入

一个高质量的最终提示词，通常会包含：

产品和流程
目标 screen reader/browser 组合
优先组件
要测试的状态
输出格式
严重级别模型

例如：

“Use the screen-reader-testing skill to perform a UX audit of our billing settings flow. Prioritize NVDA + Firefox and VoiceOver + Safari. Test heading navigation, landmark clarity, form labels, inline validation, success and error announcements, dialog focus trapping, and dynamic plan-price updates. Return a table with issue, severity, affected AT/browser, reproduction steps, observed behavior, expected behavior, and likely code-level cause.”

只有达到这种具体程度，这个技能才会比一个泛泛的 accessibility 请求明显更有实际价值。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

作者 garrytan

qa 技能会系统化测试 Web 应用，查找缺陷，并通过分阶段工作流验证修复效果。适用于回归测试、上线前检查，或当你需要证据、严重级别评分，以及原子化的修复-复测循环，而不是一个泛泛的找 Bug 提示词时，作为结构化 QA 指南来使用。

回归测试

收藏 0GitHub 91.8k

design-review

作者 garrytan

design-review 是一款面向 UX 的设计 QA 技能，用于审核线上界面，发现间距、层级、视觉一致性和交互问题，并通过带验证的迭代方式逐步修正。它支持在实现前进行 plan-mode 审查，适合你想要一份针对具体源代码改动的 design-review 指南，而不是泛泛而谈的建议时使用。

UX 审计

收藏 0GitHub 91.8k

critique

作者 pbakaus

critique 可帮助你从 UX 视角评审界面、功能、页面或组件，提供结构化评分、基于 persona 的测试、启发式检查以及可落地的改进建议。如果你需要一套可重复使用的 UI/UX Design 评审方法，而不是笼统模糊的点评，就适合使用 critique。它最适合在背景明确的前提下，针对某个具体区域进行聚焦式评审。

UI/UX 设计

收藏 0GitHub 20.4k

swiftui-wcag-accessibility-auditor

作者 ramzesenok

swiftui-wcag-accessibility-auditor 会审计 SwiftUI iOS 功能代码是否符合 WCAG 2.2 Level A/AA 和 WCAG2Mobile，并返回可直接打补丁的修复建议，附带证据、优先级，以及针对代码无法判定行为的用户验证检查。适用于认证、表单、设置、自定义控件以及合并前的 UX 审计工作。

UX 审计

收藏 0GitHub 0

pol-probe

作者 deanpeters

pol-probe 帮你定义一个 Proof of Life（PoL）探测，用低成本先验证高风险假设，再决定是否投入真正的产品建设。使用 pol-probe 技能，可以减少“原型表演”，设定严苛的成功标准，选对探测类型，并在获得结论后规划如何处置。该技能适合希望在动手做之前，先快速判断想法是否值得继续推进的人。

原型

收藏 0GitHub 4.1k

audit-website

作者 squirrelscan

audit-website 技能通过 squirrel CLI，基于 230+ 条规则对网站和 Web 应用进行审计，覆盖 SEO、技术、内容、性能、安全、链接和站点健康等维度，并输出可直接供 LLM 使用的可执行报告。

UX 审计

收藏 0GitHub 68

fixing-accessibility

作者 ibelick

fixing-accessibility 可在发布前帮助审计并修复 HTML 无障碍问题。适用于按钮、表单、对话框、标签页、仅图标控件、键盘流、焦点处理、表单错误、对比度和屏幕阅读器标注。fixing-accessibility skill 更适合有针对性的 UI 代码修复，不适合做大范围的合规报告。

UX 审计

收藏 0GitHub 0

accessibility-compliance

作者 wshobson

accessibility-compliance 技能可帮助团队依据实用的 WCAG 2.2、ARIA、键盘可访问性、屏幕阅读器和移动端无障碍指导，对 Web 或移动 UI 进行审计与改进。适合用于 UX 审计、组件修复以及可直接落地的整改建议。

UX 审计

收藏 0GitHub 32.6k

click-path-audit

作者 affaan-m

click-path-audit 技能可沿着 UI 处理函数追踪每一次状态变化，帮助在重构之后或代码评审过程中发现顺序型 bug、共享状态冲突以及最终状态不一致问题。

代码评审

收藏 0GitHub 156.1k

accessibility

作者 affaan-m

这个 accessibility skill 可帮助你基于 WCAG 2.2 AA 指南来设计、实现和审计可访问的 UI，适用于 Web、iOS 和 Android。它可用于梳理组件的角色、标签、状态、焦点行为和无障碍特性，并为 UX 审计和实现评审提供实用的无障碍用法参考。

UX 审计

收藏 0GitHub 156k

critique

作者 pbakaus

critique skill 可帮助团队对页面、功能和组件开展结构化的 UX 评审。它会评估信息层级、认知负荷、启发式原则以及基于 persona 的风险，并将发现的问题整理为可执行的改进建议。最适合在完成 /frontend-design 之后使用，同时提供清晰的截图、目标和用户背景信息。

UX 审计

收藏 0GitHub 14.9k

critique

作者 pbakaus

critique skill 通过结构化的 UX 审核流程来评审页面、流程和组件。它会检查 AI 拼凑感信号、视觉层级、信息架构、认知负荷、可用性启发式，以及基于 persona 的使用阻力，并将发现整理为可执行的反馈建议。最适合结合 frontend-design 和 teach-impeccable 上下文一起使用。

UX 审计

收藏 0GitHub 14.6k

customer-journey-map

作者 phuryn

customer-journey-map 技能可帮助你创建端到端的客户旅程地图，涵盖阶段、触点、情绪、痛点和机会点。它适用于 UX Research、入门引导优化和体验分析，尤其是在你需要把零散输入整理成一条结构清晰的旅程叙事时。

UX 研究

收藏 0GitHub 11k

proto-persona

作者 deanpeters

proto-persona 技能可帮助你在更深入验证前，把调研结果、市场信号和团队经验整理成一个可执行的客户画像。当你需要一个适合产品早期和 UX Research 决策的、以假设为基础的起点时，可以使用这份 proto-persona 指南。

UX 研究

收藏 0GitHub 4.1k

why

作者 NeoLabHQ

why 技能将 Five Whys 分析应用于把症状拆解为根因链路，并导出一个可执行的修复方案。当你需要的是严谨推理，而不是浅层猜测时，这份 why 指南适用于 UX Audit、产品问题、Bug 或流程中断等场景。

UX 审计

收藏 0GitHub 982

cause-and-effect

作者 NeoLabHQ

cause-and-effect 技能使用鱼骨图分析法，将问题可能的根因映射到人员、流程、技术、环境、方法和材料六个维度。它能帮助你把模糊问题梳理成结构化的原因树，优先判断最可能的驱动因素，并确定下一步行动。适用于 UX 审计、事故复盘、回顾总结和故障排查中的因果分析。

UX 审计

收藏 0GitHub 982

screen-reader-testing