read

作者 tw93

read 技能会把 URL 和 PDF 抓取为干净的 Markdown，方便阅读、引用、注释和后续处理。它专为读取付费墙页面、JS 密集型网站、X/Twitter、GitHub 文件、中国平台，以及需要在分析前稳定获取源文本的 Workflow Automation 流程而设计。需要的是源内容采集而不是评论时，就用 read 指南。

Stars5.1k

收录时间2026年5月25日

分类工作流自动化

安装命令

npx skills add tw93/Waza --skill read

编辑评分

该技能得分 84/100，属于目录用户的稳妥候选项。它提供了一套可信、适合 agent 的流程，可将 URL 和 PDF 抓取为干净的 Markdown，并带有足够的路由与兜底细节，让 agent 相比通用提示更少靠猜测即可触发。

84/100

亮点

触发性强：明确的 when_to_use/dispatch_intent 覆盖 URL、PDF，以及英文和中文中常见的用户意图。
工作流清晰：路由规则区分 Feishu、Weixin、GitHub、X/Twitter、PDF，以及回退代理链路。
执行价值高：包含的脚本和方法引用展示了具体的抓取路径、隐私级别和保存路径行为。

注意点

SKILL.md 中没有安装命令，因此部署和采用要依赖用户从脚本和引用中自行梳理运行时依赖。
部分分支依赖外部代理或平台特定 API，因此在 JS 密集、付费墙或需要凭证的来源上，成功率可能会有波动。

网页 PDF 微信 X Twitter Markdown

概览

read 概览

read 是做什么的

read skill 会抓取一个 URL 或 PDF，并返回干净的 Markdown，方便你查看、引用、转述或复用网页内容，而不必手动从浏览器里复制。它就是为 read 流程设计的：拿到链接，转成可读文本，除非你后面明确要求，否则默认不做分析。

这个 skill 最适合什么场景

当你的真实任务是“把这页读出来”或“提取这个文档”时，最适合用 read skill，尤其适用于付费墙页面、JS 重度站点、PDF、X/Twitter 链接，以及微信、飞书等常见中文平台。若你在 Workflow Automation 里需要先稳定摄取内容，再进行摘要、翻译、对比或保存，它也是很合适的选择。

它和其他方式有什么不同

read 的核心区别在于路由：它会根据来源选择抓取方式，而不是把所有场景都塞进一个通用提示词里。这一点很重要，因为 GitHub、PDF URL、微信公众号文章和本地文件往往需要不同处理。它还强调隐私分级和默认不分析，因此更适合后续自动化流程，也更可预测。

如何使用 read skill

安装 read skill

使用 npx skills add tw93/Waza --skill read 安装。安装后，先阅读 SKILL.md，再查看 references/read-methods.md 和 references/save-paths.md，了解实际的抓取与保存规则。如果你需要平台级的具体行为，请检查 scripts/fetch.sh、scripts/fetch_weixin.py、scripts/fetch_feishu.py 和 scripts/fetch_local.py。

给 skill 正确的输入

read skill 最适合单一、明确的目标：一个 URL、一个 PDF 链接，或者一个本地 PDF 路径。如果你想要高质量输出，必须同时说明来源和你要的结果，而不是只说“读一下这个”。更好的提示词例如：“读这篇微信公众号文章，只返回 Markdown”或“抓取这个 PDF，并保留标题层级，方便引用”。

把路由逻辑用对

如果目标是 GitHub 内容，当你想要干净的源代码提取时，优先使用 raw 文件 URL 或 gh。对于 mp.weixin.qq.com，通常会先走代理级联，再以微信公众号脚本作为兜底。对于 x.com 或 twitter.com，应使用代理路径；对于本地 PDF，走提取路径更合适。这套路由逻辑，正是 read usage 相比通用浏览器提示词的核心优势。

先读，再决定要不要保存

默认情况下，read 会把内容直接展示出来，而不是保存成文件。只有在你明确需要 Markdown 成品时，才要求保存，并使用基于标题的路径，例如 ~/Downloads/{title}.md。如果你要把 read 串进研究流程或自动化流程里，最好先确认下一步需要的是仅展示结果，还是已经保存好的文件。

read skill 常见问题

read 只是一个通用抓取提示词吗？

不是。通用提示词也许能让它返回页面文本，但 read 包含基于来源的路由、考虑隐私的抓取层级，以及平台专用脚本。这能降低标准浏览器提取在某些页面上容易失败的问题。

什么时候不该用 read？

如果文本已经在仓库里，本来就不需要联网抓取，那就不要用 read。如果你想要的是评论、解读，或者在源文本尚未抓到之前就先做摘要，它也不是合适的选择。

read 对新手友好吗？

如果你手上有 URL，且目标明确，那它是友好的。新手最常见的错误，是只说“看看这个链接”，却没有说明想要 Markdown 输出、保存文件，还是后续分析。read 的用法并不复杂，但输入必须具体。

read 适合 Workflow Automation 吗？

适合，尤其是在下一步依赖干净源文本的时候。它很适合用于自动化流水线：先收集文章、PDF 或平台帖子，再做打标、摘要、翻译或归档。如果你的工作流需要确定性地抓取源内容，read 是很实用的前端 skill。

如何改进 read skill

提供更好的来源上下文

最有价值的输入改进是把来源说清楚：给出准确 URL，注明它是 PDF 还是网页，并说明是否可能遇到登录墙、中文平台或 GitHub 文件等复杂情况。你对来源描述得越清楚，skill 选错路径的概率就越低。

先把输出约束说清楚

如果你只要 Markdown，请直接说明。如果你想保存内容，也要在抓取前说清楚。如果你需要便于引用的格式，就要求尽量保留标题和链接。这些约束比额外解释更重要，因为 read 的设计目标是输出源文本，而不是解释文本。

注意常见失败模式

最常见的失败模式包括：走错路由、指望本地抓取去处理 JS 重度页面，或者在源内容尚未抓到时就要求 read 做摘要。另一个常见问题是，页面被拦截或为空时，没有切换到代理路径。遇到这些情况时，通常该改的是来源选择，而不是把提示词写得更长。

先抓取，再做后续迭代

一个好的 read 流程是先抓取，再用第二个提示词做分析、抽取或对比。如果第一次输出太乱，就优化来源或明确平台；如果结构缺失，就要求换一种抓取方法或指定保存路径。对于 read usage 来说，小幅调整提示词，往往比反复改写同一句请求更有效。

评分与评论

暂无评分

分享你的评价

登录后即可为这个技能评分并发表评论。

0/10000

同分类下的更多技能

playwright-interactive

作者 openai

playwright-interactive 是一项浏览器自动化技能，适用于本地 Web 和 Electron 应用中的持久 Playwright 会话。它可用于检查 UI 状态、重试交互，以及在不重启工具链的情况下执行功能或视觉 QA。非常适合需要一份实用的 playwright-interactive 迭代调试指南的场景。

浏览器自动化

收藏 0GitHub 0

huggingface-datasets

作者 huggingface

在 Hugging Face Dataset Viewer API 工作流中使用 huggingface-datasets 技能，用于校验数据集、解析 splits、预览和分页行、搜索文本、应用过滤器，以及获取 parquet 链接或统计信息。它是一份面向只读数据集探索的实用 huggingface-datasets 指南。

网页抓取

收藏 0GitHub 10.4k

iterative-retrieval

作者 affaan-m

iterative-retrieval 是一种工作流模式，用于在 agentic 工作中逐步优化上下文检索。它能帮助 subagents 避免获取过多或过少的上下文，因此适用于 iterative-retrieval 的使用场景、安装决策，以及 Workflow Automation 中的 iterative-retrieval。

工作流自动化

收藏 0GitHub 156.2k

data-scraper-agent

作者 affaan-m

data-scraper-agent 可帮助你搭建可重复使用的公开数据管道，用于网页抓取、数据丰富和存储。它面向按计划持续监控任务、价格、新闻、仓库、体育和列表信息，可结合 GitHub Actions 定时运行，并将结果输出到 Notion、Sheets 或 Supabase。更适合长期跟踪，不适合一次性提取。

网页抓取

收藏 0GitHub 156.1k

notion-meeting-intelligence

作者 openai

notion-meeting-intelligence 可将 Notion 上下文转化为可直接用于会议的议程和会前材料，并结合 Codex 研究，为决策、状态更新、规划、复盘和 1:1 准备提供支持。它尤其适合 notion-meeting-intelligence for Meeting Prep 工作流：当你需要有依据的材料、清晰的时间分配，以及面向不同参会者的输出时，这个技能会很有帮助。

会议准备

收藏 0GitHub 18.6k

multi-agent-patterns

作者 muratcankoylan

multi-agent-patterns 技能可帮助你设计和实现带有 Agent Orchestration、上下文隔离、并行工作和结构化交接的智能体系统。当你需要在单智能体与多智能体方案之间做选择，或者需要 supervisor 路由、peer 交接、共识机制或故障处理时，就适合使用它。它最适合编排密集型任务，因为这类任务更看重清晰的协同，而不是单纯增加智能体数量。

Agent 编排

收藏 0GitHub 15.6k

building-incident-response-playbook

作者 mukul975

building-incident-response-playbook 可帮助安全团队创建可复用的事件响应 playbook，涵盖分阶段步骤、决策树、升级标准、RACI 责任分配以及可直接用于 SOAR 的结构。它适用于事件响应流程文档、事件分诊工作流和便于审计的运营响应方案。

事件分诊

收藏 0GitHub 6.1k

building-patch-tuesday-response-process

作者 mukul975

building-patch-tuesday-response-process 帮助团队建立可重复的 Microsoft Patch Tuesday 流程，用于梳理公告优先级、评估风险、测试补丁、批准发布并跟踪合规性。适用于安全运营、漏洞管理，以及用于项目管理的 building-patch-tuesday-response-process。

项目管理

收藏 0GitHub 6.1k

secure-workflow-guide

作者 trailofbits

secure-workflow-guide 提供一套 5 步 Solidity 安全工作流：Slither 初筛、按功能的专项检查、可视化审查、安全属性记录，以及人工复核。它面向智能合约团队、审计人员和开发者，适合在部署或发布前使用一套可重复的 secure-workflow-guide 流程。

安全审计

收藏 0GitHub 4.9k

twitter-cli

作者 public-clis

twitter-cli 是一款以终端为核心的 Twitter/X skill，可用于查看时间线、书签、搜索结果、个人资料和推文详情；在完成认证后，还支持发帖及其他写入操作。适合用于社交媒体调研、账号监控，以及通过命令行进行轻量发布。

社交媒体

收藏 0GitHub 2.3k

azure-ai-contentunderstanding-py

作者 microsoft

azure-ai-contentunderstanding-py 是 Azure AI Content Understanding 的 Python 技能。它可从文档、图像、音频和视频中提取结构化内容，适用于 RAG 工作流和自动化场景。若你需要可靠的多模态提取、Azure 身份验证以及可重复、可直接接入流水线的输出，就适合使用它。

RAG 工作流

收藏 0GitHub 2.2k

wp-performance

作者 WordPress

使用 wp-performance 从后端排查并提升 WordPress 性能，无需浏览器界面。它支持先测量、后诊断的方式，适用于前台请求缓慢、后台页面、REST 路由和 WP-Cron 等场景，并提供关于 WP-CLI profile/doctor、通过 REST 头查看 Query Monitor、Server-Timing、数据库查询、autoloaded options、对象缓存、cron 和远程 HTTP 调用的指导。

性能优化

收藏 0GitHub 1.4k

wp-wpcli-and-ops

作者 WordPress

wp-wpcli-and-ops 技能用于 WP-CLI 下的 WordPress 运维：安全的 search-replace、db export/import、插件和主题操作、cron、缓存清理、多站点定向，以及可复用的后端开发自动化。

后端开发

收藏 0GitHub 1.4k

agents-sdk

作者 cloudflare

agents-sdk 可帮助你构建带有有状态对话、持久化执行、WebSocket 或流式聊天、MCP 集成、定时任务和浏览器自动化的 Cloudflare Workers 代理。这个 agents-sdk 技能重点面向安装决策、配置和实际使用，适用于现有或新建的 Workers 应用；只有在多代理系统确实符合 Cloudflare 运行时限制时，才会提供相应指导。

多 Agent 系统

收藏 0GitHub 1.3k

reddit-ads

作者 alinaqi

用于 Reddit Ads API 工作流的 reddit-ads 技能：广告系列创建、定向、转化跟踪和广告优化。安装 reddit-ads 指南，可更少凭经验猜测地管理账户层级、预算、受众以及基于 API 的优化。

广告优化

收藏 0GitHub 611

existing-repo

作者 alinaqi

existing-repo 帮助 agents 分析现有代码库，识别技术栈和约定，并在不破坏本地模式的前提下加入防护措施。对于 Git Workflows、首次接手仓库、维护工作以及需要先理解再修改的配置变更，这个 existing-repo skill 都很适合。

Git 工作流

收藏 0GitHub 607