O

screenshot

作者 openai

screenshot 技能可在你需要 OS 级图片而不是仅限浏览器的截图时,捕获整屏、应用窗口或像素区域。它适用于 Workflow Automation 中的截图使用场景,包含保存位置规则、macOS 权限处理,以及清晰的安装指引,帮助实现稳定可靠的桌面截图。

Stars0
收藏0
评论0
收录时间2026年5月8日
分类工作流自动化
安装命令
npx skills add openai/skills --skill screenshot
编辑评分

该技能得分 78/100,说明它是一个适合目录用户的稳妥候选,适合需要可靠截图指引的人。仓库清楚说明了适用时机,提供了 macOS 和跨平台截图的操作脚本,并包含能减少试错的预检步骤;不过,如果要更利于安装决策,还需要更明确的快速开始和显式安装命令。

78/100
亮点
  • 触发条件明确:当用户需要桌面/系统截图,或工具自身无法完成捕获时使用。
  • 操作深度足:包含 macOS、Windows 和基于 Python 的截图脚本,并提供 macOS 权限预检,减少反复弹窗。
  • 对 agent 友好:技能明确了保存位置规则和工具优先级,帮助 agent 更少歧义地选择合适的截图路径。
注意点
  • SKILL.md 中没有安装命令,采用者可能需要自行推断环境配置,而不是按一步式流程安装。
  • 内容在机制层面写得很扎实,但部分平台相关的执行细节仍交给脚本处理,边缘情况可能需要进一步查看脚本。
概览

screenshot 技能概览

screenshot 技能能做什么

screenshot 技能帮助 agent 在任务需要整块屏幕、特定窗口、某个应用区域或已保存文件路径时,捕获正确的桌面图像。它适合需要真实 OS 级截图的场景,而不是仅限浏览器的截图、设计工具截图,或泛泛的提示式回答。

什么时候适合安装

如果你的工作流包含桌面应用、多窗口审查、OS 界面调试,或者某些工具无法直接完成捕获,安装 screenshot 就很合适。它尤其适用于需要视觉证据、交付物留存,或像素级参考的 Workflow Automation 任务。

它的不同之处

这个 screenshot 技能是面向决策的,不只是一个命令包装器。它编码了截图优先级、保存位置规则,以及 macOS 权限处理方式,让 agent 能更快找到可行路径,减少反复追问。这样一来,当用户只说“截个图”或者目标描述不完整时,就能少很多猜测。

如何使用 screenshot 技能

安装并定位核心文件

使用 npx skills add openai/skills --skill screenshot 安装。然后先读 SKILL.md,再看 scripts/take_screenshot.pyscripts/ensure_macos_permissions.shagents/openai.yaml。如果你需要了解平台相关行为,在假设捕获路径之前,先检查 scripts/ 里的 Swift helper。

给技能一个完整的截图需求

一个高质量的 screenshot 使用请求通常要说明四件事:目标、区域、输出路径和约束。例如:“截取当前激活的 Photoshop 窗口并保存到 /tmp/review.png” 或“截取 display 2 的全屏截图并保存到默认截图文件夹”。如果省略路径,技能会使用系统默认位置;如果 Codex 需要这张图用于检查,应保存到临时目录。

按平台选择正确工作流

对于浏览器、Figma 或 Electron,优先使用它们原生或工具特定的截图路径。只有在你需要整块桌面、应用/窗口捕获才是实际需求,或者其他工具无法截到关键内容时,才使用这个技能。在 macOS 上,进行窗口/应用捕获前先运行权限预检,避免反复弹出 Screen Recording 提示。

实用的提示词模式

好的 screenshot 引导提示要具体到足以触发正确的 helper 和输出。例如:“使用 screenshot 技能在 macOS 上截取编辑器窗口左半边,然后保存到默认截图位置。”如果需要区域,请用 x,y,w,h 形式提供坐标,并说明该区域是相对于屏幕还是相对于某个窗口。

screenshot 技能 FAQ

screenshot 只适合全屏截图吗?

不是。screenshot 技能支持全屏、窗口、应用和区域截图。只有在整个桌面上下文都很重要时才用全屏;否则尽量缩小目标,以减少噪音并提高可用性。

什么情况下不该用这个技能?

如果有更深度集成的工具可以捕获你需要的精确界面,比如 Figma 或浏览器特定工作流,就不要用 screenshot。若你的目标是文本提取,或者只是做 UI 理解而不需要真实图片产物,也应避免使用它。

新手需要先懂 OS 细节吗?

不需要。新手可以直接用一句简单请求,比如“截这个窗口”。真正能提升结果的,是补充目标、保存路径和任何裁剪细节。在 macOS 上,权限仍可能是主要阻碍,所以要预留一个初始化步骤。

它和普通提示有什么区别?

普通提示可能只是在描述想要的图片,而 screenshot 技能还会处理截图选择、保存位置规则,以及 macOS 权限摩擦。这让它在 Workflow Automation 中更可靠,因为 agent 会被引导生成一个具体文件输出,而不是停留在抽象回答上。

如何改进 screenshot 技能

把目标说得尽可能清楚

最大的质量提升来自精确说明画面里应该出现什么。“截取编辑器”远不如“截取显示 app.py 的 VS Code 窗口,并且终端可见”清晰。明确目标能减少失败截图,尤其是在同时打开多个相似窗口时。

补充会改变结果的约束

如果截图必须排除隐私内容、只包含一块显示器,或显示特定分辨率,请一开始就说明。做区域截图时,提供坐标,并解释裁剪是否应包含 chrome、标题栏,还是只保留内容本身。这些细节比多写几句说明更重要。

用第一次输出来校准下一次

如果截图过大、过小,或者缺少相关 UI 状态,就根据问题收紧目标并指出哪里不对。例如:“重新截,只保留弹窗可见”或“把裁剪下移一点,把状态栏也包含进来。”这种反馈回路是提升 screenshot 使用效果最快的方法。

留意常见失败模式

常见问题包括 macOS 的权限弹窗、截到错误的显示器,以及在本可以用更合适工具获得更干净结果时仍执意截图。如果第一次捕获失败,就通过补充应用名、窗口标题、屏幕编号或精确区域来改进请求。

评分与评论

暂无评分
分享你的评价
登录后即可为这个技能评分并发表评论。
G
0/10000
最新评论
保存中...