作者 vercel-labs
通过 agent-browser 和 Chrome DevTools Protocol(CDP)自动化现有的 Electron 桌面应用,例如 VS Code、Slack、Discord、Figma、Notion 和 Spotify。该技能帮助你连接到正在运行的 Electron 应用,获取快照,并与其 UI 交互,用于端到端的桌面与流程自动化。
作者 vercel-labs
通过 agent-browser 和 Chrome DevTools Protocol(CDP)自动化现有的 Electron 桌面应用,例如 VS Code、Slack、Discord、Figma、Notion 和 Spotify。该技能帮助你连接到正在运行的 Electron 应用,获取快照,并与其 UI 交互,用于端到端的桌面与流程自动化。
作者 vercel-labs
通过浏览器自动化,从命令行控制 Slack。slack 技能通过 agent-browser 连接到你已有的 Slack Web 会话,让你可以检查未读频道、扫描私信、搜索会话、抽取数据,并在更大的自动化流程中生成结构化报告。
作者 vercel-labs
在 Vercel Sandbox microVM 中运行带有 headless Chrome 的 agent-browser,让部署在 Vercel 上的应用可以安全、可扩展地执行真实浏览器自动化、截图和页面交互。
作者 inferen-sh
通过 inference.sh CLI 使用 BiRefNet 的 background-removal 技能,一键去除图片背景。非常适合产品图、人物肖像、电商图片、透明 PNG 以及快速抠图场景。
作者 inferen-sh
agent-browser 让 AI agent 能通过 inference.sh 控制一个由 Playwright 驱动的浏览器。它可以打开页面,使用 @e 元素引用进行点击、输入、拖拽、上传文件、抓取内容,并截取截图或录制视频。非常适合 Web 自动化、数据抽取和由 agent 驱动的浏览流程。
作者 vercel-labs
agent-browser 是为 AI agents 和 shell 脚本设计的 Chrome/Chromium 浏览器自动化 CLI。你可以用它打开页面、导航、点击、填写表单、抓取快照、截图、录屏、性能 profiling、管理会话、处理认证流程,以及自动化端到端浏览器操作流程。
作者 inferen-sh
agent-tools 会在你的智能体中暴露 inference.sh CLI,让你可以在一个入口里调用 150+ 个 AI 应用:图片生成、视频创作、LLM、大模型搜索、3D,以及 Twitter 自动化等。适合希望用统一工作流来调用 FLUX、Veo、Gemini、Grok、Claude、Seedance、OmniHuman、Tavily、Exa、OpenRouter 等多种模型,又不想自己管理 GPU 或复杂集成的场景。
作者 inferen-sh
安装 ai-automation-workflows,结合 inference.sh CLI 搭建自动化 AI 工作流。学习批量任务、定时任务、事件驱动流水线,以及用于内容生成、数据处理和大规模监控的 agent 风格循环。
作者 inferen-sh
使用 inference.sh CLI,根据图片和音频生成 AI 虚拟人和说话头像视频。ai-avatar-video 封装了 OmniHuman、Fabric 和 PixVerse Lipsync 等应用,用于打造音频驱动的虚拟人、唇形同步视频和虚拟主持人,非常适合营销、讲解视频和社交内容工作流。
作者 inferen-sh
使用 inference.sh CLI 设计并运行多步骤 AI 内容生产流水线,把图片、视频、音频和文本工具串联起来。通过 ai-content-pipeline,你可以自动化内容工作流,例如:生成图片、将图片动画化成视频、添加音效或配音,并为 YouTube、社交媒体和营销活动批量准备素材。
作者 inferen-sh
通过 inference.sh CLI 创建 AI 驱动的营销视频。使用 ai-marketing-videos 为 Facebook、YouTube、Instagram 和 TikTok 生成宣传视频、产品演示、说明视频以及广告创意素材,支持 Veo、Seedance、Wan、FLUX 等视觉模型和 Kokoro 配音模型。
作者 inferen-sh
使用 Kokoro TTS、DIA TTS 和 inference.sh CLI,将文本一键生成 AI 播客和语音内容。你可以混合多种声音、添加音乐,并拼接完整的播客节目、有声书和音频简报。
作者 inferen-sh
使用 inference.sh CLI 构建 Retrieval Augmented Generation(RAG,检索增强生成)流水线,把 Web 搜索工具(Tavily、Exa)与大语言模型(通过 OpenRouter 调用 Claude、GPT-4、Gemini)组合在一起。非常适合需要有依据、有引用回答的研究型智能体、事实核查工具和 AI 助手。
作者 microsoft
通过引导式、多阶段流程,评估并升级现有 Azure 工作负载的 plan、tier 和 SKU。azure-upgrade 帮助你从 Consumption 迁移到 Flex Consumption、切换 Azure Functions 的 plan、更改托管 tier,并通过评估报告和自动化升级步骤,将 App Service 迁移到 Container Apps。
作者 inferen-sh
使用官方 CLI 在 inference.sh 上构建和部署应用的技能指南。涵盖应用脚手架、必需文件、资源配置,以及面向 Python 和 Node.js 后端的部署基础。
作者 inferen-sh
使用 content-repurposing,将一篇长内容拆解成多种形式:社交媒体帖子、threads、轮播(carousels)、金句卡片(quote cards)等。适合希望通过 inference.sh CLI 利用 AI 做内容拆分与再利用的内容营销和创作者。
作者 inferen-sh
通过 inference.sh CLI,结合 Dia TTS 和 ElevenLabs,生成逼真的多说话人对话音频。dialogue-audio 技能可精细控制说话人、情绪、节奏和对话流,用于播客、有声书、讲解类内容、角色场景以及其他对话型音频内容。
作者 obra
设计并并行运行多个相互独立的 AI agents,每个都有各自聚焦的上下文和任务域。
作者 microsoft
围绕 Microsoft Entra ID 应用注册提供的技能型指导,涵盖 OAuth 2.0 流程、API 权限,以及面向控制台和后端应用的 MSAL 身份验证示例。
作者 obra
使用 executing-plans 技能加载一份书面的实现计划,对其进行审慎评审,并按步骤执行小颗粒度的开发任务,同时带有检查点与状态跟踪。
作者 obra
为开发分支完成收尾提供结构化的 Git 工作流:在实现完成、测试通过后,引导你完成本地合并、推送和 PR、保留或丢弃分支。
作者 obra
在单个会话中,通过为每个任务派发全新、专门的 subagent,并分别执行规格与代码质量评审,有序编排整个开发工作。
作者 obra
在需要将新功能开发与当前工作区隔离时使用:using-git-worktrees 帮助你通过智能目录选择和安全检查,创建安全、结构清晰的 Git worktree。