I

elevenlabs-sound-effects

作者 inferen-sh

通过 inference.sh CLI 调用 ElevenLabs,根据文本提示生成 AI 音效。非常适合需要快速、免版税声音设计的视频剪辑师、游戏开发者、播客作者、电影创作者和内容创作者。支持文本转音效、可调节时长,以及可控的提示词影响力,可用于电影级、氛围化和游戏就绪的 SFX。

Stars0
收藏0
评论0
收录时间2026年3月27日
分类音频编辑
安装命令
npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-sound-effects
概览

概览

elevenlabs-sound-effects 是什么?

elevenlabs-sound-effects 是一个通过命令行驱动的技能,使用 inference.sh CLI(infsh)调度 ElevenLabs,将简短的文本描述转换成完整渲染的音效。它专为需要快速获得免版税 SFX、又不想自己录音或手工做音效设计的创作者而设计。

在后台,这个技能调用的是 inference.sh 上的 elevenlabs/sound-effects app。你提供自然语言的 prompt(例如:"Thunder rumbling in the distance"),工具会返回一个音频文件,你可以直接拖进时间线、游戏引擎或播客工程中使用。

适合哪些人?

如果你符合以下情况,这个技能会很适合你:

  • 制作 视频内容(YouTube、短视频、预告片、解说视频),需要随用随生的定制音效。
  • 从事 游戏开发,想快速迭代环境音、UI 提示音、打击音和 foley(拟音)。
  • 主持 播客或有声剧,需要自定义的过场、氛围或转场音效。
  • 剪辑 电影或影视级作品,需要独特的 braams、risers、drones 和 hits。
  • 搭建 应用或自动化工作流,希望通过 CLI 以编程方式生成音效。

关键能力

  • Text-to-sound-effect:用简明的英文描述声音,然后用一条 CLI 命令生成音频。
  • 自定义时长:通过 duration_seconds 参数控制片段长度(0.5–22 秒),也可交给模型自动决定。
  • 提示词影响力控制:使用 prompt_influence(0–1)调节模型对描述的“照本宣科”程度。
  • 免版税输出:输出设计用于视频、游戏、播客、电影、演示和社交媒体等实际制作场景,具体仍受 ElevenLabs / inference.sh 使用条款约束。
  • CLI 友好工作流:可顺畅整合进 shell 脚本、构建流水线或其他会调用 infsh 的工具中。

elevenlabs-sound-effects 适用的场景

在以下情况使用这个技能更合适:

  • 你需要 快速批量生成大量变体,不想反复翻找音效素材库。
  • 你需要 精细控制音频长度(例如刚好匹配 3 秒转场或 10 秒环境铺底)。
  • 你工作在一个 以终端或自动化为主 的环境,更偏好 CLI 或脚本化流程。

在以下情况下,它可能不是最佳选择:

  • 你需要 精准复刻有授权或品牌特定的声音(例如某款具体发动机型号声、注册商标提示音)。
  • 你需要 完整的 DAW 级编辑能力;这个技能负责生成素材,但混音、叠加和母带处理仍需在你常用的音频或视频工具中完成。
  • 你无法安装或使用 inference.sh CLI

使用指南

前提条件

在使用 elevenlabs-sound-effects 之前,你需要:

  1. 安装 inference.sh CLI(infsh

    • 该技能依赖 inference.sh 命令行工具。
    • 官方安装文档见:
      • https://raw.githubusercontent.com/inference-sh/skills/refs/heads/main/cli-install.md
  2. 登录 inference.sh

    • 需要完成鉴权,CLI 才能调用 ElevenLabs 的 sound effects app。

完成以上配置后,你即可在代理(agent)环境和 CLI 中添加并使用该技能。

第 1 步:将技能安装到你的 agent 环境

如果你在使用 Agent Skills 生态,可从共享技能仓库中添加该技能:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-sound-effects

此命令会从 inferen-sh/skills 仓库中的 tools/audio/elevenlabs-sound-effects 位置拉取 elevenlabs-sound-effects 的技能定义,并让你的 agent 或工作流可以使用它。

安装完成后:

  • 查看技能目录中的 SKILL.md,了解权威的运行时说明。
  • 注意配置中允许 Bash(infsh *),表示该技能会在后台执行 infsh 命令。

第 2 步:配置 inference.sh CLI

如果你还没有配置 CLI:

  1. 按仓库安装指南安装 infsh
  2. 在终端中登录:
infsh login

根据屏幕提示完成身份验证。登录成功后,infsh 即可调用 ElevenLabs sound effects app。

第 3 步:生成你的第一个音效

CLI 准备好后,你可以直接生成一个音效:

infsh app run elevenlabs/sound-effects --input '{"text": "Thunder rumbling in the distance"}'

该命令会:

  • 调用 elevenlabs/sound-effects app。
  • 传入包含 text prompt 的 JSON input 对象。
  • 返回描述生成资源的输出 JSON(包括音频文件的位置或 URL,视你的环境而定)。

随后,你可以在自己的工具(视频剪辑软件、DAW、游戏引擎或流水线脚本)中下载或引用该音频。

第 4 步:控制时长和提示词行为

ElevenLabs sound effects app 支持三个主要参数:

  • text(string,必填)

    • 对音效的文字描述(最多 1000 字符)。
    • 示例:"Cinematic braam, deep bass impact"
  • duration_seconds(number,可选)

    • 目标音频时长(单位:秒)。
    • 可用范围:0.5–22 秒
    • 若不设置,app 会根据描述自动选择合适时长。
  • prompt_influence(number,可选)

    • 控制模型对文本描述的“服从度”。
    • 范围:0–1,默认 0.3
    • 较低数值:更具创意,解释更自由。
    • 较高数值:更严格贴合提示词措辞。

带自定义时长和提示词影响力的示例:

infsh app run elevenlabs/sound-effects \
  --input '{
    "text": "Futuristic UI confirmation beep with soft echo",
    "duration_seconds": 1.2,
    "prompt_influence": 0.6
  }'

第 5 步:使用电影级与氛围类风格

该技能非常适合为影视或视频作品叠加电影级和氛围类音效。例如:

# Epic trailer hit
infsh app run elevenlabs/sound-effects --input '{"text": "Cinematic braam, deep bass impact"}'

# Suspense drone
infsh app run elevenlabs/sound-effects --input '{"text": "Low suspenseful drone with subtle pulsing"}'

这些音效特别适合:

  • 预告片的强调段与转场
  • 制造场景紧张感的铺底
  • 片头/标题卡的冲击音
  • 对话场景的背景氛围音

第 6 步:整合进你的音频或视频工作流

生成好音效后,你可以:

  • 导入到视频编辑软件,如 Adobe Premiere Pro、Final Cut Pro、DaVinci Resolve 或 CapCut。
  • 导入到音频工具 / DAW,如 Audacity、Reaper、Pro Tools 或 Logic Pro 进行进一步混音。
  • 嵌入到游戏引擎(Unity、Unreal、Godot)中,作为动作、UI、环境和 foley 的 SFX 资源。
  • 在构建脚本中自动化,通过 shell 脚本、CI 流水线或自研工具调用 infsh app run

由于这个技能以 CLI 为核心,非常适合用于脚本化流水线:按构建、按场景或按内容批次自动生成和整理音效资源。

常见问题(FAQ)

elevenlabs-sound-effects 在底层到底做了什么?

elevenlabs-sound-effects 是一个技能定义,允许 agent 或工作流通过 inference.sh CLI 调用 elevenlabs/sound-effects app。它接收文本 prompt(以及可选的 duration_secondsprompt_influence 参数),并返回适合制作使用的 AI 生成音效文件。

如何安装 elevenlabs-sound-effects?

在你的 agent 环境中安装该技能:

npx skills add https://github.com/inferen-sh/skills --skill elevenlabs-sound-effects

然后确保已安装 inference.sh CLI(infsh),并执行 infsh login,以便技能可以调用 ElevenLabs sound effects app。

使用这个技能必须安装 inference.sh CLI 吗?

是的。SKILL.md 配置中明确允许 Bash(infsh *),这意味着 elevenlabs-sound-effects 依赖 inference.sh CLI 进行实际的音效生成。如果没有 infsh,技能无法调用底层的 ElevenLabs app。

我可以自定义哪些参数?

ElevenLabs sound effects app 支持:

  • text:必填的音效描述(最多 1000 字符)。
  • duration_seconds:可选的片段长度,范围 0.5–22 秒。
  • prompt_influence:可选的控制参数,0 到 1,默认 0.3,用于决定模型对提示词的字面遵从程度。

这些参数会直接映射到你传给 infsh app run 的 JSON --input 对象。

我可以生成很短的 UI 音效或较长的环境音吗?

可以。通过 duration_seconds 你可以生成:

  • 大约 0.5–1.5 秒的短 blip、click 或通知提示音。
  • 大约 2–7 秒的中等长度转场、riser 或打击音。
  • 最长 22 秒的环境氛围或 drone 音。

如果省略 duration_seconds,app 会根据你的 prompt 自动选择时长。

生成的音频是免版税的吗?

技能说明中提到,输出旨在作为视频制作、游戏音频、播客、电影、演示和社交媒体等场景的免版税音频使用。但请务必以 ElevenLabs 和 inference.sh 最新的使用权与许可条款为准,确保满足你具体项目的合规要求。

我能在视频或音频编辑软件中直接使用 elevenlabs-sound-effects 吗?

这个技能是通过 CLI 和 agent 工作流运行的,而不是以插件形式直接嵌入编辑软件。典型流程是:

  1. 使用 infsh app run elevenlabs/sound-effects 生成音效。
  2. 保存或下载生成的音频文件。
  3. 将这些文件导入你的编辑软件或 DAW。

elevenlabs-sound-effects 适合在应用或游戏中做实时回放吗?

该技能主要针对 资产生成,并非低延迟的实时播放场景。更适合预先生成 SFX,然后随应用或游戏一并打包发布。若要在会话中实时生成,需要根据 infsh 的响应速度设计你的工作流,并评估是否满足产品的实时体验要求。

哪里可以查看更多关于这个技能的细节?

inferen-sh/skills 仓库安装后,打开 tools/audio/elevenlabs-sound-effects 目录中的 SKILL.md 文件。里面包含权威的参数说明、命令示例以及使用指导的最新更新。

评分与评论

暂无评分
分享你的评价
登录后即可为这个技能评分并发表评论。
G
0/10000
最新评论
保存中...