speech

por openai

Use a skill speech para transformar texto em áudio falado para narração, locução, prompts de IVR, leitura para acessibilidade e geração em lote de fala. Ela usa a OpenAI Audio API com vozes integradas, um CLI incluído e `OPENAI_API_KEY` para execuções ao vivo. A criação de vozes personalizadas está fora do escopo.

Estrelas0

Favoritos0

Comentários0

Adicionado8 de mai. de 2026

CategoriaDesign Implementation

Comando de instalação

npx skills add openai/skills --skill speech

Pontuação editorial

Esta skill recebe 88/100, o que indica uma listagem sólida no diretório e com bom valor prático para agentes. O usuário pode esperar um fluxo de geração de fala claramente acionável, mais útil do que um prompt genérico, com detalhes suficientes de CLI e de referência para suportar instalações reais, embora ainda dependa de acesso à rede e da OpenAI API para gerar saídas ao vivo.

88/100

Pontos fortes

Alta acionabilidade: o frontmatter delimita explicitamente casos de uso como narração text-to-speech, locução, leitura para acessibilidade e geração em lote de fala.
Clareza operacional: o SKILL.md traz uma árvore de decisão para uso individual vs. em lote e um fluxo passo a passo, apoiado por uma referência de CLI incluída.
Bom suporte para agentes: as referências de apoio cobrem vozes, parâmetros da Audio API, padrões de acessibilidade e uso em lote, reduzindo a margem de dúvida na execução.

Pontos de atenção

A geração ao vivo exige `OPENAI_API_KEY` e acesso à rede, então não é totalmente autossuficiente para uso offline.
A criação de vozes personalizadas está fora do escopo, então quem precisa de vozes sob medida ou fluxos de áudio mais avançados vai precisar de outra solução.

Audio Accessibility Anthropic OpenAI Cli

Visão geral

Visão geral do skill de speech

O que o skill de speech faz

O skill de speech transforma texto em áudio falado para narração, voiceover, prompts de IVR, leituras de acessibilidade e geração em lote de fala. Ele funciona melhor quando você precisa de saída de áudio reproduzível a partir de um prompt, e não de um pedido livre do tipo “faz soar bonito”.

Quem deve usar

Use speech se o install de speech precisar se encaixar em um fluxo de trabalho real: demos de produto, onboarding de app, materiais de acessibilidade ou muitos clipes curtos a partir de texto estruturado. É uma boa opção quando voz, ritmo, formato de saída e consistência entre execuções importam.

O que o torna diferente

O guia de speech é construído em torno da OpenAI Audio API e do CLI incluído, então privilegia uso determinístico em vez de prompting improvisado. Ele usa vozes nativas, suporta jobs únicos ou em lote e espera OPENAI_API_KEY para geração ao vivo. Criação de voz personalizada está fora de escopo.

Como usar o skill de speech

Instale e localize o fluxo de trabalho

Instale com npx skills add openai/skills --skill speech. Depois disso, leia primeiro SKILL.md, depois references/cli.md para detalhes dos comandos, references/audio-api.md para limites de modelo e parâmetros, e references/prompting.md ou references/voice-directions.md para escrever instruções melhores. Para contexto rápido, confira agents/openai.yaml e references/sample-prompts.md.

Transforme um objetivo bruto em um prompt utilizável

O padrão de uso do speech funciona melhor quando você fornece ao skill o texto exato que deve ser lido, a voz alvo, o estilo de entrega, o formato de saída e quaisquer restrições de pronúncia. Um pedido forte seria: “Gere uma locução de 45 segundos para demo de produto a partir deste script, use cedar, mantenha um tom caloroso e estável, saída em mp3 e destaque o nome do produto na primeira menção.” Isso é melhor do que “faça isso soar profissional”, porque dá ao skill controles concretos de síntese.

Fluxo de trabalho único vs em lote

O skill foi pensado para dois caminhos: um clipe ou vários clipes. Se você tiver várias linhas, prompts ou arquivos, trate como lote e prepare um arquivo JSONL temporário em tmp/, depois execute o CLI uma única vez e apague o JSONL depois do uso. Se tiver apenas um script, use o caminho de arquivo único. Essa decisão importa porque a estrutura do skill e as etapas de validação mudam conforme o volume de saída.

O que verificar antes de executar

Para melhores resultados, valide o texto palavra por palavra, não só o tema. Confirme a voz, o formato do arquivo, a velocidade e se a saída precisa ser neutra, expressiva ou priorizar acessibilidade. O principal arquivo do repositório a inspecionar para a execução é scripts/text_to_speech.py; não o modifique a menos que o mantenedor do repositório oriente isso.

FAQ do skill de speech

O skill de speech é só para narração?

Não. O skill de speech também serve para voiceover, leituras de acessibilidade, prompts de IVR e prompts curtos de áudio. Ele é menos útil para clonagem de voz personalizada ou design criativo de voz, que este repo não cobre.

Preciso do CLI para usar speech?

Para um uso confiável do speech, sim. O CLI incluído é o caminho esperado para geração ao vivo, enquanto --dry-run é útil para conferir a forma da chamada sem fazer uma requisição de API. Se você apenas escrever um prompt genérico, perde a estrutura que torna o skill reproduzível.

Isso é amigável para iniciantes?

Sim, desde que você consiga fornecer o texto exato e uma direção básica de voz. O install de speech é simples, mas a qualidade da saída depende de quão claramente você define ritmo, tom, formato e pronúncia. Iniciantes costumam ter mais sucesso quando começam com um clipe curto e uma única voz.

Quando eu não devo usar este skill?

Não use speech se você precisar criar uma voz personalizada, fazer pós-produção pesada ou depender de um fluxo que envolva modificar o script incluído. Também é uma escolha ruim se você não puder usar chamadas de rede para a OpenAI API ou não tiver OPENAI_API_KEY.

Como melhorar o skill de speech

Reduza ambiguidades ao máximo

O maior ganho de qualidade na saída do skill de speech vem de eliminar suposições. Forneça o texto exato, não um resumo; diga quem é o público-alvo; e especifique se a leitura deve soar como narração, mensagem de suporte, acessibilidade ou prompt de IVR. Se um termo for difícil de pronunciar, escreva como deve ser lido ou adicione uma nota de pronúncia.

Ajuste uma variável por vez

Quando a primeira versão estiver perto, mas não certa, mude apenas uma coisa: voz, velocidade ou estilo da instrução. Isso torna a iteração mais limpa do que reescrever o prompt inteiro. Por exemplo, se o tempo parecer apressado, mantenha texto e voz fixos e ajuste só a velocidade de 1.0 para 0.95.

Use restrições de saída que realmente importam

O guia de speech funciona melhor quando as restrições são operacionais, não vagas. Diga “mp3 para reprodução rápida”, “wav para revisão” ou “estável e neutro para acessibilidade”. Em jobs em lote, mantenha cada linha com escopo bem delimitado para que o skill preserve uma entrega consistente entre as saídas.

Leia primeiro as referências certas

Se você quer melhores resultados com speech para Design Implementation, priorize references/accessibility.md para leituras neutras, references/voiceover.md para entrega no estilo apresentação e references/sample-prompts.md para a estrutura dos prompts. Esses arquivos ajudam você a escrever instruções que o CLI e a API conseguem executar sem interpretação extra.

Avaliações e comentários

Ainda não há avaliações

Compartilhe sua avaliação

Faça login para deixar uma nota e um comentário sobre esta skill.

0/10000

Avaliações mais recentes

Salvando...

Mais skills nesta categoria

frontend-design

por anthropics

frontend-design transforma ideias vagas de UI em interfaces marcantes e prontas para produção, com código frontend real, direção estética clara e menos visual genérico de IA.

UI Design

Favoritos 1GitHub 105.2k

hyperframes

por heygen-com

hyperframes é uma skill de fluxo de trabalho para criar composições de vídeo baseadas em HTML no HyperFrames. Use-a para cards de título, sobreposições, legendas, narração, movimento reativo ao áudio e transições de cena quando precisar de hyperframes estruturados e orientados por código para Edição de Vídeo. Ela prioriza decisões de layout, tempo e animação em vez de pedidos genéricos de vídeo só com prompt.

Video Editing

Favoritos 0GitHub 2.7k

figma-generate-library

por figma

A skill figma-generate-library ajuda você a criar ou atualizar um sistema de design no Figma a partir de uma base de código, com um fluxo organizado para tokens, bibliotecas de componentes, documentação e temas claro/escuro. Use a skill figma-generate-library quando precisar de um guia prático para Design Systems, e não de um mockup pontual. Ela complementa a figma-use para chamadas à Plugin API.

Design Systems

Favoritos 0GitHub 0

winui-app

por openai

A skill winui-app ajuda você a iniciar, construir e resolver problemas de apps desktop WinUI 3 com C# e o Windows App SDK. Use-a para verificar se o ambiente está pronto, configurar um novo app, decidir entre shell e navegação, lidar com controles XAML, temas, acessibilidade, implantação e fluxos de correção de inicialização no Desenvolvimento Frontend.

Frontend Development

Favoritos 0GitHub 0

gsap-plugins

por greensock

O gsap-plugins ajuda desenvolvedores frontend a escolher, instalar e usar os plugins do GSAP do jeito certo. Ele cobre registro de plugins, imports e orientações práticas para ScrollToPlugin, ScrollSmoother, Flip, Draggable, Inertia, Observer, SplitText, ScrambleText, plugins SVG, ferramentas de easing e GSDevTools. Use este guia quando precisar de uma referência clara sobre gsap-plugins, em vez de conselhos genéricos de animação.

Frontend Development

Favoritos 0GitHub 3.2k

ckm:design-system

por nextlevelbuilder

ckm:design-system ajuda você a criar tokens em três camadas, especificações de componentes, variáveis CSS, mapeamentos Tailwind e slides alinhados à marca a partir de uma arquitetura de tokens clara.

Design Systems

Favoritos 0GitHub 53.6k

impeccable

por pbakaus

impeccable ajuda você a criar interfaces frontend distintas e prontas para produção, em vez de layouts genéricos com cara de IA. Ele oferece suporte aos fluxos craft, teach e extract para páginas, componentes web, superfícies de apps, pôsteres e outros frontends com forte apelo visual, tornando a skill útil para UI Design, configuração de contexto de design e extração de padrões reutilizáveis.

UI Design

Favoritos 0GitHub 20.4k

figma

por openai

Use o figma para extrair contexto de design, capturas de tela, variáveis e assets do servidor MCP do Figma e, em seguida, converter nós do Figma em decisões de UI prontas para implementação. Este skill de figma é ideal quando você tem uma URL do Figma ou um node ID e precisa de uso preciso do figma para trabalho de design para código, configuração ou troubleshooting.

Design Implementation

Favoritos 0GitHub 18.6k

archimate

por markdown-viewer

archimate ajuda a criar diagramas ArchiMate no PlantUML com `!include <archimate/Archimate>`, macros tipadas para elementos e macros para relacionamentos. Ele se encaixa em visões em camadas de arquitetura corporativa para negócio, aplicação, tecnologia, motivação e planejamento de migração. Use archimate para diagramas quando precisar de notação EA estruturada, e não de diagramas genéricos de nuvem ou rede.

Diagramming

Favoritos 0GitHub 1.1k

tvos-design-guidelines

por ehmo

tvos-design-guidelines é um conjunto prático de regras de design da Apple TV para revisar interfaces de tvOS, navegação baseada em foco, comportamento do Siri Remote, legibilidade a 10 pés e reprodução de mídia. Use este guia tvos-design-guidelines quando precisar de restrições claras, crítica tela a tela e verificações de implementação para design de UI para a sala de estar.

UI Design

Favoritos 0GitHub 357

android-design-guidelines

por ehmo

android-design-guidelines é um guia prático de Material Design 3, Jetpack Compose e layouts XML. Use-o para revisar decisões de UI em Android, incluindo tema, navegação, acessibilidade, layouts adaptativos, cores dinâmicas e conformidade com Material You. Ideal para tarefas com android-design-guidelines como guia e para android-design-guidelines em Design de UI.

UI Design

Favoritos 0GitHub 357

figma-use

por openai

O figma-use é a skill obrigatória para chamadas seguras de `use_figma` em fluxos de trabalho da Figma Plugin API. Use a skill figma-use para instalá-la e carregá-la antes de escrever, atualizar, inspecionar ou estruturar arquivos do Figma com JavaScript. Ela é especialmente útil para implementação de design, trabalho com componentes, variáveis, auto layout e leitura programática de arquivos.

Design Implementation

Favoritos 0GitHub 0

shadcn

por shadcn-ui

Use a skill shadcn para inspecionar o contexto do projeto, executar os comandos de CLI corretos, instalar componentes e compor interfaces com padrões documentados para base vs radix, formulários, temas e registries.

UI Design

Favoritos 0GitHub 111k

visionos-design-guidelines

por ehmo

O skill visionos-design-guidelines ajuda você a aplicar as diretrizes da Apple Vision Pro para UI espacial, entrada por olhar e mãos, espaços imersivos, janelas, volumes e acessibilidade. Use-o ao revisar ou criar interfaces visionOS que precisem de conforto, posicionamento correto e orientação fiel à plataforma.

UI Design

Favoritos 0GitHub 357

swiftui-patterns

por affaan-m

swiftui-patterns é um guia prático de Frontend Development para plataformas Apple. Ele cobre gerenciamento de estado em SwiftUI, fluxos com NavigationStack, composição de views e orientações de desempenho para ajudar você a escolher o padrão certo para código real de app. Use a skill swiftui-patterns ao refatorar ou criar telas com responsabilidade bem definida e menos re-renderizações.

Frontend Development

Favoritos 0GitHub 156.3k

design-review

por garrytan

design-review é uma skill de QA de design com foco em UX para auditar interfaces em produção, identificar problemas de espaçamento, hierarquia, consistência visual e interação, e corrigi-los de forma iterativa com verificação. Ela oferece suporte à revisão em modo de plano antes da implementação e é útil quando você quer um guia de design-review com mudanças concretas no código-fonte, em vez de conselhos vagos.

UX Audit

Favoritos 0GitHub 91.8k