Transcription

Transcription taxonomy generated by the site skill importer.

6 skills

transcribe

bởi openai

transcribe biến âm thanh hoặc video thành văn bản, có thể kèm phân tách người nói và gợi ý người nói đã biết. Phù hợp cho viết kỹ thuật, ghi chú cuộc họp, phỏng vấn, bài giảng và vận hành nội dung khi bạn cần một kỹ năng transcribe lặp lại được với định dạng đầu ra rõ ràng và ít phải đoán hơn so với một prompt chung chung.

Technical Writing

Yêu thích 0GitHub 18.8k

speech-to-text

bởi NoizAI

Kỹ năng speech-to-text chuyển các tệp âm thanh được hỗ trợ thành văn bản thuần, với tùy chọn thêm dấu thời gian, nhãn người nói và đầu ra JSON. Kỹ năng này được thiết kế cho nhu cầu speech-to-text thực tế trong các quy trình lặp lại, bao gồm phỏng vấn, họp, podcast, bài giảng và các tác vụ tự động hóa nơi độ nhất quán của bản chép là quan trọng.

Workflow Automation

Yêu thích 0GitHub 498

tts

bởi NoizAI

Kỹ năng tts biến văn bản thành âm thanh giọng nói cho thuyết minh, lồng tiếng, voiceover và phát theo mốc thời gian. Bạn có thể dùng nó để tạo file giọng nói từ văn bản thuần, chuyển bài viết hoặc file text thành speech, hoặc render âm thanh từ SRT với khả năng kiểm soát timing. Kỹ năng hỗ trợ chế độ đơn giản và chế độ theo timeline, cùng các quy trình làm việc nhận biết backend để dùng tts lặp lại một cách ổn định.

Voice Generation

Yêu thích 0GitHub 498

youtube-summarizer

bởi BrianRWagner

youtube-summarizer biến một liên kết YouTube thành bản tóm tắt transcript có cấu trúc, kèm các insight chính, metadata và tùy chọn chia nhỏ theo từng chương. Phù hợp để nắm nhanh nội dung, ghi chú nghiên cứu, và tái sử dụng video dài thành các ý chính dễ tìm kiếm. Xem phần cài đặt youtube-summarizer, cách dùng youtube-summarizer, và hướng dẫn youtube-summarizer cho quy trình Tóm tắt.

Summarization

Yêu thích 0GitHub 276

transcribe-video

bởi rameerez

Skill transcribe-video chuyển tệp video hoặc âm thanh thành các đầu ra .srt, .vtt và .txt bằng AWS Transcribe. Hãy dùng nó khi bạn cần transcribe-video để tạo phụ đề, bản chép có thể tìm kiếm, hoặc bản văn sạch của nội dung lời nói. Skill này cũng phù hợp cho các quy trình chuyển đổi định dạng với transcribe-video.

Format Conversion

Yêu thích 0GitHub 23

markitdown

bởi K-Dense-AI

markitdown chuyển đổi file và tài liệu văn phòng sang Markdown để dễ đọc hơn, dễ chia nhỏ nội dung, tìm kiếm và đưa vào quy trình làm việc với LLM. Skill markitdown này hỗ trợ PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, ảnh có OCR và chuyển giọng nói từ audio, nên là một hướng dẫn markitdown thực tế cho chuyển đổi định dạng.

Format Conversion

Yêu thích 0GitHub 0