Format Conversion

Kham pha Agent Skill cho Format Conversion trong Xu ly du lieu va so sanh workflow, cong cu va tinh huong lien quan.

23 skills
A
nutrient-document-processing

bởi affaan-m

Skill nutrient-document-processing dành cho xử lý PDF và tự động hóa tài liệu với Nutrient DWS API. Chuyển đổi, OCR, trích xuất, che/redact, ký, thêm watermark và điền biểu mẫu cho các tệp như PDF, DOCX, XLSX, PPTX, HTML và hình ảnh.

PDF Processing
Yêu thích 0GitHub 156.2k
A
xlsx

bởi anthropics

Skill xlsx giúp agent đọc, sửa, khôi phục, tạo và chuyển đổi tệp .xlsx, .xlsm, .csv và .tsv khi đầu ra cần là bảng tính. Phù hợp nhất cho cập nhật giữ nguyên mẫu, chỉnh sửa workbook an toàn với công thức, làm sạch dữ liệu bảng lộn xộn và các quy trình thực tế có script repo hỗ trợ đóng gói, kiểm tra và tính toán lại.

Spreadsheet Workflows
Yêu thích 0GitHub 105.1k
A
pdf

bởi anthropics

Kỹ năng pdf hỗ trợ các tác vụ xử lý PDF như trích xuất văn bản, gộp và tách file, render trang thành ảnh và quy trình làm việc với biểu mẫu PDF. Đặc biệt hữu ích khi kiểm tra trường điền, lấy metadata biểu mẫu và xác thực bố cục biểu mẫu không điền được bằng script.

PDF Processing
Yêu thích 0GitHub 105.1k
K
defuddle

bởi kepano

defuddle trích xuất markdown sạch từ trang web bằng Defuddle CLI, loại bỏ phần rối mắt để phục vụ nghiên cứu, tài liệu và bài viết. Phù hợp với các trang HTML thông thường, cài bằng npm và bỏ qua các URL kết thúc bằng .md.

Web Research
Yêu thích 0GitHub 19.7k
K
json-canvas

bởi kepano

json-canvas hỗ trợ tạo và chỉnh sửa tệp .canvas hợp lệ cho bảng kiểu Obsidian, với nodes, edges, IDs, tọa độ, nhóm và tham chiếu đúng cấu trúc.

Diagramming
Yêu thích 0GitHub 19.7k
J
baoyu-youtube-transcript

bởi JimLiu

baoyu-youtube-transcript giúp trích xuất transcript, phụ đề và ảnh bìa YouTube từ URL hoặc video ID. Công cụ hỗ trợ chọn ngôn ngữ, dịch, xuất ra markdown hoặc SRT, định dạng lại từ bộ nhớ đệm và tự động chuyển từ InnerTube API sang yt-dlp để lấy transcript ổn định hơn khi cần.

Format Conversion
Yêu thích 0GitHub 13.2k
J
baoyu-url-to-markdown

bởi JimLiu

baoyu-url-to-markdown chuyển URL đang hoạt động thành Markdown bằng CLI baoyu-fetch đi kèm, sử dụng Chrome CDP, adapter theo từng trang và cơ chế dự phòng chung. Tìm hiểu yêu cầu Bun runtime, thiết lập EXTEND.md cho lần dùng đầu, và cách dùng với X, YouTube, Hacker News cùng các trang đã render.

Format Conversion
Yêu thích 0GitHub 13.2k
J
baoyu-markdown-to-html

bởi JimLiu

baoyu-markdown-to-html chuyển Markdown thành HTML có định dạng theo phong cách xuất bản WeChat. Công cụ hỗ trợ theme, tô sáng mã, công thức toán, PlantUML, footnote, xử lý hình ảnh và tùy chọn trích dẫn liên kết, với khả năng chạy qua bun hoặc npx -y bun.

Format Conversion
Yêu thích 0GitHub 13.2k
J
baoyu-format-markdown

bởi JimLiu

baoyu-format-markdown định dạng văn bản thuần hoặc Markdown lộn xộn thành Markdown sạch hơn, sẵn sàng để xuất bản mà vẫn giữ nguyên ý nghĩa. Công cụ này sửa frontmatter, heading, danh sách, khối mã, trích dẫn và khoảng cách CJK, nên rất hữu ích cho Format Conversion khi cần chỉnh định dạng mà không viết lại nội dung.

Format Conversion
Yêu thích 0GitHub 13.2k
J
baoyu-danger-x-to-markdown

bởi JimLiu

baoyu-danger-x-to-markdown chuyển bài đăng, thread và một số bài viết trên X sang Markdown kèm YAML front matter. Công cụ dùng các script trong `scripts/` với `bun` hoặc `npx -y bun`, hỗ trợ truy cập bằng cookie và luồng consent, phù hợp với các quy trình Format Conversion lặp lại hơn là dùng prompt tổng quát.

Format Conversion
Yêu thích 0GitHub 13.2k
P
dummy-dataset

bởi phuryn

dummy-dataset tạo dữ liệu kiểm thử chân thực ở dạng CSV, JSON, SQL hoặc script Python. Công cụ này hữu ích cho bộ dữ liệu giả, bản demo, nạp dữ liệu khởi tạo cho cơ sở dữ liệu, QA và làm sạch dữ liệu, vì bạn có thể xác định cột, số lượng dòng và các ràng buộc để tạo ra bản ghi mẫu thuyết phục.

Data Cleaning
Yêu thích 0GitHub 11.1k
S
web-to-markdown

bởi softaworks

web-to-markdown là skill Format Conversion dùng để chuyển các trang web đang hoạt động thành Markdown sạch thông qua CLI `web2md` cục bộ, sử dụng trình duyệt họ Chromium cho các trang render bằng JS, luồng tương tác và chuyển đổi hàng loạt URL. Skill chỉ chạy khi được gọi đích danh.

Format Conversion
Yêu thích 0GitHub 1.3k
N
speech-to-text

bởi NoizAI

Kỹ năng speech-to-text chuyển các tệp âm thanh được hỗ trợ thành văn bản thuần, với tùy chọn thêm dấu thời gian, nhãn người nói và đầu ra JSON. Kỹ năng này được thiết kế cho nhu cầu speech-to-text thực tế trong các quy trình lặp lại, bao gồm phỏng vấn, họp, podcast, bài giảng và các tác vụ tự động hóa nơi độ nhất quán của bản chép là quan trọng.

Workflow Automation
Yêu thích 0GitHub 498
D
read-file

bởi duckdb

read-file giúp tác nhân đọc và kiểm tra các file CSV, JSON, Parquet, Avro, Excel, SQLite, file không gian địa lý hoặc URL từ xa bằng DuckDB. Dùng nó để xem trước vài dòng, kiểm tra schema, phân tích dữ liệu và trả lời câu hỏi “trong file này có gì”. Phù hợp nhất cho việc dùng read-file với dữ liệu thực tế, không phải mã nguồn.

Office Documents
Yêu thích 0GitHub 443
R
transcribe-video

bởi rameerez

Skill transcribe-video chuyển tệp video hoặc âm thanh thành các đầu ra .srt, .vtt và .txt bằng AWS Transcribe. Hãy dùng nó khi bạn cần transcribe-video để tạo phụ đề, bản chép có thể tìm kiếm, hoặc bản văn sạch của nội dung lời nói. Skill này cũng phù hợp cho các quy trình chuyển đổi định dạng với transcribe-video.

Format Conversion
Yêu thích 0GitHub 23
X
tzst

bởi xixu-me

`tzst` là skill thiên về CLI, giúp cài đặt, tạo, liệt kê, kiểm tra và giải nén các gói `.tzst` hoặc `.tar.zst` với đúng lệnh, cờ tùy chọn và mặc định an toàn. Phù hợp khi bạn cần tzst install, tzst usage, lọc dữ liệu, xử lý xung đột, streaming và các quy trình File Automation.

File Automation
Yêu thích 0GitHub 6
K
pymatgen

bởi K-Dense-AI

pymatgen là một toolkit khoa học vật liệu bằng Python cho cấu trúc tinh thể, giản đồ pha, cấu trúc điện tử và chuyển đổi tệp. Skill pymatgen này hỗ trợ các quy trình làm việc khoa học với CIF, POSCAR, VASP và dữ liệu Materials Project.

Scientific
Yêu thích 0GitHub 0
K
pdf

bởi K-Dense-AI

Skill pdf là một hướng dẫn thực tế cho PDF Processing khi bạn cần đọc, trích xuất, chuyển đổi hoặc tạo file PDF trong một workflow có thể triển khai được. Nội dung bao gồm trích xuất văn bản, gộp, tách, xoay trang, điền biểu mẫu, mã hóa, trích xuất ảnh và OCR cho PDF quét. Hãy dùng nó khi bạn cần một hướng dẫn pdf có thể lặp lại thay vì một prompt dùng một lần.

PDF Processing
Yêu thích 0GitHub 0
K
markitdown

bởi K-Dense-AI

markitdown chuyển đổi file và tài liệu văn phòng sang Markdown để dễ đọc hơn, dễ chia nhỏ nội dung, tìm kiếm và đưa vào quy trình làm việc với LLM. Skill markitdown này hỗ trợ PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, ảnh có OCR và chuyển giọng nói từ audio, nên là một hướng dẫn markitdown thực tế cho chuyển đổi định dạng.

Format Conversion
Yêu thích 0GitHub 0
T
transform-remove-background-with-transloadit

bởi transloadit

transform-remove-background-with-transloadit là một kỹ năng Chỉnh sửa ảnh tập trung vào việc xóa nền của ảnh cục bộ và lưu ra PNG trong suốt bằng CLI chính thức `@transloadit/node`. Kỹ năng này dùng một file steps `/image/bgremove` tối giản, chỉ rõ đường dẫn đầu vào và đầu ra, cùng cơ chế tìm thông tin xác thực rõ ràng để bạn chạy quy trình ít phải đoán mò hơn.

Image Editing
Yêu thích 0GitHub 0
K
kreuzberg

bởi kreuzberg-dev

Kreuzberg skill giúp bạn cài đặt và dùng Kreuzberg để trích xuất tài liệu trên hơn 91 định dạng, bao gồm PDF, file Office, hình ảnh, HTML, email và archive. Nội dung bao phủ các quy trình với Python, Node.js/TypeScript, Rust và CLI cho OCR, bảng biểu, metadata, xử lý hàng loạt và hướng dẫn phân tích cú pháp thực tế.

PDF Processing
Yêu thích 0GitHub 0
M
minimax-xlsx

bởi MiniMax-AI

Kỹ năng minimax-xlsx giúp tạo, đọc, chỉnh sửa, xác thực và định dạng workbook Excel theo quy trình ưu tiên Excel. Hãy dùng minimax-xlsx cho các quy trình bảng tính khi bạn cần tệp có cấu trúc, giữ nguyên công thức, kiểu định dạng, bố cục sheet và hành vi của workbook. Kỹ năng này hỗ trợ các tác vụ .xlsx, .xlsm, .csv và .tsv, bao gồm phân tích, tạo workbook mới, chỉnh sửa tối thiểu, sửa công thức và kiểm tra xác thực. Hướng dẫn minimax-xlsx được thiết kế cho việc bàn giao workbook thực tế, không phải cho các bảng phẳng đơn giản.

Spreadsheet Workflows
Yêu thích 0GitHub 0
O
pdf

bởi openai

Dùng kỹ năng pdf cho các tác vụ xử lý PDF khi bố cục, phân trang và đầu ra hiển thị là yếu tố quan trọng. Kỹ năng này giúp bạn đọc, tạo, chỉnh sửa và rà soát PDF theo quy trình ưu tiên hình ảnh: render trang, xem kết quả rồi tinh chỉnh. Hãy dùng khi bạn cần cài đặt pdf đáng tin cậy, cách dùng pdf rõ ràng, và một hướng dẫn pdf thực tế để đảm bảo độ chính xác của tài liệu.

PDF Processing
Yêu thích 0GitHub 0
Format Conversion agent skills