PDF Processing

Kham pha Agent Skill cho PDF Processing trong Van phong va so sanh workflow, cong cu va tinh huong lien quan.

15 skills
A
visa-doc-translate

bởi affaan-m

visa-doc-translate chuyển đổi hình ảnh tài liệu xin visa sang tiếng Anh và tạo một file PDF song ngữ, hiển thị cả trang gốc lẫn bản dịch. Skill này được xây dựng cho hồ sơ visa có cấu trúc, có phương án OCR dự phòng, xử lý xoay ảnh và giữ nguyên tên, ngày tháng, số tiền.

Translation
Yêu thích 0GitHub 156.3k
A
nutrient-document-processing

bởi affaan-m

Skill nutrient-document-processing dành cho xử lý PDF và tự động hóa tài liệu với Nutrient DWS API. Chuyển đổi, OCR, trích xuất, che/redact, ký, thêm watermark và điền biểu mẫu cho các tệp như PDF, DOCX, XLSX, PPTX, HTML và hình ảnh.

PDF Processing
Yêu thích 0GitHub 156.2k
A
pdf

bởi anthropics

Kỹ năng pdf hỗ trợ các tác vụ xử lý PDF như trích xuất văn bản, gộp và tách file, render trang thành ảnh và quy trình làm việc với biểu mẫu PDF. Đặc biệt hữu ích khi kiểm tra trường điền, lấy metadata biểu mẫu và xác thực bố cục biểu mẫu không điền được bằng script.

PDF Processing
Yêu thích 0GitHub 105.1k
K
hv-analysis

bởi KKKKhazix

hv-analysis là một skill nghiên cứu theo trục ngang-dọc để biến một sản phẩm, công ty, khái niệm, công nghệ hoặc cá nhân thành một báo cáo phân tích có cấu trúc. Hãy dùng skill hv-analysis cho nghiên cứu chuyên sâu, so sánh cạnh tranh và đầu ra sẵn sàng đưa vào báo cáo, đặc biệt khi bạn cần hv-analysis cho Phân tích dữ liệu hoặc quy trình PDF chỉn chu.

Data Analysis
Yêu thích 0GitHub 9k
M
azure-ai-document-intelligence-ts

bởi microsoft

azure-ai-document-intelligence-ts là một skill TypeScript để trích xuất văn bản, bảng, các trường key-value và dữ liệu có cấu trúc bằng Azure Document Intelligence. Hãy dùng nó cho OCR Extraction từ hóa đơn, biên lai, giấy tờ tùy thân và biểu mẫu, hoặc khi bạn cần quy trình làm việc với mô hình dựng sẵn và mô hình tùy chỉnh trong Node.js với xác thực Azure REST SDK.

OCR Extraction
Yêu thích 0GitHub 2.3k
M
azure-ai-contentunderstanding-py

bởi microsoft

azure-ai-contentunderstanding-py là skill Python cho Azure AI Content Understanding. Nó trích xuất nội dung có cấu trúc từ tài liệu, hình ảnh, âm thanh và video để phục vụ RAG và tự động hóa. Hãy dùng khi bạn cần trích xuất đa phương thức đáng tin cậy, xác thực Azure và đầu ra lặp lại, sẵn sàng cho pipeline.

RAG Workflows
Yêu thích 0GitHub 2.2k
M
azure-ai-formrecognizer-java

bởi microsoft

Skill azure-ai-formrecognizer-java giúp lập trình viên Java dùng Azure AI Document Intelligence để trích xuất OCR, bảng biểu, cặp khóa-giá trị, hóa đơn, biên lai, giấy tờ tùy thân và các mô hình tài liệu tùy chỉnh. Skill này bám theo SDK com.azure:azure-ai-documentintelligence hiện tại và rất hữu ích khi bạn cần thiết lập Java thực tế, hướng dẫn API và phân tích tài liệu lặp lại, có thể tái sử dụng.

OCR Extraction
Yêu thích 0GitHub 2.2k
M
azure-ai-document-intelligence-dotnet

bởi microsoft

azure-ai-document-intelligence-dotnet giúp lập trình viên .NET cài đặt và sử dụng Azure AI Document Intelligence để trích xuất văn bản, bảng biểu, cặp khóa-giá trị và các trường có cấu trúc từ hóa đơn, biên lai, giấy tờ tùy thân và tài liệu tùy chỉnh. Nội dung bao gồm hướng dẫn thiết lập thực tế, xác thực và OCR Extraction để phân tích tài liệu một cách đáng tin cậy.

OCR Extraction
Yêu thích 0GitHub 2.2k
P
Resume Formatter

bởi Paramchoudhary

Resume Formatter giúp biến những bản CV thô thành tài liệu gọn gàng, thân thiện với ATS, với cấu trúc rõ ràng, khoảng trắng cân đối và bố cục chuyên nghiệp. Kỹ năng này hữu ích cho Resume Formatter trong viết CV, nộp đơn xin việc và thiết kế lại CV cần dễ đọc trên màn hình lẫn bản in.

Resume Writing
Yêu thích 0GitHub 443
M
analyzing-malicious-pdf-with-peepdf

bởi mukul975

analyzing-malicious-pdf-with-peepdf là một kỹ năng phân tích mã độc tĩnh dành cho các tệp PDF đáng ngờ. Dùng peepdf, pdfid và pdf-parser để sàng lọc tệp đính kèm phishing, kiểm tra các đối tượng, trích xuất JavaScript hoặc shellcode nhúng, và xem xét an toàn các luồng dữ liệu đáng ngờ mà không cần thực thi.

Malware Analysis
Yêu thích 0GitHub 0
M
analyzing-pdf-malware-with-pdfid

bởi mukul975

analyzing-pdf-malware-with-pdfid là một kỹ năng sàng lọc mã độc PDF để phát hiện JavaScript nhúng, dấu hiệu khai thác, object stream, tệp đính kèm và các hành vi đáng ngờ trước khi mở file. Kỹ năng này hỗ trợ phân tích tĩnh cho điều tra PDF độc hại, ứng phó sự cố và quy trình bảo mật/audit với analyzing-pdf-malware-with-pdfid.

Security Audit
Yêu thích 0GitHub 0
K
kreuzberg

bởi kreuzberg-dev

Kreuzberg skill giúp bạn cài đặt và dùng Kreuzberg để trích xuất tài liệu trên hơn 91 định dạng, bao gồm PDF, file Office, hình ảnh, HTML, email và archive. Nội dung bao phủ các quy trình với Python, Node.js/TypeScript, Rust và CLI cho OCR, bảng biểu, metadata, xử lý hàng loạt và hướng dẫn phân tích cú pháp thực tế.

PDF Processing
Yêu thích 0GitHub 0
P
nutrient-document-processing

bởi PSPDFKit-labs

nutrient-document-processing là một skill quy trình cho xử lý PDF với Nutrient DWS. Skill này giúp bạn cài đặt, hiểu và sử dụng các luồng xử lý tài liệu có thể lặp lại cho các tác vụ như chuyển đổi, gộp, tách, OCR, trích xuất, che/redact, ký, tối ưu hóa và xuất đầu ra tuân thủ như PDF/A hoặc PDF/UA.

PDF Processing
Yêu thích 0GitHub 0
M
minimax-pdf

bởi MiniMax-AI

Kỹ năng minimax-pdf giúp bạn tạo, điền hoặc định dạng lại các PDF chỉn chu khi chất lượng hình ảnh và nhận diện tài liệu là yếu tố quan trọng. Hãy dùng cho các quy trình CREATE, FILL hoặc REFORMAT với hệ thống thiết kế dựa trên token, biến đầu vào thô thành đầu ra sẵn sàng in. Hướng dẫn này bao gồm cài đặt minimax-pdf, cách dùng minimax-pdf và cách chọn luồng xử lý để đạt kết quả tốt hơn.

PDF Processing
Yêu thích 0GitHub 0
O
pdf

bởi openai

Dùng kỹ năng pdf cho các tác vụ xử lý PDF khi bố cục, phân trang và đầu ra hiển thị là yếu tố quan trọng. Kỹ năng này giúp bạn đọc, tạo, chỉnh sửa và rà soát PDF theo quy trình ưu tiên hình ảnh: render trang, xem kết quả rồi tinh chỉnh. Hãy dùng khi bạn cần cài đặt pdf đáng tin cậy, cách dùng pdf rõ ràng, và một hướng dẫn pdf thực tế để đảm bảo độ chính xác của tài liệu.

PDF Processing
Yêu thích 0GitHub 0