OCR Extraction

Kham pha Agent Skill cho OCR Extraction trong Xu ly du lieu va so sanh workflow, cong cu va tinh huong lien quan.

10 skills

nutrient-document-processing

bởi affaan-m

Skill nutrient-document-processing dành cho xử lý PDF và tự động hóa tài liệu với Nutrient DWS API. Chuyển đổi, OCR, trích xuất, che/redact, ký, thêm watermark và điền biểu mẫu cho các tệp như PDF, DOCX, XLSX, PPTX, HTML và hình ảnh.

PDF Processing

Yêu thích 0GitHub 156.2k

pdf

bởi anthropics

Kỹ năng pdf hỗ trợ các tác vụ xử lý PDF như trích xuất văn bản, gộp và tách file, render trang thành ảnh và quy trình làm việc với biểu mẫu PDF. Đặc biệt hữu ích khi kiểm tra trường điền, lấy metadata biểu mẫu và xác thực bố cục biểu mẫu không điền được bằng script.

PDF Processing

Yêu thích 0GitHub 105.1k

azure-ai-document-intelligence-ts

bởi microsoft

azure-ai-document-intelligence-ts là một skill TypeScript để trích xuất văn bản, bảng, các trường key-value và dữ liệu có cấu trúc bằng Azure Document Intelligence. Hãy dùng nó cho OCR Extraction từ hóa đơn, biên lai, giấy tờ tùy thân và biểu mẫu, hoặc khi bạn cần quy trình làm việc với mô hình dựng sẵn và mô hình tùy chỉnh trong Node.js với xác thực Azure REST SDK.

OCR Extraction

Yêu thích 0GitHub 2.3k

azure-ai-contentunderstanding-py

bởi microsoft

azure-ai-contentunderstanding-py là skill Python cho Azure AI Content Understanding. Nó trích xuất nội dung có cấu trúc từ tài liệu, hình ảnh, âm thanh và video để phục vụ RAG và tự động hóa. Hãy dùng khi bạn cần trích xuất đa phương thức đáng tin cậy, xác thực Azure và đầu ra lặp lại, sẵn sàng cho pipeline.

RAG Workflows

Yêu thích 0GitHub 2.2k

azure-ai-formrecognizer-java

bởi microsoft

Skill azure-ai-formrecognizer-java giúp lập trình viên Java dùng Azure AI Document Intelligence để trích xuất OCR, bảng biểu, cặp khóa-giá trị, hóa đơn, biên lai, giấy tờ tùy thân và các mô hình tài liệu tùy chỉnh. Skill này bám theo SDK com.azure:azure-ai-documentintelligence hiện tại và rất hữu ích khi bạn cần thiết lập Java thực tế, hướng dẫn API và phân tích tài liệu lặp lại, có thể tái sử dụng.

OCR Extraction

Yêu thích 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

bởi microsoft

azure-ai-document-intelligence-dotnet giúp lập trình viên .NET cài đặt và sử dụng Azure AI Document Intelligence để trích xuất văn bản, bảng biểu, cặp khóa-giá trị và các trường có cấu trúc từ hóa đơn, biên lai, giấy tờ tùy thân và tài liệu tùy chỉnh. Nội dung bao gồm hướng dẫn thiết lập thực tế, xác thực và OCR Extraction để phân tích tài liệu một cách đáng tin cậy.

OCR Extraction

Yêu thích 0GitHub 2.2k

transcribe-video

bởi rameerez

Skill transcribe-video chuyển tệp video hoặc âm thanh thành các đầu ra .srt, .vtt và .txt bằng AWS Transcribe. Hãy dùng nó khi bạn cần transcribe-video để tạo phụ đề, bản chép có thể tìm kiếm, hoặc bản văn sạch của nội dung lời nói. Skill này cũng phù hợp cho các quy trình chuyển đổi định dạng với transcribe-video.

Format Conversion

Yêu thích 0GitHub 23

pdf

bởi K-Dense-AI

Skill pdf là một hướng dẫn thực tế cho PDF Processing khi bạn cần đọc, trích xuất, chuyển đổi hoặc tạo file PDF trong một workflow có thể triển khai được. Nội dung bao gồm trích xuất văn bản, gộp, tách, xoay trang, điền biểu mẫu, mã hóa, trích xuất ảnh và OCR cho PDF quét. Hãy dùng nó khi bạn cần một hướng dẫn pdf có thể lặp lại thay vì một prompt dùng một lần.

PDF Processing

Yêu thích 0GitHub 0

kreuzberg

bởi kreuzberg-dev

Kreuzberg skill giúp bạn cài đặt và dùng Kreuzberg để trích xuất tài liệu trên hơn 91 định dạng, bao gồm PDF, file Office, hình ảnh, HTML, email và archive. Nội dung bao phủ các quy trình với Python, Node.js/TypeScript, Rust và CLI cho OCR, bảng biểu, metadata, xử lý hàng loạt và hướng dẫn phân tích cú pháp thực tế.

PDF Processing

Yêu thích 0GitHub 0

nutrient-document-processing

bởi PSPDFKit-labs

nutrient-document-processing là một skill quy trình cho xử lý PDF với Nutrient DWS. Skill này giúp bạn cài đặt, hiểu và sử dụng các luồng xử lý tài liệu có thể lặp lại cho các tác vụ như chuyển đổi, gộp, tách, OCR, trích xuất, che/redact, ký, tối ưu hóa và xuất đầu ra tuân thủ như PDF/A hoặc PDF/UA.

PDF Processing

Yêu thích 0GitHub 0