pdf

작성자 anthropics

pdf 스킬은 텍스트 추출, 병합·분할, 페이지 이미지 렌더링, PDF 폼 처리 같은 PDF Processing 작업을 안내합니다. 채울 수 있는 필드 확인, 폼 메타데이터 추출, 스크립트를 통한 비입력형 폼 레이아웃 검증에 특히 유용합니다.

Stars105.1k

즐겨찾기0

추가됨2026년 3월 28일

카테고리PDF Processing

설치 명령어

npx skills add anthropics/skills --skill pdf

큐레이션 점수

이 스킬은 84/100점으로, PDF를 다뤄야 하는 에이전트에 잘 맞는 강력한 디렉터리 후보입니다. 트리거 범위가 넓고 절차형 설명이 충실하며, 특히 폼 작성 관련 보조 스크립트가 구체적이어서 일반적인 프롬프트보다 시행착오를 줄이고 작업에 들어가기 쉽습니다. 다만 필요한 환경과 설정 조건은 스킬 자체에서 완전히 명확하게 정리돼 있지는 않습니다.

84/100

강점

트리거 적합성이 매우 높습니다. 사용자가 .pdf를 언급하거나 PDF 생성 요청을 하면 사용하라고 설명에 명시돼 있고, 흔한 PDF 작업도 폭넓게 열거합니다.
실무에 바로 도움이 되는 워크플로 콘텐츠가 있습니다. SKILL.md는 핵심 PDF 작업 예시를 제공하고, forms.md는 입력형 폼과 비입력형 폼을 나눠 순서 있는 지침과 명령 수준의 단계를 안내합니다.
포함된 스크립트가 실제 실행력을 높여 줍니다. 이 repo에는 폼 필드 점검, 구조 추출, PDF의 이미지 변환, 바운딩 박스 검증, 폼 채우기용 유틸리티가 여러 개 포함돼 있습니다.

주의점

설치·런타임 요구사항이 명확히 패키징돼 있기보다 암시적으로 드러납니다. SKILL.md에 설치 명령은 없지만, 실제로는 Python 라이브러리와 커맨드라인 도구에 의존합니다.
다루는 범위는 매우 넓지만, 일부 고급 기능은 참고 자료 쪽에 맡겨져 있어 사용자 입장에서는 어떤 라이브러리와 접근 방식을 쓸지 추가 판단이 필요할 수 있습니다.

Pdf OCR Python Cli Workflow

개요

pdf 스킬 개요

pdf 스킬이 하는 일

pdf 스킬은 PDF Processing 작업을 위한 실전형 가이드로, 반복적인 문서 처리와 폼 워크플로우에서 특히 강점을 발휘합니다. PDF 읽기, 텍스트 추출, 파일 병합/분할, 페이지를 이미지로 렌더링하는 작업은 물론, 특히 PDF 폼을 올바르게 채우는 데 필요한 도구 선택과 작업 순서를 에이전트가 판단할 수 있도록 도와줍니다.

어떤 사용자가 pdf 스킬을 설치하면 좋은가

이 pdf skill은 자동화, 데이터 입력, 문서 파이프라인, 에이전트 워크플로우에서 PDF를 자주 다루는 사용자에게 가장 잘 맞습니다. 단순히 “PDF 라이브러리를 쓰세요” 수준의 일반론이 아니라, 입력 가능한 폼과 비입력형 폼을 구분하는 방법, 페이지 렌더링, 검증까지 포함한 구체적인 처리 경로가 필요하다면 특히 적합합니다.

실제로 해결하려는 일

대부분의 사용자는 장황한 PDF 이론서가 필요하지 않습니다. 실제로 필요한 것은 다음과 같은 질문에 안정적으로 답할 수 있는 방법입니다.

“이 PDF에서 텍스트를 어떻게 추출하지?”
“페이지를 안전하게 병합하거나 분할하려면?”
“이 폼에는 실제 입력 가능한 필드가 있나?”
“없다면 값을 어디에 써야 하는지 어떻게 찾지?”
“필드 박스가 서로 겹치지 않는지 어떻게 검증하지?”

이 스킬의 장점은 이런 질문을 에이전트의 추측에 맡기지 않고, 실제 작업 흐름으로 바꿔준다는 점입니다.

일반적인 프롬프트와 다른 pdf의 차별점

가장 큰 차이는 폼 처리에 대한 엄격한 분기와 운영 규칙입니다. 저장소에는 forms.md의 전용 지침과 함께 다음과 같은 헬퍼 스크립트가 포함되어 있습니다.

scripts/check_fillable_fields.py
scripts/extract_form_field_info.py
scripts/extract_form_structure.py
scripts/fill_fillable_fields.py
scripts/fill_pdf_form_with_annotations.py
scripts/check_bounding_boxes.py
scripts/create_validation_image.py

즉, 이 pdf guide는 단순히 라이브러리 목록을 보여주는 수준이 아닙니다. 폼 처리와 검증을 위한 의사결정 경로를 제공하며, 바로 이 지점이 많은 PDF 자동화가 실패하는 구간입니다.

잘 맞는 경우와 안 맞는 경우

pdf for PDF Processing은 Python 기반 워크플로우, 이미지 변환, 렌더링, 폼 채우기 작업에서 바로 실행 가능한 지침이 필요할 때 쓰기 좋습니다.

반대로 표준 라이브러리 호출 한 줄만 빨리 확인하면 되는 경우나, 전체 스택이 Python 바깥에 있고 reference.md의 예시를 직접 옮겨올 생각이 없다면 매력도가 떨어질 수 있습니다.

pdf 스킬 사용 방법

pdf 설치 맥락

Anthropic skills 저장소에서 다음 명령으로 설치합니다:

npx skills add https://github.com/anthropics/skills --skill pdf

설치 후에는 최상위 파일만 훑지 말고 실제 스킬 디렉터리를 기준으로 작업하는 것이 좋습니다. 가장 중요한 내용이 SKILL.md, forms.md, reference.md, 그리고 scripts/ 폴더에 나뉘어 들어 있기 때문입니다.

먼저 읽어야 할 파일

빠르게 적응하려면 다음 순서로 여세요:

SKILL.md
forms.md
reference.md
scripts/check_fillable_fields.py
scripts/extract_form_field_info.py
scripts/fill_fillable_fields.py

이 순서가 중요한 이유:

SKILL.md는 자주 쓰는 작업과 라이브러리 방향을 먼저 잡아줍니다.
forms.md는 폼 작업에서 필요한 엄격한 분기 로직을 담고 있습니다.
reference.md는 렌더링과 JavaScript 선택지까지 확장해 설명합니다.
스크립트는 실제로 어떤 입력과 출력이 기대되는지 보여줍니다.

코드 작성 전에 올바른 워크플로우부터 고르기

좋은 pdf usage 패턴은 먼저 작업 유형을 분류하는 것에서 시작합니다:

텍스트 추출
페이지 조작
PDF 페이지를 이미지로 렌더링
폼 채우기
데이터로부터 PDF 생성

이 단계를 먼저 해야 하는 이유는, 폼 작업이 병합/분할/추출 작업과 완전히 다른 경로를 따르기 때문입니다. 저장소도 폼 채우기를 임시방편 코드부터 시작하면 안 된다고 분명히 안내합니다.

일반적인 PDF 작업 처리 방법

기본적인 PDF Processing에서는 이 스킬이 우선적으로 pypdf를 권장합니다. 기본 경로는 다음 작업입니다:

PDF 읽기
페이지 수 세기
텍스트 추출
파일 병합
페이지 분할

작업이 “이 파일들을 합쳐줘” 또는 “페이지별로 텍스트를 추출해줘” 수준이라면, SKILL.md의 예시가 가장 빠른 출발점입니다.

렌더링과 이미지 변환 처리 방법

페이지 스크린샷, 미리보기, 육안 검수, 이미지 기반 후처리가 목적이라면 렌더링 중심 자료를 보세요:

reference.md의 pypdfium2
PNG 변환용 scripts/convert_pdf_to_images.py

이 부분은 단순 텍스트 추출만으로는 부족한 경우에 중요합니다. 예를 들어 스캔 PDF, 시각적 폼 검토, 주석을 넣기 전 페이지 레이아웃 검증 같은 작업이 그렇습니다.

PDF 폼에서 가장 중요한 분기

폼 작업에서는 일반 프롬프트보다 훨씬 엄격한 절차를 따릅니다. 먼저 아래 명령부터 실행하세요:

python scripts/check_fillable_fields.py <file.pdf>

이 한 단계가 많은 자동화를 막아 세우는 첫 번째 판단 포인트입니다:

PDF에 입력 가능한 필드가 있으면, 필드 정보를 추출한 뒤 해당 필드를 직접 채웁니다.
입력 가능한 필드가 없으면, forms.md의 비입력형 폼 워크플로우로 가야 하며 여기서는 시각 구조와 bounding box를 사용합니다.

이 확인을 건너뛰는 것이 시간을 가장 많이 낭비하는 실수입니다.

더 좋은 pdf 결과를 만드는 입력 정보

pdf skill을 호출할 때는 다음 정보를 함께 주는 편이 좋습니다:

정확한 파일 경로 또는 파일명
PDF가 디지털 PDF인지 스캔본인지
원하는 출력 형식
폼이 입력 가능한지 여부
텍스트 정확도가 중요한지, 레이아웃 보존이 중요한지, 시각적 출력이 필요한지
로컬에서 Python 스크립트를 실행할 수 있는지

약한 요청 예:

“이 PDF 좀 도와줘.”

강한 요청 예:

“6페이지짜리 정부 서식 PDF를 채워야 합니다. 먼저 입력 가능한 필드가 있는지 확인하세요. 있으면 필드 메타데이터를 JSON으로 추출하고, 없으면 페이지를 이미지로 변환한 뒤 입력 영역을 식별하고 값을 넣기 전에 validation image를 생성하세요.”

이처럼 요청을 구체화하면 에이전트가 처음부터 맞는 경로로 들어갈 수 있습니다.

pdf 스킬을 잘 프롬프트하는 방법

안정적인 프롬프트 형식은 다음과 같습니다:

목표
파일
제약 조건
원하는 출력
검증 요구사항

예시:

Goal: report.pdf에서 표와 페이지 텍스트를 추출
Constraints: Python only, no cloud OCR
Desired output: CSV tables plus a text dump per page
Validation: preserve page numbers and report pages with no text

그냥 “PDF 추출”만 요청하는 것보다 이 방식이 낫습니다. 이 스킬은 여러 방법을 다루며, 품질은 올바른 방법을 고르는 데 크게 좌우되기 때문입니다.

입력 가능한 PDF를 위한 폼 워크플로우

PDF에 실제 필드가 있다면 다음 단계로 가장 유용한 명령은 이것입니다:

python scripts/extract_form_field_info.py <input.pdf> <field_info.json>

추출된 JSON에는 필드 ID, 페이지 번호, 사각형 좌표, 그리고 다음과 같은 필드 타입이 포함됩니다:

text
checkbox
radio_group
choice

폼 처리에서 이 부분이 pdf guide의 실질적인 핵심입니다. 눈대중으로 위치를 추정하는 대신, 구조화된 대상 정보를 확보할 수 있기 때문입니다.

비입력형 PDF를 위한 폼 워크플로우

PDF가 입력 가능하지 않다면, forms.md는 값을 넣을 위치를 시각적으로 판단해야 한다고 안내합니다. 관련 스크립트를 보면 대략 다음과 같은 흐름입니다:

PDF를 이미지로 변환
폼 구조와 bounding box 추론
박스 배치 검증
annotation 또는 채워진 출력 작성

입력 가능한 필드를 직접 다루는 방식보다 느리지만, 저장소는 “그냥 OCR 돌리세요” 같은 단순한 답보다 훨씬 현실적인 경로를 제공합니다.

출력을 신뢰하기 전에 검증 스크립트 사용하기

다음 두 스크립트는 신뢰도를 실제로 크게 높여줍니다:

scripts/check_bounding_boxes.py
scripts/create_validation_image.py

비입력형 폼이나 추론된 필드 위치를 다룰 때는 반드시 활용하는 편이 좋습니다. 최종 결과를 만들기 전에 입력 영역 겹침, 레이블 충돌, 위치 지정 실수를 잡아내는 데 도움이 됩니다.

이 점이 바로 이 pdf install의 실제 도입 장점입니다. 단순 변환 코드만 있는 것이 아니라, 검증용 헬퍼까지 포함되어 있습니다.

스킬 내부의 라이브러리와 도구 선택

저장소가 실무적으로 나누는 도구 역할은 다음과 같습니다:

일반 문서 작업은 pypdf
렌더링과 이미지 중심 작업은 pypdfium2
PNG 변환은 헬퍼 스크립트에서 pdf2image
생성/조작을 JavaScript로 하고 싶다면 reference.md의 pdf-lib

이 pdf skill을 설치할지 판단 중이라면, 이런 도구 범위는 꽤 유용한 정보입니다. 하나의 라이브러리에 묶여 있지는 않지만, 동시에 기본 경로는 분명하게 제시되어 있습니다.

pdf 스킬 FAQ

이 pdf 스킬은 폼 채우기 전용인가요?

아니요. pdf skill은 추출, 병합/분할, 렌더링, 생성, 일반적인 PDF 조작도 다룹니다. 다만 일반적인 프롬프트보다 더 큰 의사결정 가치를 주는 구간은 폼 워크플로우입니다.

pdf는 초보자에게도 괜찮나요?

네, 로컬에서 Python 스크립트를 실행할 수 있다면 괜찮습니다. 초보자라면 먼저 SKILL.md에서 단순 작업부터 시작하고, 실제 작업이 폼일 때만 forms.md로 넘어가는 경로가 가장 좋습니다. 스크립트가 추측을 줄여주긴 하지만, 로컬 Python 환경과 기본적인 커맨드라인 사용에는 어느 정도 익숙해야 합니다.

일반적인 LLM 프롬프트보다 이 스킬이 더 잘하는 것은 무엇인가요?

입력 가능한 PDF와 비입력형 PDF를 어떻게 분기할지에 대한 구체적인 워크플로우와 검증 도구를 제공합니다. 일반 프롬프트는 라이브러리 추천 정도에 그치기 쉽지만, 이 스킬은 언제 필드를 검사해야 하는지, 언제 페이지를 렌더링해야 하는지, bounding box를 어떻게 검증해야 하는지까지 보여줍니다.

언제 이 pdf guide를 쓰지 말아야 하나요?

다음 경우에는 이 pdf guide에 기대지 않는 편이 좋습니다:

스킬/워크플로우가 아니라 완성형 사용자 앱이 필요한 경우
로컬 스크립트를 실행할 수 없는 경우
저장소가 명시적으로 지원하는 범위를 넘어서는 고급 OCR 중심 파이프라인이 필요한 경우
혼합형 레퍼런스 툴킷보다 하나의 강한 프로덕션 프레임워크를 원하는 경우

pdf는 JavaScript도 지원하나요?

부분적으로는 그렇습니다. 주된 워크플로우는 Python 우선이지만, reference.md에는 JavaScript용 pdf-lib 예시도 포함되어 있습니다. 팀이 JS 중심이라면 개념 정리와 작업 분해에는 여전히 도움이 되지만, 실제 운영 지원은 Python 쪽이 더 강합니다.

이 스킬로 스캔 PDF도 처리할 수 있나요?

부분적으로 가능합니다. 페이지를 이미지로 렌더링하고 시각 처리 중심으로 워크플로우를 구성하는 데는 도움이 됩니다. 다만 스캔 PDF는 OCR이나 시각적 위치 추론 로직이 필요한 경우가 많아서, 결과 품질은 문서 상태와 후속 도구 선택에 크게 좌우됩니다.

pdf 스킬을 더 잘 활용하는 방법

올바른 PDF 진단부터 시작하기

pdf usage를 개선하는 가장 좋은 방법은 작업 전에 문서를 먼저 분류하는 것입니다:

텍스트 기반인지 스캔본인지
입력 가능한 폼인지 비입력형인지
문서 추출 작업인지 폼 작성 작업인지
시각적 충실도가 중요한지 텍스트 충실도가 중요한지

대부분의 실패는 코드 문법이 아니라, 처음에 잘못된 경로를 고르는 데서 생깁니다.

더 강한 작업 입력 제공하기

입력이 좋아야 결과도 좋아집니다. 가능하면 다음 정보를 포함하세요:

샘플 파일명
페이지 수
표, 폼, 서명이 있는지 여부
편집 가능한 출력이 필요한지, 아니면 데이터 추출만 필요한지
채워야 할 정확한 필드 목록, 가능하면 JSON 매핑 형태로

특히 폼 작업에서는 장문의 설명문보다 이런 구조화된 입력이 훨씬 낫습니다. 스크립트와 워크플로우가 원래 구조화된 데이터와 잘 맞물리기 때문입니다.

크게 돌리기 전에 먼저 검증하기

처음부터 200개 PDF에 테스트하지 마세요. 대표성 있는 파일 하나에 pdf skill을 적용하고 다음을 확인해야 합니다:

텍스트 추출 품질
필드 메타데이터 완전성
페이지 이미지 렌더링
bounding box 겹침 경고
최종 시각 출력

이런 소규모 검증이 나중에 비용이 커지는 오류를 초기에 잡아줍니다.

pdf 워크플로우의 흔한 실패 패턴

다음 실수를 주의하세요:

확인도 하지 않고 PDF가 입력 가능하다고 가정하는 것
스캔 파일에 텍스트 추출을 적용해 거의 빈 결과를 받는 것
필드 ID와 필드 타입을 확인하기도 전에 값을 써 넣는 것
비입력형 폼에서 validation image를 생략하는 것
렌더링 결과를 구조화된 텍스트 추출처럼 취급하는 것

바로 이런 지점에서 저장소의 스크립트가 도움이 됩니다.

전체 워크플로우를 요청하도록 프롬프트 개선하기

pdf for PDF Processing에 더 적합한 프롬프트는 에이전트에게 다음을 요청합니다:

문서 유형 식별
라이브러리/도구 경로 선택
중간 결과 제시
최종화 전에 검증

예시:
“Use the pdf skill to inspect application.pdf. First check if it has fillable fields. If yes, extract field metadata and propose a JSON payload for completion. If no, convert each page to images, identify entry regions, generate a validation image for page 1, and only then suggest the filling approach.”

이런 형태의 프롬프트는 정확도와 신뢰도를 함께 끌어올립니다.

첫 결과 이후에는 좁혀서 반복하기

첫 결과가 약하다면 그냥 “더 잘해줘”라고 하지 마세요. 더 좁은 수정 요청을 하는 편이 낫습니다:

“텍스트 추출 결과가 거의 없었으니 렌더링된 이미지 기준으로 다시 실행해줘.”
“모든 checkbox와 radio 필드를 따로 나열해줘.”
“2페이지와 3페이지에 대한 validation overlay를 생성해줘.”
“원래 페이지 순서를 유지하고 페이지별로 파일 하나씩 출력해줘.”

이처럼 구체적인 반복 요청이 있어야 pdf skill이 막연한 재시도보다 훨씬 효과적으로 작동합니다.

저장소 스크립트를 판단 기준으로 삼기

에이전트 출력과 실제 문서 상태가 다를 때는 자유형 추론보다 저장소 스크립트를 더 신뢰하세요. 이 스킬에서는 스크립트가 가장 강한 운영 기준점입니다. 기대 입력, 필드 구조, 검증 방식이 바로 거기에 정의되어 있기 때문입니다.

도입 시 감수해야 할 트레이드오프 알기

PDF 폼, 레이아웃 민감한 워크플로우, 반복적인 문서 처리가 업무의 일부라면 이 pdf install은 충분히 가치가 있습니다. 반대로 가끔 페이지 병합만 하는 정도라면 일반 프롬프트로도 충분할 수 있습니다. 이 스킬은 일회성 조언보다, 반복 가능하고 검증 가능한 PDF Processing이 필요할 때 가장 큰 효과를 냅니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

kreuzberg

작성자 kreuzberg-dev

이 kreuzberg 스킬은 PDF, Office 파일, 이미지, HTML, 이메일, 아카이브를 포함한 91개 이상 형식에서 Kreuzberg를 설치하고 사용하는 방법을 안내합니다. OCR, 표, 메타데이터, 일괄 처리, 실전 파싱 가이드를 아우르며 Python, Node.js/TypeScript, Rust, CLI 워크플로까지 폭넓게 다룹니다.

PDF Processing

즐겨찾기 0GitHub 0

azure-ai-document-intelligence-ts

작성자 microsoft

azure-ai-document-intelligence-ts는 Azure Document Intelligence로 텍스트, 표, 키-값 필드, 구조화된 데이터를 추출하는 TypeScript 스킬입니다. 송장, 영수증, 신분증, 양식에서 OCR 추출이 필요할 때, 또는 Node.js에서 Azure REST SDK 인증을 사용해 사전 빌드 및 사용자 지정 모델 워크플로가 필요할 때 적합합니다.

OCR Extraction

즐겨찾기 0GitHub 2.3k

azure-ai-contentunderstanding-py

작성자 microsoft

azure-ai-contentunderstanding-py는 Azure AI Content Understanding용 Python 스킬입니다. 문서, 이미지, 오디오, 비디오에서 구조화된 콘텐츠를 추출해 RAG 워크플로와 자동화에 활용할 수 있습니다. 신뢰할 수 있는 멀티모달 추출, Azure 인증, 그리고 반복 가능한 파이프라인용 출력을 필요로 할 때 적합합니다.

RAG Workflows

즐겨찾기 0GitHub 2.2k

azure-ai-document-intelligence-dotnet

작성자 microsoft

azure-ai-document-intelligence-dotnet은 .NET 개발자가 Azure AI Document Intelligence를 설치하고 활용해 송장, 영수증, 신분증, 사용자 지정 문서에서 텍스트, 표, 키-값 쌍, 구조화된 필드를 추출하도록 돕습니다. 신뢰할 수 있는 문서 분석을 위한 실무 중심의 설정, 인증, OCR 추출 가이드를 포함합니다.

OCR Extraction

즐겨찾기 0GitHub 2.2k

nutrient-document-processing

작성자 PSPDFKit-labs

nutrient-document-processing은 Nutrient DWS를 활용한 PDF 처리용 워크플로 스킬입니다. 변환, 병합, 분할, OCR, 추출, 삭제(redact), 서명, 최적화, 그리고 PDF/A나 PDF/UA 같은 컴플라이언스 출력까지, 반복 가능한 문서 워크플로를 설치하고 이해하고 활용하는 데 도움을 줍니다.

PDF Processing

즐겨찾기 0GitHub 0

visa-doc-translate

작성자 affaan-m

visa-doc-translate는 비자 신청 서류 이미지를 영어로 번역하고, 원본 페이지와 번역본을 함께 담은 이중언어 PDF를 생성합니다. 구조화된 비자 서류, OCR 대체 처리, 회전 보정, 이름·날짜·금액 보존을 고려해 설계되었습니다.

Translation

즐겨찾기 0GitHub 156.3k

nutrient-document-processing

작성자 affaan-m

Nutrient DWS API를 활용한 PDF 처리 및 문서 자동화용 nutrient-document-processing skill입니다. PDF, DOCX, XLSX, PPTX, HTML, 이미지 같은 파일을 변환, OCR, 추출, 마스킹, 서명, 워터마크 추가, 채우기까지 처리할 수 있습니다.

PDF Processing

즐겨찾기 0GitHub 156.2k

hv-analysis

작성자 KKKKhazix

hv-analysis는 제품, 회사, 개념, 기술, 인물을 구조화된 분석 보고서로 바꾸는 수평-수직 리서치 스킬입니다. 심층 조사, 경쟁 비교, 보고서용 결과물이 필요할 때 hv-analysis를 사용하세요. 특히 Data Analysis나 세련된 PDF 워크플로우를 위한 hv-analysis가 필요할 때 유용합니다.

Data Analysis

즐겨찾기 0GitHub 9k

azure-ai-formrecognizer-java

작성자 microsoft

azure-ai-formrecognizer-java 스킬은 Java 개발자가 Azure AI Document Intelligence를 활용해 OCR 추출, 표, 키-값 쌍, 청구서, 영수증, 신분증, 사용자 지정 문서 모델을 다루는 데 도움을 줍니다. 현재 `com.azure:azure-ai-documentintelligence` SDK와 맞춰져 있으며, 실무적인 Java 설정, API 안내, 반복 가능한 문서 분석이 필요할 때 유용합니다.

OCR Extraction

즐겨찾기 0GitHub 2.2k

markitdown

작성자 K-Dense-AI

markitdown은 파일과 오피스 문서를 Markdown으로 변환해 더 쉽게 읽고, 청킹하고, 검색하고, LLM 워크플로에 활용할 수 있게 해줍니다. 이 markitdown 스킬은 PDF, DOCX, PPTX, XLSX, HTML, CSV, JSON, XML, ZIP, EPUB, OCR이 포함된 이미지, 음성 전사까지 지원해 형식 변환용 markitdown 가이드로 실용적입니다.

Format Conversion

즐겨찾기 0GitHub 0

analyzing-malicious-pdf-with-peepdf

작성자 mukul975

analyzing-malicious-pdf-with-peepdf는 의심스러운 PDF를 위한 정적 악성코드 분석 skill입니다. peepdf, pdfid, pdf-parser를 사용해 피싱 첨부파일을 분류하고, 객체를 검사하고, 포함된 JavaScript나 shellcode를 추출하며, 실행 없이 수상한 스트림을 안전하게 검토할 수 있습니다.

Malware Analysis

즐겨찾기 0GitHub 0

analyzing-pdf-malware-with-pdfid

작성자 mukul975

analyzing-pdf-malware-with-pdfid는 파일을 열기 전에 내장 JavaScript, 익스플로잇 흔적, 오브젝트 스트림, 첨부 파일, 수상한 동작을 찾아내는 PDF 악성코드 분류 스킬입니다. 악성 PDF 조사, 사고 대응, Security Audit 워크플로에서의 정적 분석을 지원합니다.

Security Audit

즐겨찾기 0GitHub 0

pdf

작성자 openai

레이아웃, 페이지 구성, 렌더링 결과가 중요한 PDF Processing 작업에 pdf 스킬을 사용하세요. 페이지를 렌더링해 결과를 확인하고, 그다음 조정하는 시각 중심 워크플로로 PDF를 읽고, 만들고, 편집하고, 검토할 수 있습니다. 신뢰할 수 있는 PDF 설치, pdf 사용법, 문서 정확도를 위한 실용적인 pdf 가이드가 필요할 때 적합합니다.

PDF Processing

즐겨찾기 0GitHub 0

pdf

작성자 K-Dense-AI

pdf skill은 워크플로에 바로 넣어 쓸 수 있는 PDF Processing 실무 가이드입니다. PDF 파일을 읽고, 추출하고, 변환하거나 새로 만들 때 도움이 되며, 텍스트 추출, 병합, 분할, 회전, 폼 입력, 암호화, 이미지 추출, 스캔 PDF용 OCR까지 다룹니다. 일회성 프롬프트 대신 반복해서 쓸 수 있는 pdf 가이드가 필요할 때 적합합니다.

PDF Processing

즐겨찾기 0GitHub 0

Resume Formatter

작성자 Paramchoudhary

Resume Formatter는 어수선한 이력서를 명확한 계층 구조, 균형 잡힌 여백, 전문적인 구성의 깔끔한 ATS 친화적 문서로 다듬는 데 도움을 줍니다. 이 스킬은 Resume Formatter for Resume Writing, 구직 지원, 그리고 화면과 종이에서 모두 읽기 쉬워야 하는 재디자인 작업에 유용합니다.

Resume Writing

즐겨찾기 0GitHub 443

minimax-pdf

작성자 MiniMax-AI

minimax-pdf 스킬은 시각적 완성도와 문서 고유성이 중요한 상황에서 세련된 PDF를 만들고, 채우고, 재구성하는 데 도움을 줍니다. 거친 입력을 인쇄용 출력물로 바꾸는 토큰 기반 디자인 시스템을 통해 CREATE, FILL, REFORMAT 워크플로우에 활용할 수 있습니다. 이 가이드는 minimax-pdf 설치, minimax-pdf 사용법, 그리고 더 나은 결과를 위한 경로 선택을 다룹니다.

PDF Processing

즐겨찾기 0GitHub 0