rdkit

작성자 K-Dense-AI

RDKit 스킬은 정밀한 화학정보학 워크플로를 지원합니다. SMILES, SDF, MOL, PDB, InChI 파싱부터 descriptor 계산, fingerprint 생성, substructure search, 반응 처리, 2D/3D 좌표 생성까지 다룹니다. 이 RDKit 가이드는 고급 제어, 사용자 정의 sanitization, 그리고 Data Analysis 워크플로에서의 RDKit 활용에 적합합니다.

Stars21.4k

즐겨찾기0

추가됨2026년 5월 14일

카테고리Data Analysis

설치 명령어

npx skills add K-Dense-AI/claude-scientific-skills --skill rdkit

큐레이션 점수

이 스킬은 84/100점으로, RDKit 특화 화학정보학 제어가 필요한 사용자에게 충분히 신뢰할 만한 디렉터리 항목입니다. 저장소에는 실제 워크플로 내용, 명확한 사용 트리거, 그리고 일반적인 프롬프트보다 시행착오를 줄여 주는 보조 스크립트가 포함되어 있습니다. 다만 즉시 실행 가능한 턴키형이라기보다 참고 자료 성격이 더 강합니다.

84/100

강점

RDKit을 언제 쓰고 datamol을 언제 쓸지 명확히 구분해, 고급 분자 제어에 맞는 도구 선택을 돕습니다.
SKILL.md에 상당한 분량의 워크플로가 정리되어 있고, properties, similarity search, substructure filtering용 보조 스크립트 3개가 함께 제공됩니다.
API 호출, descriptor, SMARTS pattern용 참고 파일이 뒷받침되어 있어 트리거 정확도와 작업 명확성이 높습니다.

주의점

SKILL.md에 설치 명령이 없어, 환경 설정은 별도로 처리해야 할 수 있습니다.
일부 내용은 단계별 안내보다 참고용 설명에 가깝기 때문에, 처음 사용하는 경우에는 여전히 RDKit에 대한 기본 이해가 필요할 수 있습니다.

Python Chemistry Drug Discovery Bioinformatics

개요

rdkit 스킬 개요

rdkit의 용도

rdkit 스킬은 분자 데이터를 정밀하게 다뤄야 하는 케모인포매틱스 작업에 적합합니다. SMILES, SDF/MOL/PDB/InChI를 파싱하고, descriptor를 계산하고, fingerprint를 생성하고, substructure search를 수행하고, reaction이나 2D/3D coordinate를 다루는 작업이 여기에 해당합니다. 단순한 프롬프트만으로는 부족하고, rdkit 스킬이 올바른 API 패턴, sanitization 단계, 파일 형식을 적용해 주어야 할 때 특히 유용합니다.

잘 맞는 사용자와 작업

분자 정리, property 계산, similarity screening, library 필터링, drug discovery 및 computational chemistry용 structure-based 데이터 준비를 한다면 이 rdkit 가이드를 활용하세요. 여러 분자를 대상으로 재현 가능한 batch processing이 필요할 때도, 한 번씩 노트북에서 탐색하는 수준보다 rdkit for Data Analysis 용도로 잘 맞습니다.

이 스킬이 다른 이유

이 rdkit 스킬은 편의성보다 세밀한 제어를 우선합니다. repository에는 descriptor, SMARTS, similarity workflow를 위한 직접적인 Python API 사용과 helper script, reference file이 함께 들어 있습니다. 그래서 범용 프롬프트나 가벼운 wrapper보다 고급 제어, 맞춤 sanitization, 특수 알고리즘에 더 적합합니다.

rdkit 스킬 사용 방법

설치하고 맥락을 명확히 전달하기

Claude skills 환경에 이 스킬을 설치한 뒤, 분자 원본, 원하는 출력, 제약 조건을 분명하게 적어 요청하세요. 좋은 rdkit 설치 흐름은 화학 작업 자체와 데이터 형태를 함께 제시하는 것입니다. 예를 들어 SMILES in CSV, SDF file, batch library, single query molecule처럼 적어 주면 좋습니다.

올바른 입력을 주기

좋은 입력에는 정확한 구조 형식, 수행할 작업, 적용해야 할 화학 규칙이 포함됩니다. 예를 들어: “rdkit으로 이 SDF를 읽고, 유효하지 않은 분자를 제거한 뒤, MW/LogP/TPSA를 계산하고, canonical SMILES가 들어간 CSV로 내보내줘.” substructure 작업이 필요하다면 SMARTS pattern과 inclusive matching인지 exclusive matching인지도 함께 알려 주세요.

먼저 읽어야 할 파일

먼저 SKILL.md를 보고, 이어서 지원 메서드와 pattern syntax를 확인하려면 references/api_reference.md, references/descriptors_reference.md, references/smarts_patterns.md를 살펴보세요. batch 작업 자동화를 계획한다면 scripts/molecular_properties.py, scripts/similarity_search.py, scripts/substructure_filter.py를 읽어 repository가 실제로 어떤 workflow로 구성되어 있는지 파악하는 것이 좋습니다.

결과를 좋게 만드는 workflow 팁

parse, validate, transform, export 순서로 나누어 프롬프트를 구성하는 것이 좋습니다. sanitization을 strict하게 할지 permissive하게 할지, stereochemistry가 중요한지, canonical SMILES를 쓸지 원래 순서를 유지할지도 분명히 적으세요. rdkit 사용에서는 이렇게 해야 분자는 파싱되지만 downstream descriptor나 fingerprint가 잘못된 형태로 계산되는 흔한 실패를 막을 수 있습니다.

rdkit 스킬 FAQ

rdkit이 일반 프롬프트보다 나은가요?

대체로 그렇습니다. 작업이 정확한 API, file I/O, SMARTS syntax, batch processing에 의존한다면 특히 더 그렇습니다. 일반 프롬프트도 케모인포매틱스 개념은 설명할 수 있지만, 신뢰할 수 있는 rdkit 설치 안내, 구체적인 code path, 분자 형식에 대한 불필요한 가정을 줄이는 데는 rdkit 스킬이 더 적합합니다.

언제 rdkit을 쓰지 말아야 하나요?

세밀한 제어 없이 고수준의 분자 요약만 필요하다면 rdkit을 선택하지 마세요. repository 자체도 표준 워크플로에서는 datamol이 RDKit을 감싸는 더 단순한 wrapper가 될 수 있다고 밝힙니다. 즉, 편의성보다 직접적인 API 제어가 필요할 때 rdkit이 더 알맞습니다.

초보자도 쓰기 쉬운가요?

작업 범위가 명확하다면 그렇습니다. 초보자도 SMILES를 property로 바꾸기, SMARTS pattern으로 분자 필터링하기처럼 간단한 rdkit 사용을 요청할 수 있습니다. 보통 막히는 지점은 화학 지식 자체보다 입력의 모호함입니다. 파일 형식이 불명확하거나, charge/stereo 규칙이 빠졌거나, 목표 출력 schema가 정해지지 않은 경우가 대표적입니다.

생태계는 어떻게 기대하면 되나요?

대형 앱 프레임워크보다는 Python 중심의 workflow, RDKit modules, helper script, reference table을 기대하는 편이 맞습니다. rdkit 스킬은 분자 원본을 이미 알고 있고, 실용적인 분석 또는 변환 pipeline이 필요할 때 가장 잘 작동합니다.

rdkit 스킬 개선 방법

가장 중요한 결정부터 시작하세요

가장 큰 품질 향상은 분자 representation과 성공 기준을 명시하는 데서 나옵니다. rdkit 스킬에 descriptor 계산, similarity search, substructure filtering, structure conversion 중 무엇을 할지 말하고, “sanitized molecule만 허용” 또는 “stereochemistry 유지”처럼 어떤 결과를 유효한 것으로 볼지도 정의하세요.

화학 제약 조건을 먼저 알려 주세요

흔한 실패는 salt, tautomer, explicit hydrogen, aromaticity, invalid structure에 대한 숨은 가정에서 생깁니다. 이런 요소가 중요하다면 처음부터 직접 밝히세요. 예를 들어 “descriptor 계산 전에 salt를 제거해줘”, “원래 stereochemistry를 보존해줘”, “sanitization에 실패하면 복구하지 말고 제외해줘”처럼 말하면 됩니다.

구체적인 프롬프트 패턴을 사용하세요

더 강한 프롬프트는 이런 식입니다: “rdkit으로 molecules.smi를 읽고, 유효하지 않은 SMILES는 거부한 뒤, MW, LogP, TPSA를 계산하고, canonical SMILES와 passed flag가 포함된 CSV를 만들어줘.” 이것은 “이 분자들을 분석해줘”보다 훨씬 낫습니다. 무엇을 파싱하고, 무엇을 계산하며, 결과를 어떤 형식으로 내보낼지 분명하게 알려 주기 때문입니다.

코드만 보지 말고 출력 품질 기준으로 반복 개선하세요

첫 결과를 받은 뒤에는 출력이 화학 규칙과 downstream toolchain에 맞는지 확인하세요. 결과가 어색하다면 한 번에 한 가지 제약만 더 추가하면서 프롬프트를 다듬는 것이 좋습니다. fingerprint type, SMARTS library, descriptor set, export format처럼 말이죠. rdkit for Data Analysis에서는 보통 기능을 더 많이 요구하는 것보다 이렇게 반복 개선하는 편이 재현성을 더 크게 높입니다.

평점 및 리뷰

아직 평점이 없습니다

리뷰 남기기

이 스킬의 평점과 리뷰를 남기려면 로그인하세요.

0/10000

최신 리뷰

저장 중...

이 카테고리의 다른 스킬

clickhouse-best-practices

작성자 ClickHouse

clickhouse-best-practices는 Database Engineering을 위한 ClickHouse 모범 사례 skill입니다. 스키마 설계, 쿼리 튜닝, insert 전략, 에이전트 연결성을 규칙 기반 권장사항으로 안내해, ClickHouse 워크플로에서 clickhouse-best-practices 사용을 더 쉽게 트리거하고 검토하며 인용할 수 있게 합니다.

Database Engineering

즐겨찾기 0GitHub 412

chdb-datastore

작성자 ClickHouse

chdb-datastore는 ClickHouse 기반 DataStore API를 활용해 빠른 데이터 분석을 지원하는 pandas 호환 skill입니다. 파일, 데이터베이스, 클라우드 커넥터를 지원하고, 서로 다른 소스 간 조인도 가능하며, pandas 스타일 워크플로우에 최소한의 코드 수정만으로 적용할 수 있습니다. 더 큰 데이터셋을 바로 분석할 수 있는 드롭인 분석 계층이 필요할 때 이 chdb-datastore 가이드를 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

sympy

작성자 K-Dense-AI

sympy 스킬로 Python에서 대수, 미적분, 행렬, 물리 공식, 수론, 기하, 코드 생성까지 정확한 기호 수학을 처리하세요. 식을 정확하게 유지하고, 적절한 SymPy 모듈을 고르며, 부동소수점 위주의 오류를 피하는 데 도움이 됩니다. 기호 워크플로와 데이터 분석용 sympy를 실용적으로 다루려는 사용자에게 특히 적합합니다.

Data Analysis

즐겨찾기 0GitHub 21.4k

interpreting-culture-index

작성자 trailofbits

interpreting-culture-index는 Culture Index 설문, 프로필 내보내기 파일, 그리고 관련 채용·코칭 메모를 해석하는 데 도움을 줍니다. 역할 적합도, 팀 역학, 번아웃 위험, 지원자 피드백, 온보딩 계획, 갈등 중재에 이 interpreting-culture-index 스킬을 활용하세요. 화살표 상대 해석, 안티패턴 점검, 그리고 데이터 분석과 의사결정 지원에 유용한 실용적 결과물에 중점을 둡니다.

Data Analysis

즐겨찾기 0GitHub 5k

azure-search-documents-py

작성자 microsoft

azure-search-documents-py는 Python용 Azure AI Search 스킬로, 백엔드 개발에 필요한 설치, 인증, 인덱스 설계, 벡터 검색, 하이브리드 검색, 시맨틱 랭킹, 에이전틱 검색까지 다룹니다. 설정부터 실제 쿼리 패턴까지 실무 중심의 안내가 필요할 때 azure-search-documents-py 스킬을 사용하세요.

Backend Development

즐겨찾기 0GitHub 2.3k

gget

작성자 K-Dense-AI

gget은 CLI 또는 Python에서 20개 이상의 유전체 데이터베이스와 분석 도구에 빠르고 통합적으로 접근할 수 있는 생물정보학 스킬입니다. 유전자 정보, BLAST 관련 조회, AlphaFold 구조, 발현 데이터, 질병 연관성, enrichment 스타일 분석에 활용할 수 있습니다. 빠른 탐색과 gget 기반 데이터 분석 워크플로에 잘 맞습니다.

Data Analysis

즐겨찾기 0GitHub 0

torch-geometric

작성자 K-Dense-AI

PyTorch Geometric 그래프 신경망을 위한 torch-geometric 스킬 가이드입니다. torch-geometric 설치 도움, 사용법, 그래프 분류, 노드 분류, 링크 예측, 이종 그래프, 커스텀 MessagePassing 레이어, 그리고 머신러닝 워크플로에서 GNN 확장까지 다룰 때 활용하세요.

Machine Learning

즐겨찾기 0GitHub 21.4k

huggingface-vision-trainer

작성자 huggingface

huggingface-vision-trainer는 객체 탐지, 이미지 분류, SAM/SAM2 세그멘테이션 같은 비전 학습 작업에 사용할 Hugging Face 스킬을 설치하고 활용하는 데 도움을 줍니다. 데이터셋 준비, 클라우드 GPU 설정, 평가, Trackio 로깅, 결과를 Hub에 푸시하는 과정까지 다루며, 백엔드 자동화와 반복 가능한 학습 워크플로에 적합합니다.

Backend Development

즐겨찾기 0GitHub 10.4k

seo-dataforseo

작성자 AgriciDaniel

seo-dataforseo는 DataForSEO MCP 서버를 통해 Claude를 실시간 SEO 데이터와 연결합니다. SERP 확인, 키워드 리서치, 백링크, 온페이지 분석, 경쟁사 조사, 비즈니스 등록정보, AI 가시성 추적까지 지원합니다. 실제 검색 근거가 필요하고, 명확한 설치 안내와 실용적인 seo-dataforseo 사용법이 중요한 데이터 기반 워크플로에 가장 적합합니다.

Keyword Research

즐겨찾기 0GitHub 6.2k

pymc

작성자 K-Dense-AI

PyMC는 Python에서 확률적 모델을 구축, 적합, 점검, 비교하는 데 쓰는 베이지안 모델링 스킬입니다. pymc는 계층적 회귀, 다층 분석, 시계열, 결측값, 측정 오차, 그리고 LOO 또는 WAIC를 활용한 모델 비교에 사용하세요.

Data Analysis

즐겨찾기 0GitHub 0

pymatgen

작성자 K-Dense-AI

pymatgen은 결정 구조, 상평형도, 전자 구조, 파일 변환을 다루는 Python 재료과학 툴킷입니다. 이 pymatgen 스킬은 CIF, POSCAR, VASP, Materials Project 데이터를 활용하는 과학 워크플로를 지원합니다.

Scientific

즐겨찾기 0GitHub 0

geopandas

작성자 K-Dense-AI

Python 지리공간 벡터 데이터 분석을 위한 geopandas 스킬로, shapefiles, GeoJSON, GeoPackage 파일을 다룹니다. 공간 데이터를 읽고, 정리하고, 결합하고, 버퍼를 만들고, 자르고, 재투영하고, 내보내는 작업을 더 적은 추측으로 수행할 때 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0

analyzing-threat-intelligence-feeds

작성자 mukul975

analyzing-threat-intelligence-feeds는 CTI 피드를 수집하고, 지표를 정규화하며, 피드 품질을 평가하고, STIX 2.1 워크플로를 위한 IOC를 보강하는 데 도움을 줍니다. 이 analyzing-threat-intelligence-feeds 스킬은 위협 인텔 운영과 데이터 분석에 맞춰 설계되었으며, TAXII, MISP, 상용 피드를 실무적으로 다루는 방법을 제공합니다.

Data Analysis

즐겨찾기 0GitHub 0

azure-ai-textanalytics-py

작성자 microsoft

azure-ai-textanalytics-py는 Python용 Azure AI Text Analytics 스킬입니다. 감성 분석, 개체 인식, 핵심 구문 추출, 언어 감지, PII 탐지, 의료 NLP에 도움이 됩니다. 앱, 노트북, 데이터 분석 워크플로에서 Azure 클라이언트 설정, 인증, 실전 텍스트 분석을 빠르게 시작해야 할 때 적합합니다.

Data Analysis

즐겨찾기 0GitHub 0

chdb-sql

작성자 ClickHouse

chdb-sql은 서버 없이 Python에서 ClickHouse SQL을 실행할 수 있게 해주는 GitHub 스킬입니다. `chdb.query()`, `Session`, DB-API 연결, `file()`과 `s3()` 같은 테이블 함수, 매개변수화 쿼리, 로컬 파일과 외부 데이터 소스를 다루는 백엔드 개발 워크플로를 폭넓게 다룹니다.

Backend Development

즐겨찾기 0GitHub 0

scvelo

작성자 K-Dense-AI

scvelo는 단일세포 RNA-seq 데이터의 RNA velocity 분석을 위한 Python 기술입니다. 이를 사용해 unspliced 및 spliced mRNA로부터 세포 상태 전이를 추정하고, 궤적 방향을 유추하며, latent time을 계산하고, driver gene을 식별할 수 있습니다. 표준 클러스터링이나 pseudotime만으로는 방향성이 부족할 때, scvelo를 활용한 데이터 분석에 특히 유용합니다.

Data Analysis

즐겨찾기 0GitHub 0