diffdock

bởi K-Dense-AI

diffdock là một skill docking để dự đoán tư thế gắn kết protein-ligand từ cấu trúc PDB hoặc từ chuỗi protein kèm ligand ở định dạng SMILES, SDF hoặc MOL2. Hãy dùng skill diffdock cho thiết kế thuốc dựa trên cấu trúc, sàng lọc ảo và phân tích tư thế có chấm điểm độ tin cậy. Skill này không dùng để dự đoán ái lực gắn kết.

Stars21.3k

Yêu thích0

Bình luận0

Đã thêm14 thg 5, 2026

Danh mụcData Analysis

Lệnh cài đặt

npx skills add K-Dense-AI/claude-scientific-skills --skill diffdock

Điểm tuyển chọn

Skill này đạt 78/100, nghĩa là đây là một ứng viên khá vững cho Agent Skills Finder. Người dùng trong thư mục có đủ nội dung quy trình thực tế để quyết định cài đặt: skill này nhắm rõ vào docking protein-ligand bằng DiffDock, có cả luồng xử lý cho từng phức hợp và theo lô, đồng thời đi kèm các script hỗ trợ cùng tài liệu tham chiếu giúp giảm phỏng đoán so với một prompt chung chung.

78/100

Điểm mạnh

Mục tiêu rõ ràng: phần frontmatter và tổng quan nêu thẳng skill này dành cho docking phân tử dựa trên khuếch tán từ đầu vào PDB/SMILES.
Hỗ trợ quy trình vận hành: repository có 3 script cùng các mẫu cấu hình batch CSV và inference, giúp agent chuẩn bị đầu vào và phân tích đầu ra tốt hơn.
Độ sâu hướng dẫn tốt: tài liệu tham chiếu bao quát tham số, quy trình/ví dụ và độ tin cậy/giới hạn, giúp quyết định cài đặt có giá trị hơn và thực thi rõ ràng hơn.

Điểm cần lưu ý

Không có lệnh cài đặt trong SKILL.md, nên người dùng có thể phải suy ra cách thiết lập từ các quy trình được tham chiếu thay vì đi theo một đường cài đặt một bước ngay trong repo.
Skill này tập trung vào dự đoán tư thế và độ tin cậy, không phải dự đoán ái lực; vì vậy nếu cần ước tính năng lượng gắn kết, người dùng sẽ phải dùng thêm công cụ khác.

Bioinformatics Machine Learning Python Scientific Drug Sensitivity Protein Biology Pharmaceutical

Tổng quan

Tổng quan về skill diffdock

diffdock dùng để làm gì

DiffDock là một skill tập trung vào docking, dùng để dự đoán tư thế gắn kết protein-ligand từ một cấu trúc hoặc chuỗi protein cộng với một đầu vào ligand. Hãy dùng skill diffdock khi bạn cần câu trả lời thực tế cho câu hỏi “hợp chất này có thể gắn vào đâu và theo cách nào?” hơn là một ước tính về ái lực gắn kết.

Phù hợp nhất và ranh giới quyết định

Skill này phù hợp với thiết kế thuốc dựa trên cấu trúc, sàng lọc ảo và sinh tạo pose để phục vụ phân tích tiếp theo. Nó phù hợp kém hơn nếu bạn chỉ cần xếp hạng theo độ mạnh tác dụng, nếu đích protein của bạn có tính linh động cao, hoặc nếu bạn muốn một workflow hóa học tổng quát thay vì workflow dự đoán pose.

Điều gì khiến nó hữu ích

Giá trị chính của diffdock là nó kết hợp docking cho một phức hợp đơn lẻ, sàng lọc hàng loạt, chấm điểm độ tin cậy và đầu vào protein dựa trên chuỗi trong cùng một workflow. Điều đó làm cho việc cài đặt diffdock đáng giá khi bạn muốn vừa có một đường chạy docking có thể thực thi, vừa có đủ hướng dẫn để tránh đọc sai các điểm số.

Cách sử dụng skill diffdock

Cài đặt và kiểm tra workflow

Cài đặt skill diffdock trong bộ thiết lập Claude skills của bạn, rồi mở SKILL.md trước tiên. Sau đó, đọc references/workflows_examples.md, references/parameters_reference.md, và references/confidence_and_limitations.md để hiểu đúng dạng đầu vào, giá trị mặc định và cách diễn giải điểm số trước khi chạy một job.

Biến tác vụ của bạn thành một prompt dùng được

Với diffdock, hãy cung cấp sẵn định dạng protein, định dạng ligand và loại job. Đầu vào tốt phải cụ thể, ví dụ: “Dock SMILES này vào PDB này và trả về 5 pose hàng đầu kèm diễn giải độ tin cậy,” hoặc “Chuẩn bị batch docking cho các ligand này đối với một receptor.” Đầu vào yếu chỉ đơn giản là “chạy diffdock,” vì nó che mất việc skill nên dùng file, chuỗi hay batch CSV.

Dùng đúng file và đúng đầu ra

Với docking đơn lẻ, hãy bắt đầu bằng một protein PDB và một ligand ở định dạng SMILES, SDF hoặc MOL2. Với công việc batch, hãy dùng mẫu CSV trong assets/batch_template.csv và kiểm tra scripts/prepare_batch_csv.py nếu bạn cần xác thực trước khi thực thi. Sau khi chạy xong, scripts/analyze_results.py giúp tóm tắt thứ hạng pose và điểm tin cậy để bạn không phải tự xem thủ công từng file đầu ra.

Mẹo thiết lập thực tế

Cài đặt diffdock và lần chạy đầu tiên có thể chậm do tải trọng số model và tạo bảng tra cứu, vì vậy hãy tính trước chi phí thiết lập này. Nếu protein của bạn không có sẵn cấu trúc, skill hỗ trợ dựng cấu trúc dựa trên chuỗi, nhưng điều đó làm tăng độ bất định; chỉ nên dùng khi không có cấu trúc thực nghiệm, không nên xem đây là lối tắt mặc định. Chỉ điều chỉnh sampling khi bài toán khó, vì nhiều sample hơn sẽ cải thiện độ phủ tìm kiếm nhưng cũng làm tăng chi phí tính toán và công việc hậu xử lý.

Câu hỏi thường gặp về skill diffdock

diffdock chỉ dành cho file PDB thôi à?

Không. Skill diffdock hỗ trợ cấu trúc protein và trong một số workflow còn hỗ trợ cả chuỗi protein sẽ được fold trước khi docking. Tuy vậy, nếu có PDB thực sự thì vẫn nên dùng PDB, vì cấu trúc suy ra từ chuỗi sẽ thêm một nguồn sai số nữa.

diffdock có dự đoán ái lực không?

Không. DiffDock dự đoán pose gắn kết và độ tin cậy, không dự đoán ái lực gắn kết. Nếu bạn cần ưu tiên theo kiểu giống affinity, hãy ghép diffdock với một bước scoring hoặc rescoring thay vì xem confidence như độ mạnh tác dụng.

Skill diffdock có thân thiện với người mới không?

Có, nếu bài toán của bạn đơn giản: một receptor, một ligand, một câu hỏi về pose. Nó sẽ khó hơn khi bạn cần lọc batch, protein linh động, hoặc diễn giải cẩn thận các sample có độ tin cậy thấp. Skill này thân thiện với người mới trong docking, chứ không phải để thay thế phán đoán chuyên môn.

Khi nào không nên dùng?

Đừng dựa vào diffdock cho các target mà thay đổi cấu dạng là cơ chế gắn kết chính, hoặc khi bạn chỉ có biểu diễn ligand rất không chắc chắn. Nó cũng là lựa chọn thay thế kém cho một workflow phân tích medicinal chemistry đầy đủ nếu câu hỏi thực sự của bạn là SAR, selectivity, hoặc ADMET.

Cách cải thiện skill diffdock

Cung cấp ngữ cảnh phân tử tốt hơn cho skill

Kết quả diffdock tốt nhất thường đến từ đầu vào sạch: một file receptor chính xác, một ligand với giả định proton hóa rõ ràng, và định nghĩa rành mạch về bài toán binding. Nếu đã biết site gắn kết, hãy nói rõ. Nếu là bài toán blind docking, cũng hãy nói rõ, vì chiến lược tìm kiếm và mức confidence kỳ vọng sẽ khác.

Yêu cầu đúng loại đầu ra bạn sẽ dùng

Hãy cải thiện cách dùng diffdock bằng cách chỉ định rõ bạn muốn top pose, top 5 pose, sàng lọc batch, hay các candidate được xếp theo confidence. Nếu bạn dự định so sánh kết quả sau này, hãy yêu cầu quy tắc đặt tên file nhất quán và một bảng tóm tắt. Điều này giảm mơ hồ và giúp đầu ra dễ tích hợp vào phân tích cho Data Analysis hoặc báo cáo screening.

Chú ý các lỗi hỏng thường gặp

Những lỗi phổ biến nhất là coi confidence như affinity, chuẩn bị ligand kém, và quá tin vào các lần chạy trên protein nằm ngoài vùng “thoải mái” của model. Nếu kết quả trông không ổn định, hãy chạy lại với nhiều sample hơn, so sánh nhiều pose hàng đầu, và kiểm tra xem hóa học của ligand hay trạng thái protein mới là nút thắt thực sự thay vì đổ cho model.

Lặp lại bằng các prompt theo sát vấn đề

Sau lần chạy đầu tiên, hãy cải thiện prompt diffdock tiếp theo bằng vấn đề cụ thể: định vị site sai, cụm pose không nhất quán, hoặc điểm confidence thấp. Cách đó hữu ích hơn nhiều so với việc chỉ yêu cầu chạy lại chung chung. Khi bạn cần diffdock cho Data Analysis, hãy nêu rõ metric muốn trích xuất từ output, như phân bố thứ hạng, ngưỡng điểm số, hoặc tóm tắt theo từng phức hợp.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

clickhouse-best-practices

bởi ClickHouse

clickhouse-best-practices là skill best practices cho ClickHouse dành cho Database Engineering. Skill này hướng dẫn thiết kế schema, tối ưu truy vấn, chiến lược insert và kết nối agent bằng các khuyến nghị theo quy tắc, giúp việc kích hoạt, rà soát và trích dẫn cách dùng clickhouse-best-practices trong các workflow ClickHouse trở nên dễ dàng hơn.

Database Engineering

Yêu thích 0GitHub 412

chdb-datastore

bởi ClickHouse

chdb-datastore là một kỹ năng tương thích với pandas, phục vụ phân tích dữ liệu nhanh với DataStore API dựa trên ClickHouse. Kỹ năng này hỗ trợ kết nối file, cơ sở dữ liệu và cloud, join giữa nhiều nguồn dữ liệu, cùng các thay đổi mã tối thiểu cho workflow kiểu pandas. Hãy dùng hướng dẫn chdb-datastore này khi bạn cần một lớp phân tích cắm vào là chạy cho các tập dữ liệu lớn hơn.

Data Analysis

Yêu thích 0GitHub 0

interpreting-culture-index

bởi trailofbits

interpreting-culture-index giúp diễn giải các khảo sát Culture Index, bản xuất hồ sơ và các ghi chú liên quan đến tuyển dụng hoặc coaching. Hãy dùng skill interpreting-culture-index này cho đánh giá độ phù hợp vai trò, động lực đội nhóm, nguy cơ kiệt sức, tóm tắt trao đổi ứng viên, kế hoạch onboarding và hòa giải xung đột. Skill này nhấn mạnh cách đọc tương đối theo mũi tên, kiểm tra anti-pattern và đầu ra thực tiễn cho phân tích dữ liệu cùng hỗ trợ ra quyết định.

Data Analysis

Yêu thích 0GitHub 5k

azure-search-documents-py

bởi microsoft

azure-search-documents-py là skill Python cho Azure AI Search, dành cho phát triển backend, bao gồm cài đặt, xác thực, thiết kế index, tìm kiếm vector, tìm kiếm hybrid, xếp hạng semantic và truy xuất theo tác tử. Hãy dùng azure-search-documents-py khi bạn cần hướng dẫn thực tế từ khâu thiết lập đến các mẫu truy vấn hoạt động được.

Backend Development

Yêu thích 0GitHub 2.3k

gget

bởi K-Dense-AI

gget là một skill tin sinh học giúp truy cập nhanh, thống nhất hơn 20 cơ sở dữ liệu hệ gen và công cụ phân tích từ CLI hoặc Python. Dùng nó để tra cứu thông tin gen, truy vấn liên quan đến BLAST, cấu trúc AlphaFold, dữ liệu biểu hiện, liên kết bệnh lý và các phân tích kiểu enrichment. Nó phù hợp cho việc khám phá nhanh và các quy trình phân tích dữ liệu với gget.

Data Analysis

Yêu thích 0GitHub 0

huggingface-vision-trainer

bởi huggingface

huggingface-vision-trainer giúp bạn cài đặt và sử dụng một skill Hugging Face cho các tác vụ huấn luyện thị giác máy tính: phát hiện đối tượng, phân loại ảnh và phân đoạn SAM/SAM2. Nội dung bao gồm chuẩn bị dữ liệu, thiết lập GPU trên cloud, đánh giá mô hình, ghi log bằng Trackio và đẩy kết quả lên Hub. Phù hợp cho tự động hóa backend và các quy trình huấn luyện có thể lặp lại.

Backend Development

Yêu thích 0GitHub 10.4k

seo-dataforseo

bởi AgriciDaniel

seo-dataforseo kết nối Claude với dữ liệu SEO trực tiếp qua DataForSEO MCP server để kiểm tra SERP, nghiên cứu từ khóa, backlink, phân tích on-page, nghiên cứu đối thủ, danh sách doanh nghiệp và theo dõi mức độ hiển thị trong AI. Đây là lựa chọn phù hợp nhất cho các quy trình dựa trên dữ liệu khi bạn cần bằng chứng tìm kiếm thực tế, hướng dẫn cài đặt rõ ràng và cách dùng seo-dataforseo thực tiễn.

Keyword Research

Yêu thích 0GitHub 6.2k

geopandas

bởi K-Dense-AI

Skill geopandas dành cho phân tích dữ liệu vector địa lý bằng Python, bao gồm shapefile, GeoJSON và GeoPackage. Dùng để đọc, làm sạch, nối, tạo vùng đệm, cắt, chuyển hệ tọa độ và xuất dữ liệu không gian với ít phải đoán mò hơn.

Data Analysis

Yêu thích 0GitHub 0

analyzing-threat-intelligence-feeds

bởi mukul975

Analyzing-threat-intelligence-feeds giúp bạn nạp các CTI feeds, chuẩn hóa chỉ báo, đánh giá chất lượng feed và làm giàu IOC cho quy trình STIX 2.1. Skill analyzing-threat-intelligence-feeds này được xây dựng cho nghiệp vụ threat intel và Data Analysis, với hướng dẫn thực hành cho TAXII, MISP và các feed thương mại.

Data Analysis

Yêu thích 0GitHub 0

azure-ai-textanalytics-py

bởi microsoft

azure-ai-textanalytics-py là một skill cho Azure AI Text Analytics trong Python. Skill này hỗ trợ phân tích cảm xúc, nhận diện thực thể, trích xuất cụm từ khóa, phát hiện ngôn ngữ, phát hiện PII và NLP cho y tế. Hãy dùng khi bạn cần đi nhanh từ khâu thiết lập client Azure, xác thực đến cách dùng text analytics thực tế cho ứng dụng, notebook hoặc quy trình phân tích dữ liệu.

Data Analysis

Yêu thích 0GitHub 0

chdb-sql

bởi ClickHouse

chdb-sql là một GitHub skill để chạy ClickHouse SQL trong Python mà không cần server. Skill này bao gồm `chdb.query()`, `Session`, kết nối DB-API, các table function như `file()` và `s3()`, truy vấn tham số, và quy trình phát triển backend với tệp cục bộ cùng nguồn dữ liệu bên ngoài.

Backend Development

Yêu thích 0GitHub 0

saas-revenue-growth-metrics

bởi deanpeters

saas-revenue-growth-metrics giúp bạn tính và diễn giải MRR, ARR, churn, expansion và NRR cho SaaS. Hãy dùng kỹ năng saas-revenue-growth-metrics khi bạn cần một hướng dẫn sẵn sàng cho Finance để phát hiện tăng trưởng “rò rỉ”, so sánh chất lượng doanh thu và giải thích động lực kinh doanh bằng đầu vào và quyết định rõ ràng.

Finance

Yêu thích 0GitHub 4.1k

matplotlib

bởi K-Dense-AI

Kỹ năng matplotlib cho vẽ biểu đồ bằng Python với toàn quyền kiểm soát trục, nhãn, chú giải, bố cục và định dạng xuất. Hãy dùng khi cần biểu đồ khoa học, phân tích nhiều khung, kiểu biểu đồ tùy chỉnh và trực quan hóa có thể tái tạo, đặc biệt khi bạn cần độ chính xác cao hơn một prompt biểu đồ chung chung. Đây là hướng dẫn matplotlib rất phù hợp cho Phân tích dữ liệu và các biểu đồ sẵn sàng đưa vào xuất bản.

Data Analysis

Yêu thích 0GitHub 0

imaging-data-commons

bởi K-Dense-AI

imaging-data-commons giúp bạn truy vấn và tải về dữ liệu hình ảnh ung thư công khai từ NCI Imaging Data Commons bằng `idc-index`. Dùng skill này cho các tác vụ với imaging-data-commons trên bộ dữ liệu CT, MR, PET và mô bệnh học, bao gồm tìm kiếm metadata, xem trước trên trình duyệt, kiểm tra giấy phép, và quy trình phân tích dữ liệu hoặc huấn luyện AI. Không cần xác thực.

Data Analysis

Yêu thích 0GitHub 0

database-lookup

bởi K-Dense-AI

database-lookup giúp định tuyến câu hỏi nghiên cứu đến đúng API cơ sở dữ liệu công khai và trả về JSON thô, kèm tên các cơ sở dữ liệu nguồn. Hãy dùng nó cho hợp chất, gen, protein, biến thể, thử nghiệm lâm sàng, bằng sáng chế, dữ liệu môi trường hoặc chỉ số kinh tế khi bạn cần một hướng dẫn tra cứu cơ sở dữ liệu thay vì một bản tóm tắt web chung chung.

Web Research

Yêu thích 0GitHub 0

analytics-tracking

bởi coreyhaines31

analytics-tracking giúp đội ngũ thiết kế, rà soát và triển khai đo lường cho GA4, GTM, UTM, chuyển đổi và kế hoạch sự kiện. Dùng skill này để xác định các sự kiện phục vụ quyết định, quy ước đặt tên, tham số, logic trigger và các bước QA cho website marketing, ứng dụng SaaS hoặc hành trình ecommerce.

Data Analysis

Yêu thích 0GitHub 0