videoagent-image-studio

bởi pexoai

videoagent-image-studio là skill tạo ảnh hợp nhất cho agent chạy trên Node. Công cụ này cung cấp một luồng CLI duy nhất cho Midjourney, Flux, Ideogram, Recraft, SDXL và nhiều mô hình khác, kèm thiết lập qua proxy, hướng dẫn chọn model và đầu ra được chuẩn hóa để tự động hóa.

Stars456

Yêu thích0

Bình luận0

Đã thêm31 thg 3, 2026

Danh mụcImage Generation

Lệnh cài đặt

npx skills add pexoai/pexo-skills --skill videoagent-image-studio

Điểm tuyển chọn

Skill này đạt 78/100, đủ mạnh để có mặt trong danh mục: repository cung cấp tín hiệu kích hoạt rõ ràng cho agent, một quy trình tạo ảnh cụ thể và khả năng thực thi thực tế vượt xa một prompt chung chung. Người dùng directory có thể cân nhắc cài nếu muốn một điểm vào CLI duy nhất cho nhiều model tạo ảnh, nhưng cũng nên lưu ý có sự thiếu nhất quán giữa lời hứa gần như không cần thiết lập và phần tài liệu rộng hơn của repo.

78/100

Điểm mạnh

Khả năng kích hoạt tốt: `SKILL.md` nêu rõ nên dùng khi người dùng yêu cầu tạo ảnh, artwork, logo, icon hoặc illustration.
Hướng dẫn vận hành hữu ích: skill có bảng chọn model, bước tăng cường prompt và Node CLI thực tế (`tools/generate.js`) với các tham số được ghi lại rõ ràng cùng cách xử lý đầu ra thống nhất.
Giá trị thực thi đáng kể cho agent: công cụ tập trung truy cập tới nhiều model như Midjourney, Flux, Ideogram, Recraft, SDXL và Nano Banana, đồng thời tự xử lý vòng polling của Midjourney.

Điểm cần lưu ý

Tín hiệu độ tin cậy còn lẫn lộn: `SKILL.md` và `package.json` nhấn mạnh cách dùng hosted-proxy, không cần key, nhưng `CONTRIBUTING.md` và `.env.example` lại nhắc tới API key của nhà cung cấp cho phát triển cục bộ.
Mức độ rõ ràng khi áp dụng chỉ ở mức vừa phải: `SKILL.md` không có lệnh cài đặt tường minh, và tài liệu hỗ trợ hiện chủ yếu xoay quanh một script duy nhất, chưa có thêm tham chiếu hay tài nguyên bổ trợ.

Video Cli Node.js JavaScript Vercel OpenClaw

Tổng quan

Tổng quan về skill videoagent-image-studio

videoagent-image-studio làm được gì

Skill videoagent-image-studio là một lớp bọc tạo ảnh hợp nhất dành cho agent cần sinh hình ảnh mà không phải tự xoay xở với nhiều API từ các nhà cung cấp khác nhau. Skill này cung cấp một quy trình CLI thống nhất có thể gọi các model như midjourney, flux-pro, flux-dev, flux-schnell, ideogram, recraft, sdxl và nano-banana, đồng thời trả về cấu trúc kết quả nhất quán.

Ai nên cài đặt

Skill này phù hợp với những người thường xuyên cần tạo ảnh từ các yêu cầu hội thoại và muốn giảm ma sát vận hành so với việc tích hợp trực tiếp từng nhà cung cấp. Nó đặc biệt hữu ích cho người xây agent, đội ngũ nội dung và những ai tự động hóa workflow, vì chỉ cần một lệnh lặp lại được thay cho phần thiết lập riêng cho từng model.

Nhu cầu thực sự mà skill này giải quyết

Phần lớn người dùng không thực sự cần “một image model”; họ cần một cách đáng tin cậy để biến những yêu cầu mơ hồ như “tạo một ảnh sản phẩm đậm chất điện ảnh” hoặc “thiết kế logo có chữ dễ đọc” thành một bước sinh ảnh có thể chạy được. videoagent-image-studio hỗ trợ việc này bằng cách kết hợp hướng dẫn cải thiện prompt, gợi ý chọn model và một đường thực thi duy nhất.

Vì sao nổi bật

Điểm khác biệt chính không chỉ nằm ở việc truy cập được nhiều model. Giá trị của videoagent-image-studio nằm ở chỗ:

cho phép gọi nhiều image model chỉ với một lệnh
xử lý phần phức tạp bất đồng bộ kiểu Midjourney ở phía sau script
chuẩn hóa đầu ra để dễ nối vào các bước tự động hóa tiếp theo
giảm đáng kể ma sát cài đặt vì có thể dùng hosted proxy mà không cần tự mang API key của nhà cung cấp

Điều cần cân nhắc trước khi dùng

Quyết định cài đặt quan trọng nhất là bạn ưu tiên sự tiện lợi hay quyền kiểm soát trực tiếp ở cấp nhà cung cấp. Nếu bạn cần một lớp sinh ảnh đơn giản, thân thiện với agent và gần như không cần thiết lập nhiều, đây là lựa chọn rất phù hợp. Nếu bạn cần các tùy chọn chuyên sâu theo từng provider, thiết lập an toàn tùy biến, hoặc điều phối batch phức tạp, về lâu dài bạn có thể sẽ vượt khỏi phạm vi mà lớp trừu tượng này đáp ứng được.

Trường hợp dùng phù hợp nhất của videoagent-image-studio cho Image Generation

Hãy dùng videoagent-image-studio for Image Generation khi yêu cầu rõ ràng là tạo hình ảnh mới: minh họa, poster, logo, ảnh render sản phẩm, ảnh social, concept art, cảnh anime hoặc asset marketing theo phong cách riêng. Skill này kém thuyết phục hơn nếu bạn đang xây pipeline chỉnh sửa ảnh nặng, hoặc workflow đa phương thức phức tạp cần mask, compositing hay hậu kỳ cầu kỳ.

Cách dùng skill videoagent-image-studio

Bối cảnh cài đặt và yêu cầu runtime

Repository cho biết cần node >=18 và có một đường thực thi duy nhất tại tools/generate.js. Trong đa số trường hợp, quyết định videoagent-image-studio install khá đơn giản: nếu môi trường của bạn chạy được công cụ CLI bằng Node, bạn có thể thử skill này rất nhanh.

Hãy đọc các file này trước:

SKILL.md
tools/generate.js
.env.example
CHANGELOG.md

Chúng cho bạn biết skill được kích hoạt trong tình huống nào, có những tham số gì, đầu ra được định hình ra sao và liệu môi trường của bạn có cần biến môi trường hay không.

Lệnh thực tế trông như thế nào

Mẫu sử dụng cốt lõi là gọi trực tiếp bằng Node:

node tools/generate.js --model flux-dev --prompt "a modern ceramic mug on a clean studio table, soft window light" --aspect-ratio 1:1

Script hỗ trợ các tham số chính gồm:

--model
--prompt
--aspect-ratio
--num-images
--negative-prompt
--seed

Ngoài ra còn có các tham số theo kiểu action cho những workflow như bước tiếp theo của Midjourney:

--action
--index
--job-id
--upscale-type
--variation-type

Chọn đúng model trong videoagent-image-studio trước khi viết prompt

Việc chọn model ảnh hưởng đến chất lượng nhiều hơn những chỉnh sửa câu chữ nhỏ trong prompt. Hướng dẫn định tuyến ngay trong skill khá thực tế:

midjourney: cảnh nghệ thuật, đậm chất điện ảnh, thiên về painterly
flux-pro: chân dung chân thực và ảnh kiểu sản phẩm
flux-dev: lựa chọn cân bằng mặc định cho nhu cầu phổ thông
flux-schnell: bản nháp nhanh và lặp thử nhiều lần
ideogram: poster, logo, ảnh có chữ
recraft: icon, vector, flat design
sdxl: anime và minh họa cách điệu
nano-banana: sinh ảnh ưu tiên tính nhất quán với ảnh tham chiếu

Nếu kết quả đầu tiên sai hướng, hãy đổi model trước khi chỉnh prompt quá tay.

Biến một yêu cầu thô thành prompt dùng được

Input yếu:
make a nice cafe image

Input tốt hơn:
cozy Paris-style street cafe at blue hour, warm interior glow, wet cobblestone reflections, cinematic composition, medium-wide shot, realistic photography, subtle steam from coffee cups, no people blocking storefront signage

Vì sao cách này hiệu quả hơn:

xác định rõ chủ thể và bối cảnh
đưa ra tín hiệu về góc máy và bố cục
mô tả phong cách và mức độ chân thực
giảm mơ hồ về trọng tâm của khung cảnh

Thêm ràng buộc để tránh kết quả tệ

Để videoagent-image-studio hoạt động ổn định hơn, hãy đưa vào:

chủ thể
môi trường
phong cách hình ảnh
bố cục hoặc khung hình
ánh sáng
tỷ lệ khung hình
các yếu tố bắt buộc phải có
các yếu tố cần tránh

Ví dụ:

node tools/generate.js \
  --model ideogram \
  --prompt "minimal tech conference poster, bold readable headline area, geometric background, blue and black palette, modern Swiss design, high contrast, clean spacing" \
  --aspect-ratio 4:5 \
  --negative-prompt "blurry text, crowded layout, ornate illustration"

Cách này đáng tin cậy hơn nhiều so với chỉ nói “a cool poster.”

Dùng negative prompt khi dễ xảy ra lệch chất lượng

Script hỗ trợ --negative-prompt, rất hữu ích khi model liên tục thêm sai phong cách hoặc làm ảnh bị rối. Negative prompt tốt nên cụ thể và mang tính thị giác:

extra fingers, distorted hands, deformed face
blurry text, illegible letters
busy background, low contrast
cartoonish, oversaturated, plastic skin

Tránh nhồi hàng chục lỗi chung chung vào negative prompt trừ khi bạn đã thực sự gặp đúng những lỗi đó.

Nắm rõ cấu trúc đầu ra để tự động hóa

Changelog cho biết đầu ra đã được chuẩn hóa với cấu trúc gần giống:

success
model
imageUrl
images
jobId

Điều này rất quan trọng nếu bạn muốn chuyển kết quả sang một bước agent tiếp theo. Một prompt thông thường không mang lại mức độ dự đoán được cho tích hợp như vậy; videoagent-image-studio thì có.

Dùng action của Midjourney mà không phải đoán

Phần header hướng dẫn của script cho thấy một mẫu lệnh thứ hai dành cho các action tiếp theo:

node tools/generate.js --model midjourney --action upscale --index 2 --job-id <id>

Điểm này quan trọng vì một số workflow tạo ảnh có nhiều bước. Nếu agent của bạn cần upscale hoặc tạo biến thể từ một panel đã chọn, hãy dùng các tham số action tường minh thay vì cố sinh lại từ đầu.

Dùng ảnh tham chiếu để giữ tính nhất quán khi model hỗ trợ

Changelog có ghi nhận --reference-images cho nano-banana dưới dạng các URL phân tách bằng dấu phẩy. Đây là tính năng đặc biệt hữu ích khi cần giữ nhất quán nhân vật, duy trì style lặp lại hoặc tạo chuỗi asset cho cùng một chiến dịch. Nếu use case của bạn phụ thuộc vào kiểu “cùng một người, cùng cảm giác thương hiệu, bối cảnh mới”, đây là một trong những tính năng đáng kiểm tra sớm nhất.

Lộ trình đọc repository để tiếp cận nhanh nhất

Nếu muốn một videoagent-image-studio guide thực dụng, hãy đọc theo thứ tự này:

SKILL.md để xem điều kiện kích hoạt và bảng chọn model
tools/generate.js để biết các tham số CLI thực tế
CHANGELOG.md để nắm các thay đổi hành vi như format đầu ra và xử lý async
.env.example để xem phần cấu hình môi trường tùy chọn

Thứ tự này giúp bạn ra quyết định nhanh hơn nhiều so với việc đọc tài liệu cho contributor ngay từ đầu.

Hosted proxy hay tự dùng key cục bộ

Skill này quảng bá một đường dùng hosted proxy, nơi người dùng không cần tự mang key của nhà cung cấp. Đây là cách khởi động dễ nhất. Tuy vậy, repository cũng có .env.example và hướng dẫn cho contributor nhắc đến các biến như IMAGE_STUDIO_PROXY_URL, IMAGE_STUDIO_TOKEN, cùng các ví dụ kiểm thử cục bộ cũ hơn có dùng provider key. Với quyết định cài đặt, điều đó có nghĩa là:

cách dễ nhất: dùng workflow mặc định dựa trên proxy
cách nâng cao: kiểm tra cấu hình env nếu hệ triển khai của bạn cần routing hoặc auth tùy biến

Một workflow thực tế chạy tốt với videoagent-image-studio

Một quy trình hiệu quả ngoài thực tế cho videoagent-image-studio skill là:

phân loại yêu cầu theo loại đầu ra
chọn model có khả năng phù hợp nhất
viết lại prompt với các ràng buộc thị giác cụ thể
sinh trước một ảnh
xem lỗi nằm ở đâu
đổi model hoặc đổi prompt, không đổi cả hai cùng lúc
chỉ sau đó mới tăng số lượng ảnh hoặc chuyển sang upscale/variation

Cách làm này giúp chi phí thử-sai thấp và việc debug prompt cũng dễ hơn nhiều.

Câu hỏi thường gặp về skill videoagent-image-studio

videoagent-image-studio có phù hợp cho người mới bắt đầu không?

Có, nếu mục tiêu chính của bạn là tạo ảnh nhanh từ agent hoặc lệnh terminal. Skill này loại bỏ khá nhiều độ phức tạp riêng của từng nhà cung cấp. Người mới vẫn cần học cách mô tả hình ảnh rõ ràng, nhưng không phải tự thiết kế tích hợp đa nhà cung cấp từ đầu.

Khi nào videoagent-image-studio tốt hơn một prompt thông thường?

Nó tốt hơn khi bạn cần khả năng thực thi ổn định, chọn model rõ ràng và đầu ra có cấu trúc. Một prompt thuần túy có thể yêu cầu AI “tạo ảnh”, nhưng videoagent-image-studio cung cấp một đường chạy thực sự với quyền kiểm soát model minh bạch và kết quả thân thiện cho tự động hóa.

Khi nào không nên dùng videoagent-image-studio?

Hãy bỏ qua nó nếu bạn cần các điều khiển nâng cao ở cấp provider mà lớp wrapper này không phơi bày ra, hoặc nếu workflow của bạn chủ yếu là chỉnh sửa ảnh thay vì tạo ảnh mới. Nó cũng không phải lựa chọn tốt nhất cho các đội ngũ cần quyền kiểm soát hợp đồng trực tiếp đối với từng lời gọi đến từng nhà cung cấp nền tảng.

videoagent-image-studio có cần API key không?

Theo định vị hiện tại thì không, nếu bạn dùng đường hosted-proxy thông thường. Đây là một lợi thế lớn về khả năng triển khai. Dù vậy, vẫn nên kiểm tra .env.example và môi trường triển khai của bạn nếu cần routing riêng tư, xác thực hoặc hành vi tự quản lý.

Tôi nên bắt đầu với model nào?

Hãy bắt đầu với:

flux-dev cho nhu cầu sinh ảnh đa dụng
flux-pro cho đầu ra chân thực
ideogram cho ảnh nhiều chữ
recraft cho nhu cầu icon/vector
midjourney cho nghệ thuật cách điệu đậm chất điện ảnh

Nếu còn phân vân, hãy chọn theo loại đầu ra thay vì độ quen thuộc với thương hiệu model.

videoagent-image-studio có phù hợp cho agent production không?

Có, phù hợp hơn đa số thiết lập prompting chắp vá, vì nó chuẩn hóa cả cách gọi lẫn định dạng đầu ra. Câu hỏi quan trọng trong production không hẳn là có làm được hay không, mà là mức độ tin cậy vận hành: hãy kiểm tra độ trễ, độ ổn định đầu ra, thiết lập auth và hành vi fallback trong chính môi trường của bạn.

Cách cải thiện skill videoagent-image-studio

Cải thiện prompt trong videoagent-image-studio bằng cách nêu rõ những quyết định model không thể tự suy ra

Cách nhanh nhất để cải thiện kết quả từ videoagent-image-studio là cung cấp những chi tiết mà model sẽ phải đoán nếu bạn không nói rõ:

chủ thể chính xác
mục tiêu phong cách
ngữ cảnh khung cảnh
khung hình
ánh sáng
mức độ chân thực mong muốn
yêu cầu về chữ
các yếu tố loại trừ

Model càng phải tự bịa ít, bạn càng phải dọn dẹp ít.

Sửa lỗi phổ biến nhất: chọn sai model

Nếu chữ hiển thị kém, chuyển sang ideogram.
Nếu phong cách vector/icon bị đục hoặc lem, chuyển sang recraft.
Nếu độ chân thực trông giả, thử flux-pro.
Nếu cảnh thiếu kịch tính, thử midjourney.
Chỉnh prompt có ích, nhưng dùng sai engine thường là giới hạn cứng đối với chất lượng.

Lặp thử từng biến một

Đừng viết lại toàn bộ giữa các lần chạy. Hãy giữ prompt tương đối ổn định và chỉ thay đổi một trong các yếu tố sau:

model
aspect ratio
negative prompt
cụm từ về ánh sáng/phong cách
đầu vào ảnh tham chiếu

Cách này giúp bạn nhìn ra ngay điều gì thực sự làm kết quả tốt hơn.

Viết prompt theo từng lớp

Một cấu trúc mạnh thường là:

chủ thể cốt lõi
bối cảnh
phong cách
bố cục
ánh sáng
phần loại trừ

Ví dụ:
premium black running shoe on reflective studio floor, minimalist luxury ad set, photorealistic product photography, low-angle three-quarter composition, dramatic rim lighting, no extra props, no text

Cấu trúc nhiều lớp này gần như luôn hiệu quả hơn kiểu mô tả mơ hồ, dàn trải.

Dùng aspect ratio như một công cụ sáng tạo

Nhiều phàn nàn về “bố cục xấu” thực ra là do chọn sai tỷ lệ khung hình. Hãy chốt định dạng đầu ra từ sớm:

1:1 cho ô sản phẩm và avatar
16:9 cho cảnh điện ảnh và thumbnail
9:16 cho bố cục story trên di động
4:5 cho creative trên social feed

Chỉ riêng việc đổi ratio đôi khi đã giải quyết được vấn đề khung hình quá chật hoặc quá trống mà không cần viết lại prompt.

Tăng tính nhất quán bằng ảnh tham chiếu và seed

Khi use case là nhân vật lặp lại, biến thể chiến dịch hoặc cần duy trì continuity về style, hãy tái sử dụng cùng các tín hiệu hỗ trợ ở những nơi có hỗ trợ:

--reference-images cho các model hỗ trợ tính năng này
--seed khi bạn muốn biến thể có kiểm soát

Khi đã chuyển từ ảnh làm một lần sang sản xuất lặp lại, những yếu tố này quan trọng hơn việc thêm vài tính từ mô tả.

Xử lý các lần chạy trượt ở vòng đầu bằng chỉnh sửa có mục tiêu

Nếu kết quả đầu tiên đã gần đúng nhưng vẫn sai:

sai mood: đổi cụm mô tả ánh sáng và phong cách
sai bố cục: đổi framing và aspect ratio
chữ khó đọc: chuyển sang ideogram
quá chung chung: thêm chi tiết về thương hiệu, chất liệu, thời kỳ hoặc camera
quá rối: thêm negative prompt loại trừ clutter

Những chỉnh sửa có mục tiêu giúp giữ lại phần đã đúng thay vì làm lại từ đầu.

Đọc changelog trước khi đổ lỗi cho skill

CHANGELOG.md có những thay đổi vận hành đáng chú ý, gồm cả việc đơn giản hóa xử lý Midjourney, chuẩn hóa đầu ra và các ghi chú hỗ trợ như cách dùng ảnh tham chiếu. Nếu hành vi hiện tại khác với các ví dụ cũ, changelog là nơi nhanh nhất để hiểu nguyên nhân.

Người dùng nâng cao nên kiểm tra gì sớm

Nếu videoagent-image-studio skill sẽ nằm trong một pipeline tự động hóa lớn hơn, hãy kiểm tra sớm:

độ trễ theo từng model
phản hồi khi lỗi
khả năng parse output JSON
hành vi auth với cấu hình proxy
liệu model bạn chọn có đáp ứng nhu cầu về tính nhất quán hay không

Những kiểm tra này quan trọng hơn cả chục lần sinh ảnh mẫu, vì chúng quyết định skill có đủ đáng tin để chạy ở quy mô lớn hay không.

Đánh giá & nhận xét

Chưa có đánh giá nào

Chia sẻ nhận xét của bạn

Đăng nhập để chấm điểm và để lại nhận xét cho skill này.

0/10000

Nhận xét mới nhất

Đang lưu...

Thêm skill trong danh mục này

openclaw-persona-forge

bởi affaan-m

openclaw-persona-forge là một skill theo quy trình, dùng để xây dựng trọn bộ persona OpenClaw từ đầu. Skill này tạo ra xung đột bản sắc, khung trình bày kiểu SOUL.md, quy tắc ranh giới, các phương án đặt tên và gợi ý prompt avatar tùy chọn. Phù hợp nhất cho thiết kế nhân vật OpenClaw, agent nhập vai và công việc persona gần với UI Design; không phù hợp cho việc chỉnh sửa nhỏ trên một persona đã có sẵn.

UI Design

Yêu thích 0GitHub 156.2k

baoyu-imagine

bởi JimLiu

baoyu-imagine là một kỹ năng tạo ảnh đa nhà cung cấp với CLI có kiểu dữ liệu rõ ràng, yêu cầu thiết lập EXTEND.md, hỗ trợ ảnh tham chiếu, kiểm soát tỷ lệ khung hình và chạy hàng loạt trên OpenAI, Azure OpenAI, Google, OpenRouter, DashScope, MiniMax, Jimeng, Seedream và Replicate.

Image Generation

Yêu thích 0GitHub 13.2k

baoyu-comic

bởi JimLiu

baoyu-comic là một skill giúp chuyển văn bản nguồn thành truyện tranh giáo dục hoặc truyện tranh tiểu sử, với khả năng lập storyboard, giữ tính nhất quán nhân vật, sắp xếp bố cục khung truyện và tạo ảnh theo từng giai đoạn. Skill hỗ trợ sử dụng qua CLI có thể cài đặt, cung cấp tùy chọn về phong cách và bố cục, đồng thời hỗ trợ các quy trình từng phần như `--storyboard-only`, `--prompts-only` và `--regenerate` để kiểm soát quá trình sản xuất truyện tranh tốt hơn.

Image Generation

Yêu thích 0GitHub 13.2k

shader-dev

bởi MiniMax-AI

shader-dev là một skill GLSL thực dụng dành cho hiệu ứng thời gian thực kiểu ShaderToy. Dùng shader-dev skill để xây dựng hoặc gỡ lỗi ray marching, SDF scenes, lighting, particles, fluid motion, post-processing và shader-dev cho UI Design với ít phải đoán mò hơn so với một prompt chung chung.

UI Design

Yêu thích 0GitHub 11.7k

videoagent-video-studio

bởi pexoai

videoagent-video-studio là một skill tạo video AI ngắn từ văn bản, hình ảnh và dữ liệu tham chiếu. Dùng skill này để thử quy trình text-to-video và image-to-video, so sánh các model được hỗ trợ, và chạy qua proxy lưu trữ sẵn hoặc tự host với Node 18+.

Video Editing

Yêu thích 0GitHub 456

seo-image-gen

bởi AgriciDaniel

seo-image-gen là một kỹ năng GitHub giúp chuyển các yêu cầu tạo ảnh SEO thành prompt và thiết lập sẵn sàng cho sản xuất, dành cho ảnh OG, xem trước mạng xã hội, banner hero, hình ảnh sản phẩm, infographic và thumbnail. Kỹ năng này dùng Gemini qua nanobanana-mcp và giả định đã cài extension banana, để có một hướng dẫn và quy trình seo-image-gen thực tế.

Image Generation

Yêu thích 0GitHub 0

baoyu-xhs-images

bởi JimLiu

baoyu-xhs-images giúp chuyển bài viết hoặc ghi chú thành carousel infographic cho Xiaohongshu với preset, phong cách, bố cục và hướng dẫn thiết lập. Nội dung này giúp người dùng cài đặt skill, chọn đầu vào phù hợp và chạy `/baoyu-xhs-images` để tạo bài đăng mạng xã hội nhiều slide theo cấu trúc rõ ràng.

UI Design

Yêu thích 0GitHub 13.2k

baoyu-cover-image

bởi JimLiu

baoyu-cover-image giúp agent tạo prompt ảnh bìa bài viết có cấu trúc dựa trên loại ảnh, bảng màu, kiểu render, chữ và cảm xúc. Skill hỗ trợ các tỷ lệ 2.35:1, 16:9 và 1:1, kèm quy tắc tự chọn và hướng dẫn tương thích, phù hợp cho quy trình làm ảnh bìa lặp lại trong biên tập nội dung và UI Design.

UI Design

Yêu thích 0GitHub 13.2k

meme-factory

bởi softaworks

meme-factory giúp agent tạo meme theo template bằng API miễn phí memegen.link, đồng thời hỗ trợ meme văn bản thân thiện với Markdown. Bạn có thể dùng nó để tạo URL meme dễ chia sẻ, chọn template phù hợp, định dạng văn bản đúng chuẩn và tự động hóa đầu ra bằng trình trợ giúp Python đi kèm.

Image Generation

Yêu thích 0GitHub 1.3k

logo-creator

bởi ReScienceLab

logo-creator là một quy trình tạo logo bằng AI để lên concept, so sánh nhiều biến thể, cắt ảnh, xóa nền và xuất asset SVG. Skill này dùng tham chiếu phong cách, prompt mẫu và script hỗ trợ để tạo logo, icon, favicon và brand mark trong ReScienceLab/opc-skills.

Branding

Yêu thích 0GitHub 0

scientific-schematics

bởi K-Dense-AI

scientific-schematics biến các prompt ngôn ngữ tự nhiên thành sơ đồ khoa học chất lượng xuất bản với cơ chế tinh chỉnh lặp thông minh. Kỹ năng này dùng Nano Banana 2 để tạo ảnh và Gemini 3.1 Pro Preview để rà soát, chỉ tạo lại khi đầu ra chưa đạt ngưỡng phù hợp với loại tài liệu của bạn. Phù hợp cho kiến trúc mạng nơ-ron, sơ đồ hệ thống, lưu đồ, đường dẫn sinh học và các hình ảnh khoa học phức tạp khác.

Image Generation

Yêu thích 0GitHub 0

banner-creator

bởi ReScienceLab

banner-creator hỗ trợ tạo banner, header và hero image theo quy trình có cấu trúc: thu thập yêu cầu, tạo nhiều phương án, tinh chỉnh theo phản hồi và cắt ảnh theo tỷ lệ từng nền tảng bằng script đi kèm.

UI Design

Yêu thích 0GitHub 0

baoyu-article-illustrator

bởi JimLiu

baoyu-article-illustrator giúp agent biến bản nháp bài viết thành prompt minh họa có cấu trúc, vị trí chèn ảnh và các quyết định nhất quán về loại hình + phong cách cho bài giải thích, hướng dẫn, sơ đồ và bài viết nhiều hình.

Image Generation

Yêu thích 0GitHub 13.2k

nanobanana

bởi ReScienceLab

nanobanana là một kỹ năng CLI viết bằng Python cho Google Gemini 3 Pro Image, hỗ trợ tạo ảnh từ văn bản, chỉnh sửa ảnh, tỷ lệ khung hình, xuất ảnh 2K/4K và tạo hàng loạt bằng các script cục bộ đơn giản.

Image Generation

Yêu thích 0GitHub 654

sound-fx

bởi NoizAI

Dùng kỹ năng sound-fx để biến prompt văn bản thành hiệu ứng âm thanh, foley, nền âm thanh môi trường, tiếng sinh vật và tiếng UI. Kỹ năng này phù hợp cho sound-fx trong Chỉnh sửa âm thanh, tạo mẫu nhanh và tạo tài sản âm thanh có thể tải xuống. Cài đặt qua NoizAI/skills, sau đó dùng quy trình làm việc dựa trên script với một Noiz API key hợp lệ. Không dành cho giọng nói, lời bài hát, giai điệu hoặc sao chép giọng.

Audio Editing

Yêu thích 0GitHub 498

chat-with-anyone

bởi NoizAI

chat-with-anyone giúp bạn sao chép giọng nói của một người thật từ audio công khai hoặc thiết kế một giọng nói tương thích từ một hình ảnh, rồi tạo câu trả lời tổng hợp bằng TTS. Skill này hỗ trợ các quy trình thực tế cho roleplay, tường thuật và tạo giọng nói, kèm hướng dẫn về cài đặt, chọn nguồn và sử dụng an toàn.

Voice Generation

Yêu thích 0GitHub 498