por affaan-m
cost-aware-llm-pipeline ajuda você a criar fluxos de trabalho com LLM que controlam os gastos com API por meio de roteamento de modelos, rastreamento imutável de custos, tratamento de retries e prompt caching. É ideal para jobs em lote, pipelines de documentos e automação de workflows em que volume de saída e trade-offs de qualidade precisam seguir regras claras.
