por affaan-m
cost-aware-llm-pipeline te ayuda a crear flujos de trabajo con LLM que controlan el gasto en API mediante enrutamiento de modelos, seguimiento inmutable de costes, gestión de reintentos y caché de prompts. Es ideal para trabajos por lotes, pipelines de documentos y automatización de flujos de trabajo cuando el volumen de salida y los compromisos de calidad necesitan reglas claras.
