BerriAI/litellm v1.53.5 on GitHub

What's Changed

LiteLLM Minor Fixes & Improvements (12/03/2024) by @krrishdholakia in #7008
Add prompt caching flag for Azure OpenAI gpt-4o-2024-08-06 by @fengjiajie in #7020
fix: Add credential templates in migration job when using existing DB by @stevencrake-nscale in #6792

Full Changelog: v1.53.4...v1.53.5

docker run \
-e STORE_MODEL_IN_DB=True \
-p 4000:4000 \
ghcr.io/berriai/litellm:main-v1.53.5

Name	Status	Median Response Time (ms)	Average Response Time (ms)	Requests/s	Failures/s	Request Count	Failure Count	Min Response Time (ms)	Max Response Time (ms)
/chat/completions	Failed ❌	280.0	319.61681502986755	6.043486566751137	0.0	1808	0	233.45962199999803	4589.378371999999
Aggregated	Failed ❌	280.0	319.61681502986755	6.043486566751137	0.0	1808	0	233.45962199999803	4589.378371999999