BerriAI/litellm v1.42.10 on GitHub

What's Changed

feat(vertex_ai_partner.py): add vertex ai codestral FIM support by @krrishdholakia in #5004
fix(litellm_logging.py): Fix azure base model cost calc in response headers by @krrishdholakia in #4996
fix(utils.py): Add streaming token usage in hidden params by @krrishdholakia in #5001

Full Changelog: v1.42.9...v1.42.10

docker run \
-e STORE_MODEL_IN_DB=True \
-p 4000:4000 \
ghcr.io/berriai/litellm:main-v1.42.10

Name	Status	Median Response Time (ms)	Average Response Time (ms)	Requests/s	Failures/s	Request Count	Failure Count	Min Response Time (ms)	Max Response Time (ms)
/chat/completions	Passed ✅	160.0	175.53988997779015	6.3179372749243035	0.0	1891	0	125.14354199998934	1485.7802660000061
Aggregated	Passed ✅	160.0	175.53988997779015	6.3179372749243035	0.0	1891	0	125.14354199998934	1485.7802660000061