BerriAI/litellm v1.40.13 on GitHub

What's Changed

fix(parallel_request_limiter.py): rate limit keys across instances by @krrishdholakia in #4150
Langfuse integration support for parent_observation_id parameter by @hburrichter in #3559

Full Changelog: v1.40.12...v1.40.13

docker run \
-e STORE_MODEL_IN_DB=True \
-p 4000:4000 \
ghcr.io/berriai/litellm:main-v1.40.13

Name	Status	Median Response Time (ms)	Average Response Time (ms)	Requests/s	Failures/s	Request Count	Failure Count	Min Response Time (ms)	Max Response Time (ms)
/chat/completions	Passed ✅	74	85.12421177852299	6.470441187117138	0.0	1937	0	63.80303100002038	1377.5951729999178
Aggregated	Passed ✅	74	85.12421177852299	6.470441187117138	0.0	1937	0	63.80303100002038	1377.5951729999178