TabbyML/tabby v0.13.1
on GitHub

latest releases: v0.31.1, v0.31.1-rc.0, nightly...

14 months ago

⚠️ Notice

This is a patch release, please also check the full release note for 0.13.

🧰 Fixed and Improvements

Bump llama.cpp version to b3334, supporting Deepseek V2 series models.
Turn on fast attention for Qwen2-1.5B model to fix the quantization error.
Properly set number of GPU layers (to zero) when device is CPU.

Check out latest releases or
releases around TabbyML/tabby v0.13.1

Don't miss a new tabby release

NewReleases is sending notifications on new releases.

Get notifications