ggml-org/llama.cpp b9523
on GitHub

latest releases: b10133, b10121, b10107...

one month ago

Details

hparams : refactor hparams.n_layer (#24060)

hparams : refactor hparams.n_layer
cont : remove n_layer_kv(), use n_layer_all instead
cont : type consistency
pi : update SYSTEM.md
models : fix Step3.5 MTP
cont : remove duplicate switch cases
cont : explicitly set false to extra layers for is_swa and is_recr
cont : fix nextn layer count handling

Co-authored-by: Sigbjørn Skjæret sigbjorn.skjaeret@scala.com

Co-authored-by: Sigbjørn Skjæret sigbjorn.skjaeret@scala.com

macOS/iOS:

macOS Apple Silicon (arm64)
macOS Apple Silicon (arm64, KleidiAI enabled) DISABLED
macOS Intel (x64)
iOS XCFramework

Linux:

Android:

Android arm64 (CPU)

Windows:

openEuler:

DISABLED
openEuler x86 (310p)
openEuler x86 (910b, ACL Graph)
openEuler aarch64 (310p)
openEuler aarch64 (910b, ACL Graph)

UI:

UI

Check out latest releases or
releases around ggml-org/llama.cpp b9523

Don't miss a new llama.cpp release

NewReleases is sending notifications on new releases.

Get notifications