ggml-org/llama.cpp b9080
on GitHub

latest releases: b9776, b9775, b9774...

one month ago

Details

model : support Gemma4_26B_A4B_NVFP4 (#22804)

Gemma4_26B_A4B_NvFp4 hf checkpoint convert to gguf format fixes

Signed-off-by: ynankani ynankani@nvidia.com

Apply suggestions from code review

Co-authored-by: Sigbjørn Skjæret sigbjorn.skjaeret@scala.com

Address review comments

Signed-off-by: ynankani ynankani@nvidia.com

fix CRLF

Signed-off-by: ynankani ynankani@nvidia.com

Lint error fix

Signed-off-by: ynankani ynankani@nvidia.com

Signed-off-by: ynankani ynankani@nvidia.com
Co-authored-by: Sigbjørn Skjæret sigbjorn.skjaeret@scala.com

macOS/iOS:

Linux:

Android:

Android arm64 (CPU)

Windows:

openEuler:

Check out latest releases or
releases around ggml-org/llama.cpp b9080

Don't miss a new llama.cpp release

NewReleases is sending notifications on new releases.

Get notifications