Tencent/ncnn 20241226 on GitHub

编译版本，默认配置，android-ndk-r27c，xcode 15.2，ubuntu-20.04，ubuntu-22.04，ubuntu-24.04，vs2015，vs2017，vs2019，vs2022，emscripten-3.1.28

file	content	arch
ncnn-full-source.zip	包含全部 submodule 代码的完整源码
ncnn-android.zip	android 静态库/动态库	armeabi-v7a + arm64-v8a + x86 + x86_64 + riscv64
ncnn-android-vulkan.zip	android 静态库/动态库，支持 GPU	armeabi-v7a + arm64-v8a + x86 + x86_64 + riscv64
ncnn-apple.zip	apple xcframework，ios + ios-simulator + macos + mac-catalyst + watchos + watchos-simulator + tvos + tvos-simulator + visionos + visionos-simulator	arm64 + arm64e + x86_64
ncnn-apple-vulkan.zip	apple xcframework，ios + ios-simulator + macos + mac-catalyst + watchos + watchos-simulator + tvos + tvos-simulator + visionos + visionos-simulator，支持 GPU	arm64 + arm64e + x86_64
ncnn-ios.zip	ios 静态库	arm64
ncnn-ios-vulkan.zip	ios 静态库，支持 GPU	arm64
ncnn-ios-simulator.zip	ios simulator 静态库	x86_64 + arm64
ncnn-ios-simulator-vulkan.zip	ios simulator 静态库，支持 GPU	x86_64 + arm64
ncnn-macos.zip	macos 静态库	x86_64 + arm64
ncnn-macos-vulkan.zip	macos 静态库，支持 GPU	x86_64 + arm64
ncnn-mac-catalyst.zip	mac catalyst 静态库	x86_64 + arm64
ncnn-mac-catalyst-vulkan.zip	mac catalyst 静态库，支持 GPU	x86_64 + arm64
ncnn-watchos.zip	watchos 静态库	armv7k + arm64_32
ncnn-watchos-simulator.zip	watchos simulator 静态库	x86_64 + arm64
ncnn-tvos.zip	tvos 静态库	x86_64 + arm64
ncnn-tvos-vulkan.zip	tvos 静态库，支持 GPU	x86_64 + arm64
ncnn-tvos-simulator.zip	tvos simulator 静态库	x86_64 + arm64
ncnn-tvos-simulator-vulkan.zip	tvos simulator 静态库，支持 GPU	x86_64 + arm64
ncnn-visionos.zip	visionos 静态库	arm64
ncnn-visionos-vulkan.zip	visionos 静态库，支持 GPU	arm64
ncnn-visionos-simulator.zip	visionos simulator 静态库	x86_64 + arm64
ncnn-visionos-simulator-vulkan.zip	visionos simulator 静态库，支持 GPU	x86_64 + arm64
ncnn-ubuntu.zip	ubuntu linux 静态库/动态库，支持 GPU，模型转换工具	x86_64
ncnn-windows.zip	windows 静态库/动态库，支持 GPU，模型转换工具	x86 + x64 + arm + arm64
ncnn-webassembly.zip	webassembly 静态库	wasm32 + simd + threads + simd-threads

embed 支持int8量化
gemm 支持int8量化
multiheadattention 支持int8量化
新增spectrogram和inverse spectrogram实现
arm rmsnorm neon优化
arm layernorm neon fp32/bf16s/fp16s优化
x86 rmsnorm sse2/avx/avx512优化
x86 layernorm sse2/avx/avx512优化
x86 gemm int8 sse2/xop/avx/avx512/vnni/vnniint8优化
更新riscv vector标准到1.0，重写全部ncnn riscv优化代码，自动探测rvv/zfh/zvfh/xtheadvector并分发
riscv gemm rvv优化支持128bit/256bit vlen
禁用x86倒数优化避免可能的精度损失
改善harmonyos cpu拓扑结构abi兼容性
暂时禁用mesa驱动的vulkan矩阵扩展支持
兼容ndk-21编译asimdfhm目标的错误导致的问题
兼容clang-18编译avx512bf16时编译器崩溃的问题
禁用msvc对windows arm平台exp/tanh的svml优化以解决计算错误
探测avxvnniint8/avxvnniint16/avxneconvert指令集
runtime cpu开启时仅使用ncnn cmake内置的编译参数
删除windows arm32支持(@Shironana817)
android默认启用16kb pagesize编译，android-api升级到21
vkCreateDevice失败时不直接崩溃(@Upliner)
为powerpc架构跳过0.5附近数值的unaryop round测试用例
pnnx更新到torch-2.5
pnnx支持从traced inputs自动设定inputshape
pnnx编译不再输出来自torch头文件的警告
pnnx重排pass level2内的全部顺序，并复用pattern
pnnx不再保存debug中间模型(@LJoson)
pnnx输出python脚本的onnx导出代码更新到export(@whyb)
pnnx合并t5-layernorm为rmsnorm
pnnx不再折叠具有动态shape的tensor
pnnx在输出的python脚本中使用隐含的int转换避免trace时常数化
pnnx转换Tensor.select为ncnn crop+squeeze
pnnx转换onnx constantofshape为torch.zeros/ones
pnnx修正onnx clip在可选min/max缺失时的转换问题
ci更新riscv64工具链
ci添加c908/spacemit-x60
ci webassembly兼容node>20
ci android添加riscv64目标并打包
添加vim3 vulkan跑分数据(@GIBEREZ)

New Contributors

@ankushgoel27 made their first contribution in #5709
@Shironana817 made their first contribution in #5811
@GIBEREZ made their first contribution in #5821

Full Changelog: 2024082...2024122

Tencent/ncnn 20241226 android ios macos linux windows webassembly watchos tvos visionos 预编译库 20241226 5285895 on GitHub

New Contributors

Tencent/ncnn 20241226
android ios macos linux windows webassembly watchos tvos visionos 预编译库 20241226 5285895

on GitHub