编译版本,默认配置,android-ndk-r21d,xcode 12.2,ubuntu-16.04,ubuntu-18.04,ubuntu-20.04,vs2017,vs2019
file | content | arch |
---|---|---|
ncnn-full-source.zip | 包含全部 submodule 代码的完整源码 | |
ncnn-android.zip | android 静态库/动态库 | armeabi-v7a + arm64-v8a + x86 + x86_64 |
ncnn-android-vulkan.zip | android 静态库/动态库,支持 GPU | armeabi-v7a + arm64-v8a + x86 + x86_64 |
ncnn-ios.zip | ios 静态库,w/o bitcode | armv7 + arm64 + arm64e + i386 + x86_64 |
ncnn-ios-vulkan.zip | ios 静态库,支持 GPU,w/o bitcode | arm64 + arm64e + x86_64 |
ncnn-macos.zip | macos 静态库 | x86_64 + arm64 |
ncnn-macos-vulkan.zip | macos 静态库,支持 GPU | x86_64 + arm64 |
ncnn-ubuntu.zip | ubuntu linux 静态库/动态库,支持 GPU,模型转换工具 | x86_64 |
ncnn-windows.zip | windows 静态库/动态库,支持 GPU,模型转换工具 | x86 + x86_64 |
ncnn-webassembly.zip | webassembly 静态库 | wasm32 + simd + threads |
warpaffine函数arm neon优化
新增multiheadattention和pytorch的转换
新增gelu(RBelogorodtsevFBase)
新增flush denormal选项并默认启用(leeys888)
新增adaptive_pooling vulkan实现(zylo117)
默认使用net局部的内存池
默认使用大核心的cpu作为线程数
在较新的adreno/mali gpu上启用fp16s/int8s
修正int8 armv7 conv1x1s1 requant无neon计算错误
conv3x3s1 winograd42 arm neon优化
通用convolution im2col sgemm的arm neon优化
常规的AVX2 convolution优化(zhiliu6)
优化ssd detectionoutput候选框计算(WeiChungChang)
在旧版adreno驱动时使用桥接的image上传下载
修复inplace forward(gdh1995)
消除NCNN_BENCHMARK启用时不必要的数据复制(yx9527)
改善megvii风格的shufflechannel转换
onnx2ncnn自动拓扑排序
改善onnx2ncnn layernorm转换
ncnnoptimize可以切分模型(chentyjpm)
mlir2ncnn设置自定义llvm/mlr路径(daquexian)
修复多输入模型使用gpu推理可能导致的数据错误
修复gpu image分配失败的回退cpu的问题
修复gpu buffer2host的问题
修复某些pipeline编译失败的问题(zchrissirhcz)
修复macos编译问题(leeys888)
修复onnx2ncnn转换某些memorydata shape错误
修复python model zoo下载(caishanli)
修复ncnnoptimize遇到多个自定义层崩溃问题
cmake寻找和链接thread库
更新glslang版本(proydakov)
int8量化工具支持adaptive pool(GuoxiaWang)
上传wheel到pypi(caishanli)
修复python net extractor销毁顺序的问题(caishanli)
新增python vulkan test(caishanli)
修正python setup.py缺失的import(zylo117)
更新convertmodel.com链接(daquexian)
更新mlir tf2 dialect
修正一些拼写错误(zchrissirhcz, caishanli, zhiqwang)
ios最低版本要求9.0(DaChengTechnology)
关于在自己项目使用ncnn的文档(zchrissirhcz)
readme新增nanodet(RangiLyu)
补充android cmake ninja编译方法(ncnnnnn)
readme更新各个算法链接(linser233)
修正how-to-build文档中benchncnn输出格式(ncnnnnn)
新增build-mlir2ncnn文档(zchrissirhcz)
修复nanodet示例代码的变量重名(RangiLyu)
修复yolact示例代码的越界问题(cmdbug)
新增nanodet python demo(caishanli)
新增有关nvidia gpu无法开启vulkan问题的文档(PENGUINLIONG)