Tencent/ncnn 20211122 on GitHub

编译版本，默认配置，android-ndk-r21d，xcode 12.4，ubuntu-18.04，ubuntu-20.04，vs2015，vs2017，vs2019，emscripten-2.0.8

file	content	arch
ncnn-full-source.zip	包含全部 submodule 代码的完整源码
ncnn-android.zip	android 静态库/动态库	armeabi-v7a + arm64-v8a + x86 + x86_64
ncnn-android-vulkan.zip	android 静态库/动态库，支持 GPU	armeabi-v7a + arm64-v8a + x86 + x86_64
ncnn-ios.zip	ios 静态库，with and w/o bitcode	armv7 + arm64 + arm64e + i386 + x86_64
ncnn-ios-vulkan.zip	ios 静态库，支持 GPU，with and w/o bitcode	arm64 + arm64e + x86_64
ncnn-macos.zip	macos 静态库	x86_64 + arm64
ncnn-macos-vulkan.zip	macos 静态库，支持 GPU	x86_64 + arm64
ncnn-ubuntu.zip	ubuntu linux 静态库/动态库，支持 GPU，模型转换工具	x86_64
ncnn-windows.zip	windows 静态库/动态库，支持 GPU，模型转换工具	x86 + x86_64
ncnn-webassembly.zip	webassembly 静态库	wasm32 + simd + threads + simd-threads

PNNX(PyTorch Neural Network Exchange)是PyTorch模型部署的新方式，可以避开ONNX中间商，导出比较干净的高层OP
risc-v v binaryop, hardswish, hardsigmoid, prelu, selu, dropout, gru, softmax优化(thelastlin)
risc-v v conv1x1 fc优化
arm neon requantize leakyrelu优化
arm neon innerproduct gemm int8优化
针对c906 sgemm pack优化(yaobyPerfxlab, xianyi)
x86 avx 卷积激活优化(zhiliu6)
x86 sse convolution, convolutiondepthwise, pooling优化(Timen)
修正layernorm affine计算错误
修正pooling adaptive计算错误
修正deconvolution output padding在有bias时的计算错误
interp支持cubic aligncorner插值
interp支持对2维数据w方向拉伸
新增convolutiondepthwise1d和pnnx转换
rnn/lstm/gru支持不相等的输入输出个数
修正squeeze和expanddims层axes的处理
使用整数计算pooling adaptive参数上下界(Yutyrannus)
修复armv7 neon round模式差异
修复x86 sse/avx round模式差异
修复int8输入单元测试可能的越界读
修复在某些android平台无法获得auxv变量的问题
修正apple a11 a12检测armv8.2 dot扩展指令错误的问题
内存引用加载模型时不再拷贝到内存
修复pyncnn numpy转Mat时非对齐拷贝出错的问题
正确检测和支持apple a15和m1(zchrissirhcz)
修复AVX-only代码和用户提供opt时的单元测试逻辑(Timen)
hardswish激活合并入convolution和innerproduct(zhiliu6)
自动解耦extract的Mat数据与Net实例的内存池
Net的custom_layer_to_index移到public(Timen)
删除代码中的无用变量(Sinky-Yan)
cmake检测esp32的xtensa架构
cmake install安装ncnn工具(jinmingyi1998)
修正hardswish test beta参数(zhiliu6)
修复ncnnoptimize无法生成合理int8权重的问题
ncnnoptimize支持embd层
修正onnx2ncnn concat算子负数axis转换的问题
修复onnx2ncnn合并expand算子(grimoire)
修复某些arm kernel越界读数据的问题
修复NCNN_STDIO=OFF的编译问题
新增YOLOX例子, 更新预处理逻辑(FateScript)
新增RobustVideoMatting例子(FeiGeChuanShu)
新增scrfd croudhuman例子(MarsTechHAN)
新增YOLOv5 v6.0例子(zhiliu6)
新增CrowdCounting-P2PNet例子(FeiGeChuanShu)
readme添加yolox(Sinky-Yan)
更新readme文档(fzyzcjy)
修复msvc编译器警告(TianZerL)
一些拼写错误修正(cmdbug, huoshuai-dot)
更新faq文档(ncnnnnn, luqiang-guo, zhiqwang, cmdbug, CharlesHuan, Shiro-Nana, zmq175)
更新operators算子文档(soragotosann)
更新d1和ls2k编译文档
新增termux编译文档(Sinky-Yan)
更新msvc编译文档(ncnnnnn)
更新编译文档(dankernel, mlbo, xiguadong)
更新macos openmp安装方法(zhiqwang)
更新量化文档中的链接(ShiquanYu)
修正python编译文档路径错误(nixondutt)
benchmark新增m1数据(zhiqwang)
benchmark新增mbp数据(AnnYellow)
benchmark新增khadas vim3 amlogic a311d数据(elejke, FeiGeChuanShu)
benchmark新增Phytium FT-2000+/64数据
benchmark新增RK3568数据(BowShotDS)
benchmark新增RK3328数据(Liuyufanlyf)
benchmark新增Ingenic X2000和T40数据(MarsTechHAN)
ci更新swiftshader
ci新增基于lavapipe的gpu测试
ci删除travis arm32(Richuanwu)
ci更新xcode版本

New Contributors

@SinKy-Yan made their first contribution in #3124
@FateScript made their first contribution in #3110
@BowShotDS made their first contribution in #3145
@Liuyufanlyf made their first contribution in #3164
@yaobyPerfxlab made their first contribution in #3159
@TianZerL made their first contribution in #3188
@grimoire made their first contribution in #3189
@dankernel made their first contribution in #3248
@Richuanwu made their first contribution in #3279
@ShiquanYu made their first contribution in #3283
@nixondutt made their first contribution in #3293
@mlbo made their first contribution in #3314
@luqiang-guo made their first contribution in #3332
@Yutyrannus made their first contribution in #3333
@xiguadong made their first contribution in #3344
@soragotosann made their first contribution in #3345
@huoshuai-dot made their first contribution in #3348
@fzyzcjy made their first contribution in #3358
@CharlesHuan made their first contribution in #3361
@Shiro-Nana made their first contribution in #3368
@zmq175 made their first contribution in #3369
@AnnYellow made their first contribution in #3373

Full Changelog: 2021072...2021112

Tencent/ncnn 20211122 android ios macos linux windows webassembly 预编译库 20211122 e4c821a on GitHub

New Contributors

Tencent/ncnn 20211122
android ios macos linux windows webassembly 预编译库 20211122 e4c821a

on GitHub