ncnn 源码剖析-sample 运行 【2022-10-15】以分类网络 shufflenetv2 为例,分析如何使用 ncnn 框架模型推理。源码在 ncnn/examples/shufflenetv2.cpp文件中,程序主要分为两个函数,分别是 detect_shufflenetv2() 和 print_topk()。
TensorRT 基础笔记 【2022-10-13】TensorRT 是 NVIDIA 官方推出的基于 CUDA 和 cudnn 的高性能深度学习推理加速引擎,能够使深度学习模型在 GPU 上进行低延迟、高吞吐量的部署。
ONNX 模型分析与使用 【2022-10-11】ONNX 的本质只是一套开放的 ML 模型标准,模型文件存储的只是网络的拓扑结构和权重(其实每个深度学习框架最后保存的模型都是类似的),脱离开框架是没办法对模型直接进行 inference 的。
cspnet 论文解读 【2021-09-22】CSPNet 是作者 Chien-Yao Wang 于 2019 发表的论文 CSPNET:A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN。也是对 DenseNet 网络推理效率低的改进版本。
VoVNet论文解读 【2021-09-20】Youngwan Lee* 作者于 2019 年发表的论文 An Energy and GPU-Computation Efficient Backbone Network for Real-Time Object Detection. 是对 DenseNet 网络推理效率低的改进版本。
densenet 论文解读 【2021-09-15】在 DenseNet 中,让网络中的每一层都直接与其前面层相连,实现特征的重复利用。同时把网络的每一层设计得特别“窄”(特征图/滤波器数量少),即只学习非常少的特征图(最极端情况就是每一层只学习一个特征图),达到降低冗余性的目的。
ShuffleNetv2 论文详解 【2021-05-18】ShuffleNet v2 论文最大的贡献在于看到了 GPU 访存带宽(内存访问代价 MAC)对于模型推理时间的影响,而不仅仅是模型复杂度:FLOPs 和参数量 Params 对于推理时间的影响,并由此提出了 4 个轻量级网络设计的原则和一个新颖的 卷积 block 架构-ShuffleNet v2。