x-jeff blog

Make progress every day.

【论文阅读】RTMPose:Real-Time Multi-Person Pose Estimation based on MMPose

RTMPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 代码和模型开源地址:RTMPose。 在计算能力有限的设备上执行robust且实时的多人姿态估计仍然是一项具有挑战性的任务,其还不足以达到令人满意的工业应用性能。 在本文,我们从以下5个方面探讨了影响2D多人姿态估计框架性能和latency的关键因素:范式(paradigm)、ba...

【论文阅读】RTMDet:An Empirical Study of Designing Real-Time Object Detectors

RTMDet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 官方github repo:RTMDet。 官方文档:RTMDET 原理和实现全解析。 我们的目的旨在突破YOLO系列模型的极限,提出一个新的用于目标检测的实时模型家族,称为RTMDet(Real-Time Models for object Detection,RTM也可以理...

【论文阅读】Effective Whole-body Pose Estimation with Two-stages Distillation

DWPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction whole-body pose estimation是一个很重要的课题,目前的一些流行算法,比如OpenPose和MediaPipe,其性能并不能令人满意。和只检测body-only keypoints相比,whole-body pose estimation面临着更多的挑战: 更加细...

【论文阅读】Focal Loss for Dense Object Detection

Focal Loss,RetinaNet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:code。 目前SOTA的目标检测器都是two-stage的、由proposal驱动的机制。比如R-CNN框架,第一阶段生成一组稀疏的候选目标位置,第二阶段使用卷积神经网络将每个候选位置分为前景或背景。后续的two-stage框架(Fast R-CNN、Faster R-CNN...

【论文阅读】YOLOX:Exceeding YOLO Series in 2021

YOLOX

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:YOLOX。 随着目标检测的发展,YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5)始终追求速度和精度之间的最佳平衡。目前,YOLOv5具有最优的平衡性能,在COCO上以13.7ms的速度达到了48.2%的AP(使用YOLOv5-L模型,输入为...

【YOLO系列】YOLOv5

YOLOv5

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Ultralytics YOLOv5 Architecture YOLOv5没有发表官方论文。官方github地址:yolov5。本博文参考官方文档,因为YOLOv5还在不断的更新,本博文介绍的是YOLOv5的v6.0/6.1版本。 2.Model Structure YOLOv5框架包含3个主要部分: B...

【论文阅读】YOLOv4:Optimal Speed and Accuracy of Object Detection

YOLOv4

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 开源代码:https://github.com/AlexeyAB/darknet。 目前精度比较高的网络模型都不能做到实时检测,并且需要多个GPU来完成训练。我们提出一个可以实时检测的CNN模型,且训练只需要一块GPU即可。我们提出的YOLOv4的性能结果见Fig1。 我们的贡...

【论文阅读】Path Aggregation Network for Instance Segmentation

PANet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 我们发现Mask R-CNN中的信息传播可以进一步被改善。具体来说,low level的特征有利于识别大型实例,但从低级特征到高级特征需要走过很长的路径,这增加了获取准确定位信息的难度。此外,每个proposal来自一个feature level,放弃了其他level中可能有用的信息。最后,m...

【论文阅读】Mask R-CNN

Mask R-CNN

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 我们提出的用于实例分割的方法叫做Mask R-CNN,其通过在Faster R-CNN上新添加一个与类别分支和bounding box回归分支平行的一个mask分支,用于在每个RoI上预测分割mask,见Fig1。mask分支是应用在每个RoI上的一个小型FCN,通过pixel-to-pixe...

【论文阅读】Feature Pyramid Networks for Object Detection

FPN

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 识别不同尺度的物体是CV领域中一个基本的挑战。基于图像金字塔得到特征金字塔是这种问题的一个标准解决思路(如Fig1(a)所示)。这一思路在需要手工设计特征的年代非常流行,但是其速度很慢,比如DPM。 Fig1中蓝框表示feature map,框线越粗表示特征越强。 随着CNN的...