x-jeff blog

Make progress every day.

【论文阅读】OpenPose:Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

OpenPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION 多人姿态估计的一些特点:1)每张图像可能包含未知数量的人,并且这些人可能在任何位置以任意比例出现;2)由于人与人之间的接触、遮挡等原因,使得关节点和人物的匹配变得困难;3)运行时间往往随着图像中人物数量的增多而增加,所以实时性也是一大挑战。 一种常见的方法是先用人物检测器把人检测出来,然后再...

【论文阅读】RTMPose:Real-Time Multi-Person Pose Estimation based on MMPose

RTMPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 代码和模型开源地址:RTMPose。 在计算能力有限的设备上执行robust且实时的多人姿态估计仍然是一项具有挑战性的任务,其还不足以达到令人满意的工业应用性能。 在本文,我们从以下5个方面探讨了影响2D多人姿态估计框架性能和latency的关键因素:范式(paradigm)、ba...

【论文阅读】RTMDet:An Empirical Study of Designing Real-Time Object Detectors

RTMDet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 官方github repo:RTMDet。 官方文档:RTMDET 原理和实现全解析。 我们的目的旨在突破YOLO系列模型的极限,提出一个新的用于目标检测的实时模型家族,称为RTMDet(Real-Time Models for object Detection,RTM也可以理...

【论文阅读】Effective Whole-body Pose Estimation with Two-stages Distillation

DWPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction whole-body pose estimation是一个很重要的课题,目前的一些流行算法,比如OpenPose和MediaPipe,其性能并不能令人满意。和只检测body-only keypoints相比,whole-body pose estimation面临着更多的挑战: 更加细...

【论文阅读】Focal Loss for Dense Object Detection

Focal Loss,RetinaNet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:code。 目前SOTA的目标检测器都是two-stage的、由proposal驱动的机制。比如R-CNN框架,第一阶段生成一组稀疏的候选目标位置,第二阶段使用卷积神经网络将每个候选位置分为前景或背景。后续的two-stage框架(Fast R-CNN、Faster R-CNN...

【论文阅读】YOLOX:Exceeding YOLO Series in 2021

YOLOX

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:YOLOX。 随着目标检测的发展,YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5)始终追求速度和精度之间的最佳平衡。目前,YOLOv5具有最优的平衡性能,在COCO上以13.7ms的速度达到了48.2%的AP(使用YOLOv5-L模型,输入为...

【YOLO系列】YOLOv5

YOLOv5

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Ultralytics YOLOv5 Architecture YOLOv5没有发表官方论文。官方github地址:yolov5。本博文参考官方文档,因为YOLOv5还在不断的更新,本博文介绍的是YOLOv5的v6.0/6.1版本。 2.Model Structure YOLOv5框架包含3个主要部分: B...

【论文阅读】YOLOv4:Optimal Speed and Accuracy of Object Detection

YOLOv4

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 开源代码:https://github.com/AlexeyAB/darknet。 目前精度比较高的网络模型都不能做到实时检测,并且需要多个GPU来完成训练。我们提出一个可以实时检测的CNN模型,且训练只需要一块GPU即可。我们提出的YOLOv4的性能结果见Fig1。 我们的贡...

【论文阅读】Path Aggregation Network for Instance Segmentation

PANet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 我们发现Mask R-CNN中的信息传播可以进一步被改善。具体来说,low level的特征有利于识别大型实例,但从低级特征到高级特征需要走过很长的路径,这增加了获取准确定位信息的难度。此外,每个proposal来自一个feature level,放弃了其他level中可能有用的信息。最后,m...

【论文阅读】Mask R-CNN

Mask R-CNN

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 我们提出的用于实例分割的方法叫做Mask R-CNN,其通过在Faster R-CNN上新添加一个与类别分支和bounding box回归分支平行的一个mask分支,用于在每个RoI上预测分割mask,见Fig1。mask分支是应用在每个RoI上的一个小型FCN,通过pixel-to-pixe...