x-jeff blog

Make progress every day.

【LLM】一文读懂ChatGPT背后的技术

GPT1,GPT2,GPT3,GPT3.5,InstructGPT,GPT4

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.GPT1 原文链接:Improving Language Understanding by Generative Pre-Training Google在2017年6月发表了著名的Transformer,在一年之后,OpenAI在2018年6月发表了文章Improving Language Underst...

【论文阅读】OpenPose:Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

OpenPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION 多人姿态估计的一些特点:1)每张图像可能包含未知数量的人,并且这些人可能在任何位置以任意比例出现;2)由于人与人之间的接触、遮挡等原因,使得关节点和人物的匹配变得困难;3)运行时间往往随着图像中人物数量的增多而增加,所以实时性也是一大挑战。 一种常见的方法是先用人物检测器把人检测出来,然后再...

【论文阅读】RTMPose:Real-Time Multi-Person Pose Estimation based on MMPose

RTMPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 代码和模型开源地址:RTMPose。 在计算能力有限的设备上执行robust且实时的多人姿态估计仍然是一项具有挑战性的任务,其还不足以达到令人满意的工业应用性能。 在本文,我们从以下5个方面探讨了影响2D多人姿态估计框架性能和latency的关键因素:范式(paradigm)、ba...

【论文阅读】RTMDet:An Empirical Study of Designing Real-Time Object Detectors

RTMDet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 官方github repo:RTMDet。 官方文档:RTMDET 原理和实现全解析。 我们的目的旨在突破YOLO系列模型的极限,提出一个新的用于目标检测的实时模型家族,称为RTMDet(Real-Time Models for object Detection,RTM也可以理...

【论文阅读】Effective Whole-body Pose Estimation with Two-stages Distillation

DWPose

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction whole-body pose estimation是一个很重要的课题,目前的一些流行算法,比如OpenPose和MediaPipe,其性能并不能令人满意。和只检测body-only keypoints相比,whole-body pose estimation面临着更多的挑战: 更加细...

【论文阅读】Focal Loss for Dense Object Detection

Focal Loss,RetinaNet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:code。 目前SOTA的目标检测器都是two-stage的、由proposal驱动的机制。比如R-CNN框架,第一阶段生成一组稀疏的候选目标位置,第二阶段使用卷积神经网络将每个候选位置分为前景或背景。后续的two-stage框架(Fast R-CNN、Faster R-CNN...

【C++基础】第九十三课:[模板与泛型编程]定义模板

template,typename,函数模板,类模板

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.定义模板 假定我们希望编写一个函数来比较两个值,并指出第一个值是小于、等于还是大于第二个值。在实际中,我们可能想要定义多个函数,每个函数比较一种给定类型的值。我们的初次尝试可能定义多个重载函数: 1 2 ...

【程序是怎样跑起来的】第6章:亲自尝试压缩数据

RLE算法,莫尔斯编码,哈夫曼算法,可逆压缩,非可逆压缩

博客为参考《程序是怎样跑起来的》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.文件以字节为单位保存 👉第6章热身问答: 文件储存的基本单位是什么? 1字节(=8位)。文件是字节数据的集合体。 DOC、LZH和TXT这些扩展名中,哪一个是压缩文件的扩展名? LZH。L...

【论文阅读】YOLOX:Exceeding YOLO Series in 2021

YOLOX

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 源码:YOLOX。 随着目标检测的发展,YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5)始终追求速度和精度之间的最佳平衡。目前,YOLOv5具有最优的平衡性能,在COCO上以13.7ms的速度达到了48.2%的AP(使用YOLOv5-L模型,输入为...

【C++基础】第九十二课:[面向对象程序设计]文本查询程序再探

文本查询程序,set_intersection

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.文本查询程序再探 接下来,我们扩展【C++基础】第六十八课:[动态内存]使用标准库:文本查询程序中的文本查询程序,用它作为说明继承的最后一个例子。我们将针对下面这个小故事展开查询: 1 2 3 4 5 6...