x-jeff blog

Make progress every day.

【论文阅读】Swin Transformer:Hierarchical Vision Transformer using Shifted Windows

Swin Transformer

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction github官方repo:https://github.com/microsoft/Swin-Transformer。 计算机视觉领域的建模一直被CNN所主导。从AlexNet在ImageNet图像分类挑战上的优异表现开始,CNN通过更大的规模、更广泛的连接和更复杂的卷积形式变得越来...

【论文阅读】ViTPose:Simple Vision Transformer Baselines for Human Pose Estimation

ViTPose,Human Pose Estimation

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction github官方repo:https://github.com/ViTAE-Transformer/ViTPose。 人体姿态估计是计算机视觉领域一个重要的任务类型,并且其在真实世界中有着广泛的应用场景。人体姿态估计任务的目标是定位人体解剖关节点,但由于各种形式的遮挡、截断、缩放以及...

【论文阅读】Distribution-Aware Coordinate Representation for Human Pose Estimation

DARK

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 人体姿态估计(Human Pose Estimation)是计算机视觉领域的一个基础问题,用于检测人体关节点的空间位置(比如坐标)。人体姿态估计是一个非常重要且有一定难度的任务,因为会有不同风格的衣服、各种形式的遮挡以及不受限制的背景,并且我们还需要确定很细粒度的关节点坐标。CNN作为很强的图...

【C++基础】第五十三课:[顺序容器]vector对象是如何增长的

shrink_to_fit,capacity,size,reserve

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.vector对象是如何增长的 为了支持快速随机访问,vector将元素连续存储—每个元素紧挨着前一个元素存储。 假定容器中元素是连续存储的,且容器的大小是可变的,考虑向vector或string中添加元素...

【机器学习基础】第四十课:[降维与度量学习]主成分分析

主成分分析(PCA),矩阵的内积(弗罗比尼乌斯内积),矩阵的外积(克罗内克积)

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.主成分分析 【数学基础】第十六课:主成分分析 主成分分析(Principal Component Analysis,简称PCA)是最常用的一种降维方法。在介绍PCA之前,不妨先考虑这样一个问题:对于正交属性空间中的样本点,如何用...

【C++基础】第五十二课:[顺序容器]顺序容器操作

push_back,emplace_back,push_front,emplace_front,insert,emplace,.back(),.front(),.at(n),pop_back,pop_front,erase,clear,before_begin,cbefore_begin,insert_after,emplace_after,erase_after,resize

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.顺序容器操作 顺序容器和关联容器的不同之处在于两者组织元素的方式。这些不同之处直接关系到了元素如何存储、访问、添加以及删除。在【C++基础】第五十一课:[顺序容器]容器库概览一文中介绍了所有容器都支持的操作...

【啊哈!算法】第一章:一大波数正在靠近-排序

桶排序,冒泡排序,快速排序

博客为参考《啊哈!算法》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.最快最简单的排序-桶排序 👉相关博文:【算法基础】【排序】桶排序。 假设有5个学生,分数分别为5分、3分、5分、2分和8分。现在希望编写一段程序让计算机随机读入5个数然后将这5个数从小到大输出。 首先,我们申请一个大小为11的数组int a[11]: ...

【论文阅读】AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE

Vision Transformer(ViT)

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION 基于自注意力机制的框架,尤其是Transformers,已经成为了NLP任务的首选模型。主流的方式是在大型文本语料库上进行预训练,然后在较小的特定任务数据集上进行fine-tune。由于Transformers的计算效率和可扩展性,使得训练超过100B参数数量的巨大模型成为可能。并且随着模型和...

【C++基础】第五十一课:[顺序容器]容器库概览

容器操作,iterator,const_iterator,size_type,difference_type,构造函数,赋值,swap,size(),max_size(),empty(),关系运算符,获取迭代器

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.容器库概览 容器类型上的操作形成了一种层次: 某些操作是所有容器类型都提供的。 另外一些操作仅针对顺序容器、关联容器或无序容器。 还有一些操作只适用于一小部分容器。 本文将介绍对所有容器...

【第1章:对程序员来说CPU是什么】CPU是寄存器的集合体

累加寄存器,标志寄存器,程序计数器,基址寄存器,变址寄存器,通用寄存器,指令寄存器,栈寄存器

博客为参考《程序是怎样跑起来的》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.CPU是寄存器的集合体 CPU的四个构成部分中,我们只需了解寄存器即可。因为程序是把寄存器作为对象来描述的。 首先我们来看一下代码清单1-1: 这是用汇编语言(assembly)$^{1}$编写的程序的一部分。汇编语言采用助记符(memonic)来编写...