x-jeff blog

Make progress every day.

【机器学习基础】第六十五课:[概率图模型]学习与推断

变量消去,信念传播,边际分布

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.学习与推断 基于概率图模型定义的联合概率分布,我们能对目标变量的边际分布(marginal distribution)或以某些可观测变量为条件的条件分布进行推断。条件分布我们已经接触过很多,例如在隐马尔可夫模型中要估算观测序列$\math...

【论文阅读】NEURAL ARCHITECTURE SEARCH WITH REINFORCEMENT LEARNING

NAS

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION 本文提出了NAS(Neural Architecture Search),是一种用于搜索最优网络结构的方法,见Fig1。 2.RELATED WORK 不再详述。 3.METHODS 3.1.GENERATE MODEL DESCRIPTIONS WITH A CONTROLLER...

【论文阅读】RE-PARAMETERIZING YOUR OPTIMIZERS RATHER THAN ARCHITECTURES

结构重参数化,梯度重参数化,RepOptimizers,CSLA,RepOpt-VGG

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION GitHub地址:https://github.com/DingXiaoH/RepOptimizers。 由于在设计模型结构时,我们并未接触到任何数据样本,因此我们将其称之为结构先验。高质量的结构先验对于神经网络至关重要。通常,更好的结构先验会带来更高的性能。 除了结构设计之外,优...

【论文阅读】SIoU Loss:More Powerful Learning for Bounding Box Regression

SIoU

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 不再详述。 2.Methods SIoU的全称是SCYLLA-IoU。SIoU损失函数包含4部分: 角度损失(angle cost) 距离损失(distance cost) 形状损失(shape cost) IoU损失(IoU cost) 2.1.Angle cos...

【论文阅读】Distance-IoU Loss:Faster and Better Learning for Bounding Box Regression

DIoU,CIoU

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction IoU的计算见下: \[IoU = \frac{\lvert B \cap B^{gt} \rvert}{\lvert B \cup B^{gt} \rvert} \tag{1}\] 其中,$B^{gt} = (x^{gt},y^{gt},w^{gt},h^{gt})$为GT box,$B...

【论文阅读】Generalized Intersection over Union:A Metric and A Loss for Bounding Box Regression

GIoU

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction IoU也称为Jaccard index。在本篇论文的背景中,大家常用的用于计算bbox回归损失的方式有两种: 计算预测bbox和GT bbox对应角点之间的距离作为回归损失。这种情况下,通常用左上角和右下角的点坐标来表示bbox,即$(x_1,y_1,x_2,y_2)$。损失计算使用$...

【论文阅读】YOLOv7:Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

YOLOv7

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction github源码地址:https://github.com/WongKinYiu/yolov7。 本文提出的方法不仅在网络结构上进行优化,还将重点关注训练过程的优化。我们将引入一些优化模块和训练方法,虽然这些方法可能会增加训练成本,但不会提升推理成本,从而在不影响推理速度的前提下提高...

【论文阅读】RepVGG:Making VGG-style ConvNets Great Again

RepVGG

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 经典的网络结构VGG由卷积、ReLU、pooling堆叠而成,结构非常简单,但在图像识别领域取得了巨大成功。随着Inception(Inception-v1、BN-Inception、Inception-v2/v3、Inception-v4/ResNet)、ResNet、DenseNet的出现...

【论文阅读】ShuffleNet V2:Practical Guidelines for Efficient CNN Architecture Design

ShuffleNet V2

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 评估CNN模型的两个重要指标:精度和计算复杂度。衡量计算复杂度最常用的是FLOPs。但FLOPs并不完全等同于推理速度,相同的FLOPs可能会有不同的推理速度,如Fig1(c)(d)所示。因此,使用FLOPs作为计算复杂度的唯一指标可能会导致次优设计。 FLOPs和推理速度不能完全等同可...

【论文阅读】Squeeze-and-Excitation Networks

SENet

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.INTRODUCTION 通过研究通道间的关系,提出了新的框架单元,称为SE block(Squeeze-and-Excitation),其结构见下: $\mathbf{F}_{tr}$表示从feature map $\mathbf{X}$到feature map $\mathbf{U}$的转换,比如$\math...