x-jeff blog

Make progress every day.

【论文阅读】Best Practices for Convolutional Neural Networks Applied to Visual Document Analysis

Elastic Distortions

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.前言 本博文只介绍原文第2部分:使用弹性形变来扩展图像数据。如对全文感兴趣,请移步至全文链接。 2.Expanding Data Sets through Elastic Distortions 通过应用变换(transformations)来生成额外的数据,促使算法学习到变换不变性(transformation ...

【C++基础】第三十八课:特殊用途语言特性

默认实参,内联函数,constexpr函数,assert,NDEBUG,__func__,__FILE__,__LINE__,__TIME__,__DATE__

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.前言 本文我们介绍三种函数相关的语言特性,这些特性对大多数程序都有用,它们分别是:默认实参、内联函数和constexpr函数,以及在程序调试过程中常用的一些功能。 2.默认实参 调用含有默认实参的函数时...

【论文阅读】Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

SPP-net

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 目前的CNN网络存在一个技术问题:网络输入必须是固定尺寸(比如$224 \times 224$)。通常通过对原始图像进行crop或者warp来使其满足网络输入的尺寸要求,如Fig1所示。但是crop可能会导致目标裁剪不全,warp则会改变目标原始几何比例。这种信息丢失以及形变会进一步影响模型性...

【OpenCV基础】第二十九课:图像矩

图像矩,Hu矩,几何矩,中心矩,归一化中心矩,cv::moments,cv::HuMoments,cv::contourArea,cv::arcLength

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.图像矩 矩是概率与统计中的一个概念,是随机变量的一种数字特征。详细解释请见:随机变量的矩。 图像的矩(image moments)主要表征了图像区域的几何特征,又称为几何矩,由于其具有旋转、平移、尺度等特性的不变特征,所以又称其为不变矩。 M.K.Hu在1961年首先提出了不变矩的概念。1979年M.R.Teagu...

【Python基础】第三十四课:模型评估方法

留出法,train_test_split,交叉验证法,KFold,cross_val_score,留一法,LeaveOneOut

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.留出法 “留出法”详解请见:链接。 👉引用数据与建立模型: 1 2 3 4 5 6 from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier iris = load_iris() X = i...

【机器学习基础】第三十四课:聚类之距离计算

距离度量,闵可夫斯基距离,VDM(Value Difference Metric),MinkovDM,非度量距离

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.距离计算 对于【机器学习基础】第三十三课:聚类之性能度量中的函数$dist(\cdot,\cdot)$,若它是一个“距离度量”,则需满足一些基本性质: 非负性:$dist(\mathbf{x_i},\mathbf{x_j}) \g...

【Tensorflow基础】第十一课:TFRecord的生成

TFRecord,tf.Graph().as_default(),tf.python_io.TFRecordWriter,tf.train.BytesList,tf.train.Int64List,tf.train.FloatList,tf.train.Feature,tf.train.Features,tf.train.Example,SerializeToString

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.tfrecord 1.1.什么是tfrecord tfrecord是Google官方推荐的一种数据格式,是Google专门为TensorFlow设计的一种数据格式。实际上,tfrecord是一种二进制文件,其能更好的利用内存,其内部包含了多个tf.train.Example,而Example是protocol buf...

【C++基础】第三十七课:函数重载

函数重载

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.函数重载 如果同一作用域内的几个函数名字相同但形参列表不同,我们称之为重载(overloaded)函数。例如: 1 2 3 void print(const char *cp); void print(c...

【论文阅读】Fully Convolutional Networks for Semantic Segmentation

FCN,shift-and-stitch,backwards convolution(deconvolution)

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Introduction 卷积神经网络不仅推动了图像分类任务的发展,也促进了定位任务的发展,例如bounding box。 可以很自然的想到定位任务的下一步应该是语义分割(semantic segmentation),其实就是每一个像素点都有一个所属的类别标签。但是之前的方法或多或少都有一些缺点,而本文提出的方法可以...

【OpenCV基础】第二十八课:轮廓周围绘制矩形框和圆形框

道格拉斯-普克算法(RDP算法或DP算法),cv::approxPolyDP,cv::boundingRect,cv::minAreaRect,cv::minEnclosingCircle,cv::fitEllipse

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.轮廓检测 轮廓检测:【OpenCV基础】第二十六课:轮廓发现。 2.道格拉斯-普克算法 拉默-道格拉斯-普克算法(Ramer–Douglas–Peucker algorithm),又称道格拉斯-普克算法(Douglas–Peucker algorithm)和迭代端点拟合算法(iterative end-point ...