x-jeff blog

Make progress every day.

【机器学习基础】第四课:统计学知识之假设检验

t检验,方差分析,卡方检验,秩检验

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.比较检验 先使用某种实验评估方法测得学习器的某个性能度量结果,然后对结果进行比较,不能单纯地直接取得性能度量的值然后“比”大小,需要有统计学意义。 在现实任务中我们并不知道学习器的泛化错误率,只能获知其测试错误率。因此本文以测试错误率作...

【C++基础】第一课:函数

main函数,函数定义

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.函数定义 每个C++程序都包含一个或多个函数(function),其中必须且只能有一个函数命名为main函数。操作系统通过调用main来运行C++程序,一般为C++程序的入口函数。例如: 1 2 3 int...

【OpenCV基础】第一课:OpenCV环境配置

环境配置

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.OpenCV简介 OpenCV是一个计算机视觉的开源库。英文全称是:Open Source Computer Vision Library。 常用的OpenCV的核心模块: Image Process Camera Calibration and 3D Reconstruction Video Anal...

【计算机基础】初识编译器

gcc,clang,make,cmake,

本文由自己在网络上收集的相关资料整理而成,并在文章末尾标明了引用出处。 1.编译流程 源代码(source code) 预处理器(preprocessor) 编译器(compiler) 目标代码(object code) 链接器(linker) 可执行程序(executables) 1.1.源代码 源代码一般为高级语言,如C、C++、Python、J...

【Python基础】第三课:Python应用之文本的词频统计

词频统计

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.词频统计(方法一) 首先,我们先输入一段文本: 1 ai_text='''Knowledge engineering is a core part of AI research. Machines can often act and react like humans only if they have abunda...

【数学基础】第三课:极限

极限,无穷大,无穷小,洛必达法则

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.极限的定义 极限:$\lim_{x \to x_0} f(x)=L$,表示函数$f(x)$在$x_0$处的极限为$L$。 2.无穷小和无穷小的阶数 无穷小的定义:若$x\to x_0$(或$x\to\infty$)时,函数$f(x)\to 0$,则称函数$f(x)$为$x\to x_0$时的无穷小。 2.1.无穷小的...

【机器学习基础】第三课:模型性能度量

查全率,查准率,F值,P-R曲线,ROC,AUC,代价敏感错误率,代价曲线

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.均方误差 使用不同的性能度量往往会导致不同的评判结果。 例如,$f(x)$为预测结果,$y$为真实标记。 回归问题中,最常用的性能度量为“均方误差”: \[E(f;D)=\frac{1}{m}\sum_{i=1}^m(f(x_i)-y...

【数学基础】第二课:目标函数、损失函数、代价函数

目标函数,损失函数,代价函数,经验风险,结构风险

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.目标函数、损失函数、代价函数 关于损失函数(loss function)、代价函数(cost function)的概念有两种看法: 观点一:可认为是一样的。 观点二: 损失函数$\mid y_i-f(x_i)\mid$,一般针对单个个体。 代价函数$\frac{1}{N} \...

【Python基础】第二课:for循环、定义函数和模块导入

Python语法,for循环,if语句,定义函数,模块导入

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Python语法之for循环,if分支语句 1.1.for循环,if分支语句 (%表示取余数。) 需要注意几点: 在c++中会通过{}来表明嵌套关系,限定作用域。而在python中,则通过在语句前面添加空格(或者tab键,相当于四个空格)的方式实现。 for语句和if语句的后面都需要有冒号“:”。 如...

【机器学习基础】第二课:模型评估方法

误差,过拟合,留出法,交叉验证法,自助法

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.经验误差与过拟合 误差:把学习器的实际预测输出与样本的真实输出之间的差异称为“误差”。 训练误差(经验误差):学习器在训练集上的误差。 泛化误差:在新样本上的误差。 过拟合(又称过配) 欠拟合(又称欠配) 过拟...