x-jeff blog

Make progress every day.

【深度学习基础】第二十七课:机器学习策略(下)

错误分析,数据集的划分,数据不匹配问题,迁移学习,多任务学习,端到端的深度学习

【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.错误分析 对模型输出结果中的错误案例进行分析,以帮助我们更高效的寻找优化模型的方向。 以一个猫图片分类器为例,假设该分类器的错误率为10%。我们可以挑选出100个该分类器识别错误的图片。统计这100张图片错误的原因。比如可能有8%的图...

【机器学习基础】第十四课:决策树中的连续与缺失值

连续值处理,缺失值处理

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.连续值处理 到目前为止我们仅讨论了基于离散属性来生成决策树。本节我们来讨论在决策树学习中如何使用连续属性。 可将连续属性离散化,最简单的策略是二分法(C4.5决策树算法中采用的机制)。 给定样本集D和连续属性a,假定a在D上出现了n个...

【深度学习基础】第二十六课:机器学习策略(上)

机器学习策略,正交化,单一数字评估指标,优化指标,满足指标,人的表现,贝叶斯最优错误率,可避免偏差

【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.什么是机器学习策略 假设我们有一个分类器,其正确率只有90%,并不能满足我们的需求。 根据之前【深度学习基础】系列博客中介绍的诸多方法,你可能会有很多想法去优化这个分类器,例如: 收集更多的训练数据。 增加训练数据的多样性...

【C++基础】第十七课:数组

定义和初始化内置数组,访问数组元素,指针和数组

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.前言 与vector相似,数组也是存放类型相同的对象的容器,这些对象本身没有名字,需要通过其所在位置访问。与vector不同的地方是,数组的大小确定不变,不能随意向数组中增加元素。 如果不清楚元素的确切个...

【Tensorflow基础】第五课:模型优化

代价函数,网络结构,优化器,tf.truncated_normal

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.前言 我们以【Tensorflow基础】第四课:手写数字识别中构建的手写数字识别模型为例,对模型进行进一步的优化。 2.修改代价函数 在之前的模型中,我们用的是均方误差作为cost function。现在我们使用更合适的交叉熵损失函数作为cost function: 1 loss=tf.reduce_mean(t...

【OpenCV基础】第十一课:形态学操作的应用

提取水平线和垂直线,提取验证码

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.提取水平线和垂直线 在之前的博客【OpenCV基础】第十课:形态学操作中,我们介绍了很多形态学操作。其中,膨胀与腐蚀操作可以使用任意的结构元素,例如矩形、圆、直线等各种自定义形状。 提取水平线和垂直线的具体步骤见下: 1.1.步骤一:读入原始图像 使用imread函数读入原始图像: 1.2.步骤二:转换为灰...

【深度学习基础】第二十五课:深度学习框架

深度学习框架

【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.深度学习框架 至此,我们已经可以利用python以及numpy从零构建一个深度学习网络。但当网络非常大、结构非常复杂的时候,从零构建无疑是低效的。目前已经有了很多成熟的深度学习框架,帮助我们快速的搭建复杂的神经网络结构。 常见的深度学...

【Python基础】第十三课:资料处理实战应用

资料处理实战应用,位运算符,逻辑运算符

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.前言 利用之前几篇博客学习的资料处理的方法,对实际中遇到的资料进行处理。本文以一个储存学生信息的csv格式的资料为例。csv中存放的数据见下: 2.读入资料 利用pandas读入csv: 1 2 import pandas as pd df=pd.read_csv("student.csv") 如果数...

【深度学习基础】第二十四课:softmax函数的导数

softmax函数在神经网络中的反向传播

【深度学习基础】系列博客为学习Coursera上吴恩达深度学习课程所做的课程笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.softmax函数 👉softmax函数详解。 2.softmax函数的导数 假设神经网络输出层的激活函数为softmax函数,用以解决多分类问题。在反向传播时,就需要计算softmax函数的导数,这也就是本文着重介绍的内容。 我...

【数学基础】第十三课:参数估计

参数估计,点估计,区间估计,矩估计,极大似然估计,点估计的评判准则

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.参数估计 参数估计是统计推断的一种。根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。 从估计形式看,可分为: 点估计。 区间估计。 1.1.参数估计和假设检验 参数估计和假设检验是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断,但推断的角度不同。 参数估计讨论的是用样本统计量...