x-jeff blog

Make progress every day.

【Python基础】第三十七课:使用Python实现层次聚类

层次聚类,Agglomerative,Divisive,sch.linkage,sch.dendrogram,AgglomerativeClustering,single(the Nearest Point Algorithm),complete(the Farthest Point Algorithm,Voor Hees Algorithm),average(UPGMA),weighted(WPGMA),centroid(UPGMC),median(WPGMC),ward(Ward's minimum variance method),Lance–Williams algorithm

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.使用Python实现层次聚类 层次聚类的介绍请见:【机器学习基础】第三十七课:聚类之层次聚类。层次聚类有“Agglomerative”(bottom-up)和“Divisive”(top-down)两种方式: 👉使用scipy绘制树状图: 1 2 3 4 5 6 7 8 9 10 11 12 from skle...

【机器学习基础】第三十七课:聚类之层次聚类

层次聚类,AGNES算法

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.层次聚类 层次聚类(hierarchical clustering)试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集的划分可采用“自底向上”的聚合策略,也可采用“自顶向下”的分拆策略。 AGNES(AGglomerativ...

【Tensorflow基础】第十四课:CNN在自然语言处理的应用

tf.app.flags,tf.app.run,tf.flags,re.sub,VocabularyProcessor,np.random.permutation,tf.ConfigProto,compute_gradients,apply_gradients,tf.nn.zero_fraction,os.path.abspath,os.path.curdir,datetime.datetime.now().isoformat(),yield,tf.train.global_step

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.CNN在自然语言处理的应用 CNN通常应用于计算机视觉领域。但近几年CNN也开始应用于自然语言处理,并取得了一些引人注目的成绩。 CNN应用于NLP任务,处理的往往是以矩阵形式表达的句子或文本。矩阵中的每一行对应于一个分词元素,一般是一个单词,也可以是一个字符。假设我们一共有10个词,每个词都用128维的向量表示,那...

【C++基础】第四十课:函数指针

函数指针

【C++基础】系列博客为参考《C++ Primer中文版(第5版)》(C++11标准)一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.函数指针 函数指针指向的是函数而非对象。和其他指针一样,函数指针指向某种特定类型。函数的类型由它的返回类型和形参类型共同决定,与函数名无关。例如: 1 2 //比较两个string对象的长度 bool l...

【OpenCV基础】第三十一课:基于距离变换与分水岭的图像分割

距离变换,cv::distanceTransform,分水岭算法,Geodesic Distance,cv::watershed,cv::imshow,cv::inRange

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.距离变换 1.1.原理介绍 距离变换于1966年被学者首次提出,目前已被广泛应用于图像分析、计算机视觉、模式识别等领域,人们利用它来实现目标细化、骨架提取、形状插值及匹配、粘连物体的分离等。距离变换是针对二值图像的一种变换,是计算并标识空间点(对目标点)距离的过程,它最终把二值图像变换为灰度图像(其中每个栅格的灰度值...

【Python基础】第三十六课:评估不同客户流失分析模型

SVC(),feature_importances_

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.读取客户流失数据 1 2 3 4 5 # 读取客户流失数据 import pandas df = pandas.read_csv("customer_churn.csv", index_col=0, header=0) print(df.head()) 1 2 3 4 5 6 7 8 state accou...

【机器学习基础】第三十六课:聚类之密度聚类

密度聚类,DBSCAN算法

【机器学习基础】系列博客为参考周志华老师的《机器学习》一书,自己所做的读书笔记。 本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.密度聚类 密度聚类亦称“基于密度的聚类”(density-based clustering),此类算法假设聚类结构能通过样本分布的紧密程度确定。通常情形下,密度聚类算法从样本密度的角度来考察样本之间的可连接性,并基于可连接样本不断扩展聚类...

【论文阅读】GAUSSIAN ERROR LINEAR UNITS (GELUS)

Gaussian Error Linear Unit(GELU)激活函数,Sigmoid Linear Unit(SiLU)激活函数

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.ABSTRACT 本博文只介绍原文的部分章节,原文链接在本文末尾。 我们提出Gaussian Error Linear Unit(GELU),一种高性能的神经网络激活函数。GELU可表示为$x\Phi (x)$,其中$\Phi (x)$为标准高斯累积分布函数(即概率分布函数)。我们将GELU和ReLU、ELU...

【论文阅读】FAST AND ACCURATE DEEP NETWORK LEARNING BY EXPONENTIAL LINEAR UNITS (ELUS)

exponential linear unit(ELU)激活函数,Shifted ReLU(SReLU)激活函数

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.ABSTRACT 本博文只介绍原文的部分章节,原文链接在本文末尾。 我们提出“exponential linear unit”(ELU),它可以加快深层神经网络的学习并提高分类精度。与ReLU、Leaky ReLU(LReLUs)和parametrized ReLU(PReLUs)一样,ELU也可以缓解梯度消...

【Tensorflow基础】第十三课:Word2Vec

os.path.exists,urllib.request.urlretrieve,os.stat,zipfile.ZipFile,ZipFile.namelist,tf.compat.as_str,collections.deque,random.randint,numpy.random.choice,tf.nn.embedding_lookup,tf.nn.nce_loss,xrange,argsort,TSNE降维可视化,tf.random_uniform

本文为原创文章,未经本人允许,禁止转载。转载请注明出处。 1.Word2Vec Word2Vec相关知识请见:【深度学习基础】第四十五课:自然语言处理与词嵌入。 2.代码实现 👉载入包: 1 2 3 4 5 6 7 8 9 10 import collections import math import os import random import zipfile im...