cda

数字化人才认证

首页 > 行业图谱 >

关于层次聚类算法原理的简单理解及实现

关于层次聚类算法原理的简单理解及实现
2020-07-14
层次聚类,即Hierarchical Clustering,是一种聚类算法,通过对不同类别数据点间的相似度的计算,从而创建一棵有层次的嵌套聚类树。 一、层次聚类算法原理 在聚类树中,树的最底层是不同类别的原始数据点, ...

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你
2020-07-14
CDA数据分析师 出品 作者:Mika、真达 数据:真达 后期:泽龙 【导读】今天我们用数据来聊一聊口味虾。 Show me data,用数据说话 今天我们聊一聊 口味虾 说起湖南这个地方,大家想到的 ...

机器学习中感知机是什么?如何实现?

机器学习中感知机是什么?如何实现?
2020-07-10
感知机(Perceptron)或者叫做感知器,是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络,是机器学习领域最基础的模型,被誉为机器学习的敲门砖。 ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

零基础学习python,这几本书少不了

零基础学习python,这几本书少不了
2020-07-10
python是世界上最强大、最受欢迎的编程语言之一,即使不是程序员,我们平时在工作中也会经常用到,例如用python分析竞品数据,做财务报表等等。目前,社会上已经掀起了一波学习python的热潮,但是很多人由于并 ...

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?
2020-07-07
CDA数据分析师 出品 作者:泽龙、Mika 数据:真达 后期:泽龙 【导读】 CBA重启开赛,辽宁为什么从冠军队变成鱼腩队?是侄子坑叔,还是亚洲第一控卫变身综艺咖,本期我们用全面的数据证明到底 ...

 这几个常用的python库你需要知道

这几个常用的python库你需要知道
2020-07-02
python可以说是近几年最火热、最实用的、最容易上手的工具之一了。功能强大、应用广泛,可以帮你搜集工作数据,还能帮你下载音乐,电影,于是就掀起了一波学习python的大潮,小编也毫不犹豫的加入了。但是对于向小 ...

seaborn的简单理解和入门

seaborn的简单理解和入门
2020-07-02
seaborn是建立在Matplotlib基础之上的高级的API,是比Matplotlib更为高级的的一种python可视化库。专攻于统计可视化,有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图(jointplots)和小提琴图(violind ...

实用又好看的Python可视化库有哪些?

实用又好看的Python可视化库有哪些?
2020-07-02
Python是一款功能强大的数据分析工具,其中Python可视化功能更是受到许多数据分析师的青睐,下面小编就给大家分享一些Python可视化库,希望对各位数据分析师小伙伴有所帮助。 1.Matplotlib Matplotlib是一个 ...
数据可视化工具有哪些?
2020-06-28
数据可视化是数据分析中最好展示数据的方法,能够形象地绘制对应的图像,能够让人更直观地理解数据。下面小编整理了几种数据可视化工具,希望对各位小伙伴有所帮助。 1.Excel Excel是很多人使用的数据可视化 ...

手把手教你用直方图、饼图和条形图做数据分析(Python代码)

手把手教你用直方图、饼图和条形图做数据分析(Python代码)
2020-06-24
导读:对数据进行质量分析以后,接下来可通过绘制图表、计算某些特征量等手段进行数据的特征分析。 作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据 ...

从数据小白到职场大咖,所需要的好书我都替你选好了!

从数据小白到职场大咖,所需要的好书我都替你选好了!
2020-06-23
通过Google用户搜索频率来统计排名的PYPL排行榜显示,Python份额高达29.88%,稳居第一,并且猛增4.1%,同时成为增长势头最好的语言。 PYPL排行榜 另据圈内知名网站Stack Overflow的数据显示,其实早在 ...

机器学习基础:无监督异常检测和半监督异常检测!

机器学习基础:无监督异常检测和半监督异常检测!
2020-06-12
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。离群点和新奇点检测是不同的,有一个重要的区分必须掌 ...

【案例】用支持向量机SVM进行新奇点检测!

【案例】用支持向量机SVM进行新奇点检测!
2020-06-12
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。 下图是一个使用支持向量机SVM进行新奇点检测 ...

机器学习经典算法之k-means聚类

机器学习经典算法之k-means聚类
2020-06-10
K-means算法旨在选择一个质心, 能够最小化惯性或簇内平方和的标准: K-means算法原理分析 首先随机选取K个初始质心,最基本的方法是从数据集$X$中选择$K$个样本。 将每 ...

百闻不如一练:随机森林等可视化调试模型超参数

百闻不如一练:随机森林等可视化调试模型超参数
2020-06-10
以下使用scikit-learn中数据集进行分享。 如果选用随机森林作为最终的模型,那么找出它的最佳参数可能有1000多种组合的可能,你可以使用使用穷尽的网格搜索(Exhaustive Grid Seaarch)方法,但时间成本将会很 ...

层次聚类算法:Affinity Propogation算法学习指南

层次聚类算法:Affinity Propogation算法学习指南
2020-06-10
Affinity Propogation最初是由Brendan Frey 和 Delbert Dueck于2007年在Science上提出的。相比其它的层次聚类算法,Affinity Propogation算法不需要预先指定聚类个数。 Affinity Propogation算法的原理可以简单 ...

python散点图:如何添加拟合线并显示拟合方程与R方?

python散点图:如何添加拟合线并显示拟合方程与R方?
2020-06-08
python散点图:如何添加拟合线并显示拟合方程与R方?我们可以使用polyfit()函数,使用最小二乘法将一些点拟合成一条曲线. numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False) # x:要拟合点的 ...

如何用python绘制简单条形图?

如何用python绘制简单条形图?
2020-06-01
如何用python绘制简单条形图呢?这里离不开matplotlib的使用。 条形图是数据可视化图形中很基础也很常用的一种图,简单解释下:条形图也叫长条图(英语:bar chart),亦称条图(英语:bar graph)、条状图、棒 ...

使用python来绘制漂亮的图表:seaborn篇!

使用python来绘制漂亮的图表:seaborn篇!
2020-05-27
延续上一篇pandas的文章,我们继续来探讨python中的seaborn,能画出多么高级和漂亮的图标。 漂亮:seaborn的高级绘图

OK