cda

数字化人才认证

首页 > 行业图谱 >

Kmeans算法精简版(无for loop循环)

Kmeans算法精简版(无for loop循环)
2020-05-27
大家在学习算法的时候会学习到关于Kmeans的算法,但是网络和很多机器学习算法书中关于Kmeans的算法理论核心一样,但是代码实现过于复杂,效率不高,不方便阅读。这篇文章首先列举出Kmeans核心的算法过程 ...

机器学习python应用,简单机器学习项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

Python可视化工具推荐:图片交互性行极佳的Plotly

Python可视化工具推荐:图片交互性行极佳的Plotly
2020-05-25
1、 简单介绍 一般大家在学习python机器学习的时候,用的最多Python可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互 ...

kmeans优化算法:二分K-means聚类算法

kmeans优化算法:二分K-means聚类算法
2020-05-21
Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢?就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的 ...

sparkSQL和spark有什么区别?

sparkSQL和spark有什么区别?
2020-05-14
Spark为结构化数据处理引入了一个称为Spark SQL的编程模块。简而言之,sparkSQL是Spark的前身,是在Hadoop发展过程中,为了给熟悉RDBMS但又不理解MapReduce的技术人员提供快速上手的工具。 sparkSQL提供了一 ...

Python可视化工具:Plotly

Python可视化工具:Plotly
2020-05-09
一般大家在学习python机器学习的时候,用的最多的可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互,简单来说就是matplot和se ...

全国多地新冠病例0增长,教你用Python画出当下疫情最火玫瑰图!

全国多地新冠病例0增长,教你用Python画出当下疫情最火玫瑰图!
2020-04-28
CDA数据分析师 出品 近日,新冠肺炎防控成果的好消息不断。 今天我们聊聊,惊艳的疫情直观图。 据国家卫健委数据统计, 截止至3月10日24时,31省区市累计治愈出院病历超6 ...

Python数据分析之pandas数据结构

Python数据分析之pandas数据结构
2020-03-31
作者 | CDA数据分析师 之前的文章写了Python的基础知识,从这部分内容开始正式进入到正式的数据分析过程中,主要讲述每个数据分析过程都会用到什么操作,这些操作用Excel是怎样实现 ...

Python数据分析入门教程(五):数据运算

Python数据分析入门教程(五):数据运算
2020-03-31
两列相加的具体实现如下图所示: 两列相乘的具体实现如下图所示: ...

Python数据分析基础入门(一):获取数据源

Python数据分析基础入门(一):获取数据源
2020-03-27
作者 | CDA数据分析师 俗话说,巧妇难为无米之炊。不管你厨艺有多好,如果没有食材,也做不出香甜可口的饭菜来,所以想要做出饭菜来,首先要做的就是要买米买菜。而数据分析就好比是做饭, ...

如何通过分类数据执行特征选择?

如何通过分类数据执行特征选择?
2020-03-09
作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是识别和选择与目标变量最相关的输入特征子集的过程。 使用实值数据(例如使用Pearson的相关系数)时,特征选择通常很简单,但是 ...

深度学习编码分类变量的3种方法

深度学习编码分类变量的3种方法
2020-03-09
作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字。 这意味着,如果你的数据包含分类数据,则必须先将其编码为数字,然后才能拟合和评估模型。 两 ...

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?
2020-02-22
CDA数据分析师 出品 今年的第92届奥斯卡可谓是大片云集,入围的影片不仅艺术性极高,而且市场口碑都极佳。当中有黑帮片《爱尔兰人》,经典IP《小妇人》,昆汀的《好莱坞往事》,战争片《1917》,另类超级 ...

《囧妈》口碑扑街?Python告诉你,为何这次观众不买账了

《囧妈》口碑扑街?Python告诉你,为何这次观众不买账了
2020-02-05
CDA数据分析师 出品 【导语】:今天我们就来聊聊另类春节档的唯一一部电影《囧妈》,Python技术部分可以直接看第三部分。 2020年的春节档之前被誉为神仙打架,各显神通,可以说是史上最强的春节档, ...

Python数据分析之pandas数据结构

Python数据分析之pandas数据结构
2020-01-16
作者 | CDA数据分析师 之前的文章写了Python的基础知识,从这部分内容开始正式进入到正式的数据分析过程中,主要讲述每个数据分析过程都会用到什么操作,这些操作用Excel是怎样实现的,如果用Python,那么 ...

Python数据分析入门教程(五):数据运算

Python数据分析入门教程(五):数据运算
2020-01-16
作者 | CDA数据分析师 进行到这一步就可以算是开始正式的烹饪了,在这部分之前的数据操作部分我们列举了一些不同维度的分析指标,这一章我们主要看看这些指标都是怎么计算出来的。 一、算术运算 ...

Python数据分析入门教程(四):数值操作

Python数据分析入门教程(四):数值操作
2020-01-16
作者 | CDA数据分析师 我们把菜品挑选出来以后,就可以开始切菜了。比如要做凉拌黄瓜丝,把黄瓜找出来以后,那就可以把黄瓜切成丝了。 一、数值替换 数值替换就是将数值A替换成B,可以用在异常值 ...

Python数据分析入门教程(一):获取数据源

Python数据分析入门教程(一):获取数据源
2020-01-16
作者 | CDA数据分析师 俗话说,巧妇难为无米之炊。不管你厨艺有多好,如果没有食材,也做不出香甜可口的饭菜来,所以想要做出饭菜来,首先要做的就是要买米买菜。而数据分析就好比是做饭,首先也应该是准 ...

数据分析实践入门(四):数据运算

数据分析实践入门(四):数据运算
2020-01-08
作者 | CDA数据分析师 进行到这一步就可以开始正式的烹饪了。前面我们列举了不同纬度的分析指标,这一章我们主要看看这些指标都是怎么计算出来的。 一、算术运算 算术运算就是基本的加减乘 ...

数据分析实践入门(三):数值操作

数据分析实践入门(三):数值操作
2020-01-06
作者 | CDA数据分析师 我们把菜品挑选出来以后,就可以开始切菜了。比如要做凉拌黄瓜丝,吧黄瓜找出来以后,你就可以把黄瓜切成丝了。 一、数值替换 数值替换就是 ...

OK