cda

数字化人才认证

首页 > 行业图谱 >

Kmeans优化算法:二分K-means聚类算法

Kmeans优化算法:二分K-means聚类算法
2020-05-29
算法的理解 Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢,就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代 ...

使用python构建一个推荐系统需要几步?

使用python构建一个推荐系统需要几步?
2020-05-29
在我看来,作为一位中国人的我们不管做什么决定都在面临多种选择。例如,如果我这个时候想要买一本书,但是我却不知道我想看什么书、不知道类型、不知道方向,那么这个时候打开各种进行软件搜索可能会出现各种各样 ...

使用python来绘制漂亮的图表:seaborn篇!

使用python来绘制漂亮的图表:seaborn篇!
2020-05-27
延续上一篇pandas的文章,我们继续来探讨python中的seaborn,能画出多么高级和漂亮的图标。 漂亮:seaborn的高级绘图

Kmeans算法精简版(无for loop循环)

Kmeans算法精简版(无for loop循环)
2020-05-27
大家在学习算法的时候会学习到关于Kmeans的算法,但是网络和很多机器学习算法书中关于Kmeans的算法理论核心一样,但是代码实现过于复杂,效率不高,不方便阅读。这篇文章首先列举出Kmeans核心的算法过程 ...

机器学习python应用,简单机器学习项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

机器学习python算法应用,监督学习、无监督学习等!

机器学习python算法应用,监督学习、无监督学习等!
2020-05-25
本系列文章主要介绍机器学习在实践中的应用,介绍利用 python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大 ...

傻傻分不清系列 | python中各种字符串处理方法

傻傻分不清系列 | python中各种字符串处理方法
2020-05-25
python易混淆知识系列:pandas字符串方法和字符串内建函数,使用python的一个优势就是字符串处理起来比较容易。 Python的初学者在学习字符串内建函数的时候往往会很困惑:字符串的内建函数是对单个字符串对象处 ...

傻傻分不清楚系列 | python中各种时间处理方法(上)

傻傻分不清楚系列 | python中各种时间处理方法(上)
2020-05-25
趁着宅在家躲疫情的间隙,托福司机重新对这3块知识内容重新梳理,及时制止内心的土拨鼠继续呐喊,现分享给大家。 1. time库与datetime库的关系 而datetime库比time库高级了不少,提供了更多实用的方法,可以 ...

Python可视化工具推荐:图片交互性行极佳的Plotly

Python可视化工具推荐:图片交互性行极佳的Plotly
2020-05-25
1、 简单介绍 一般大家在学习python机器学习的时候,用的最多Python可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互 ...

kmeans优化算法:二分K-means聚类算法

kmeans优化算法:二分K-means聚类算法
2020-05-21
Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢?就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的 ...

python中DataFrame无法使用,怎么办?

python中DataFrame无法使用,怎么办?
2020-05-13
一般来说,python中DataFrame是可以执行的,可能是初学者在使用过程中,引入了两个DataFrame,导致pandas的DataFrame被覆盖,从而无法运行。 引用zdpandas的DataFrame 我们不会直接引入DataFrame,而是 ...

Series是什么?

Series是什么?
2020-05-12
Series数据结构 Series是一种类似于一位数组的对象,由一组数据及一组与之相关的数据标签(即索引)组成。 上面这样的数据结构就是Series,第一列数字是数据标签,第二列是具体的数据 ...

Python可视化工具:Plotly

Python可视化工具:Plotly
2020-05-09
一般大家在学习python机器学习的时候,用的最多的可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互,简单来说就是matplot和se ...

8个流行的Python可视化工具包,你喜欢哪个?

8个流行的Python可视化工具包,你喜欢哪个?
2020-04-28
把这三个包放在一起有几个原因:首先 Seaborn 和 Pandas 是建立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的其实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是 ...

全国多地新冠病例0增长,教你用Python画出当下疫情最火玫瑰图!

全国多地新冠病例0增长,教你用Python画出当下疫情最火玫瑰图!
2020-04-28
CDA数据分析师 出品 近日,新冠肺炎防控成果的好消息不断。 今天我们聊聊,惊艳的疫情直观图。 据国家卫健委数据统计, 截止至3月10日24时,31省区市累计治愈出院病历超6 ...

AI、机器学习、数据科学与深度学习在2020年的主要发展趋势(一)

AI、机器学习、数据科学与深度学习在2020年的主要发展趋势(一)
2020-04-02
作者 | Matthew Mayo 编译 | CDA数据分析师 正如我们告别上一年并期待新的一年一样,KDnuggets再次征求了众多研究和技术专家对2019年最重要的发展及其2020年关键趋势预测的意见 ...

如何通过分类数据执行特征选择?

如何通过分类数据执行特征选择?
2020-03-09
作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是识别和选择与目标变量最相关的输入特征子集的过程。 使用实值数据(例如使用Pearson的相关系数)时,特征选择通常很简单,但是 ...

深度学习编码分类变量的3种方法

深度学习编码分类变量的3种方法
2020-03-09
作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字。 这意味着,如果你的数据包含分类数据,则必须先将其编码为数字,然后才能拟合和评估模型。 两 ...

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?
2020-02-22
CDA数据分析师 出品 今年的第92届奥斯卡可谓是大片云集,入围的影片不仅艺术性极高,而且市场口碑都极佳。当中有黑帮片《爱尔兰人》,经典IP《小妇人》,昆汀的《好莱坞往事》,战争片《1917》,另类超级 ...

为何Python技能越来越受到企业的青睐?

为何Python技能越来越受到企业的青睐?
2020-03-24
想要在职场中站稳脚步,掌握一门硬技术是非常重要的事情。顺应时代发展,抓住新的机遇,在如今市场经济不景气的2020年显得尤为重要。数数当下比较热门或高涨的行业,当属数据分析和人工智能领域, ...

OK