cda

数字化人才认证

首页 > 行业图谱 >

使用python构建一个推荐系统需要几步?

使用python构建一个推荐系统需要几步?
2020-05-29
在我看来,作为一位中国人的我们不管做什么决定都在面临多种选择。例如,如果我这个时候想要买一本书,但是我却不知道我想看什么书、不知道类型、不知道方向,那么这个时候打开各种进行软件搜索可能会出现各种各样 ...

Kmeans算法精简版(无for loop循环)

Kmeans算法精简版(无for loop循环)
2020-05-27
大家在学习算法的时候会学习到关于Kmeans的算法,但是网络和很多机器学习算法书中关于Kmeans的算法理论核心一样,但是代码实现过于复杂,效率不高,不方便阅读。这篇文章首先列举出Kmeans核心的算法过程 ...

机器学习python算法应用,监督学习、无监督学习等!

机器学习python算法应用,监督学习、无监督学习等!
2020-05-25
本系列文章主要介绍机器学习在实践中的应用,介绍利用 python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大 ...

Python可视化工具推荐:图片交互性行极佳的Plotly

Python可视化工具推荐:图片交互性行极佳的Plotly
2020-05-25
1、 简单介绍 一般大家在学习python机器学习的时候,用的最多Python可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互 ...

PyTorch官网更新了,标签索引更快速!

PyTorch官网更新了,标签索引更快速!
2020-05-21
PyTorch的前身是Torch,由Torch7团队开发,是一个开源的Python机器学习库,用于自然语言处理等应用程序。 PyTorch使用Python重新写了很多内容,不仅更加灵活,支持动态图,而且提供了Python接口,是一个以Python优 ...

kmeans优化算法:二分K-means聚类算法

kmeans优化算法:二分K-means聚类算法
2020-05-21
Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢?就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的 ...

如何用Python实现数据透视表?解除你对透视表的疑惑!

如何用Python实现数据透视表?解除你对透视表的疑惑!
2020-05-09
相信接触过Excel的小伙伴都知道,Excel有一个非常强大的功能“数据透视表”,使用数据透视表可以自由选择不同字段,用不同的聚合函数进行汇总,并建立交叉表格,用以从不同层面观察数据。这么强大的功能,在Python ...

Python可视化工具:Plotly

Python可视化工具:Plotly
2020-05-09
一般大家在学习python机器学习的时候,用的最多的可视化的包就是matplot和seaborn, 这2个可视化的优点在于门槛低,代码容易理解,并且容易上手。唯一的可能的缺点就是画出来的图不能交互,简单来说就是matplot和se ...

seaborn 常用的 10 种数据分析图表

seaborn 常用的 10 种数据分析图表
2020-04-28
内置示例数据集 seaborn内置了十几个示例数据集,通过load_dataset函数可以调用。 其中包括常见的泰坦尼克、鸢尾花等经典数据集。 # 查看数据集种类 import sea ...

Excel数据分析系列(四):Excel中的公式、函数及数组

Excel数据分析系列(四):Excel中的公式、函数及数组
2020-04-13
作者 | CDA数据分析师 Excel 公式 Excel 函数 Excel 常用函数概览 数组的表示方式 E ...

如何通过分类数据执行特征选择?

如何通过分类数据执行特征选择?
2020-03-09
作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是识别和选择与目标变量最相关的输入特征子集的过程。 使用实值数据(例如使用Pearson的相关系数)时,特征选择通常很简单,但是 ...

深度学习编码分类变量的3种方法

深度学习编码分类变量的3种方法
2020-03-09
作者 | CDA数据分析师 像Keras中的机器学习和深度学习模型一样,要求所有输入和输出变量均为数字。 这意味着,如果你的数据包含分类数据,则必须先将其编码为数字,然后才能拟合和评估模型。 两 ...

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?

《寄生虫》成奥斯卡最大赢家,Python告诉你这部电影到底好在哪?
2020-02-22
CDA数据分析师 出品 今年的第92届奥斯卡可谓是大片云集,入围的影片不仅艺术性极高,而且市场口碑都极佳。当中有黑帮片《爱尔兰人》,经典IP《小妇人》,昆汀的《好莱坞往事》,战争片《1917》,另类超级 ...

Excel数据分析系列(四):Excel中的公式、函数及数组

Excel数据分析系列(四):Excel中的公式、函数及数组
2020-02-20
作者 | CDA数据分析师 Excel 公式 Excel 函数 Excel 常用函数概览 数组的表示方式 Excel中的数组是指一行、一列或多行多列的一组数据元素的集合,在Excel中用{}进行创建,其中同一 ...

《囧妈》口碑扑街?Python告诉你,为何这次观众不买账了

《囧妈》口碑扑街?Python告诉你,为何这次观众不买账了
2020-02-05
CDA数据分析师 出品 【导语】:今天我们就来聊聊另类春节档的唯一一部电影《囧妈》,Python技术部分可以直接看第三部分。 2020年的春节档之前被誉为神仙打架,各显神通,可以说是史上最强的春节档, ...

一文讲解机器学习算法中的共线性问题

一文讲解机器学习算法中的共线性问题
2020-01-08
作者 | 宋老师 来源 | JSong的数据科学小站 多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参 ...

十分钟告诉你——何为Keras中的序列到序列学习

十分钟告诉你——何为Keras中的序列到序列学习
2019-12-20
作者 | Francois Chollet 编译 | CDA数据分析师 A ten-minute introduction to sequence-to-sequence learning in Keras 什么是顺序学习? 序列到序列学习(Seq2Seq)是关于 ...

用OpenCV等构建神经网络,这些实战经验你肯定用得上!

用OpenCV等构建神经网络,这些实战经验你肯定用得上!
2020-05-21
在我们的机器学习实验室,我们在许多高性能的机器已经积累了成千上万个小时的训练。然而,并不是只有计算机在这个过程中学到了很多东西:我们自己也犯了很多错误,修复了很多错误。 我们承认这些都是众所周知 ...

8个计算机视觉深度学习中常见的Bug

8个计算机视觉深度学习中常见的Bug
2019-12-11
作者 | Arseny Kravchenko 编译 | ronghuaiyang 人是不完美的,我们经常在软件中犯错误。有时这些错误很容易发现:你的代码根本不能工作,你的应用程序崩溃等等。但是有些bug是隐藏的,这 ...

数据分析最有用的25个 Matplotlib图(二)

数据分析最有用的25个 Matplotlib图(二)
2019-11-29
作者 | zsx_yiyiyi 来源 | python大本营 25个Matplotlib图的汇编,在数据分析和可视化中最有用。此列表允许您使用Python的Matplotlib和Seaborn库选择要显示的可视化对象。今天给大家分享剩余 ...

OK