cda

数字化人才认证

首页 > 行业图谱 >

原理+代码|Python实战多元线性回归模型

原理+代码|Python实战多元线性回归模型
2020-08-05
线性回归就是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。我们在机器学习过程中也经常会遇到构建线性回归模型的场景,对于初学者来说还是比较困难的 ...

数据可视化|用散点图进行数据分析

数据可视化|用散点图进行数据分析
2020-07-30
散点图大家都能绘制,平常工作汇报有时也会用散点图让报表看起来更美观。但是,散点图并不是为了展示数据,而是需要数据分析,并利用数据分析的结果推动业务的增长。小编今天跟大家分享的这篇文章就是教大家 ...

可视化工具不知道怎么选?深度评测5大python数据可视化工具

可视化工具不知道怎么选?深度评测5大python数据可视化工具
2020-07-29
对于python,平常工作中大家最经常用到的就是它的可视化功能了。python有许多功能强大的可视化库,例如Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh,大家一定不陌生,但是对于这五种可视化库的区别,以及什么 ...

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

经典聚类算法Kmeans的基本原理及实现

经典聚类算法Kmeans的基本原理及实现
2020-07-24
Kmeans算法,又叫做K均值聚类算法,可以说是无监督聚类算法中最具代表性,最经典的聚类算法了,这一算法的主要作用是将相似的样本自动归到一个类别中。小编特意整理了这一经典聚类算法的基本原理供大家参考,希望 ...

怎么理解随机森里中feature importance-特征重要性?

怎么理解随机森里中feature importance-特征重要性?
2020-07-22
feature importance,根据含义就能理解,也就是特征重要性,在预测建模项目中起着非常重要作用,能够提供对数据、模型的见解,和如何进行降维和选择特征,并以此来提高预测模型的的效率和有效性。今天小编为大家带 ...

应该怎样理解和绘制漏斗模型?

应该怎样理解和绘制漏斗模型?
2020-07-22
相信接触过数据分析的人,尤其是商业分析方面,一定有听说过漏斗模型。漏斗模型,顾名思义,也就是像漏斗一样的模型,在互联网或者是电商行业经常会用到的一种营销模型。今天,小编就为大家整理了漏斗模型的一些基 ...

机器学习中常见的决策树分类算法有哪几种?

机器学习中常见的决策树分类算法有哪几种?
2020-07-20
在机器学习中,因为决策树的算法是十分给力,因此使用决策树能够帮助我们解决很多的问题。决策树的算法分为很多种,今天小编主要跟大家介绍一下决策树的分类算法。 一、决策树的概念 决策树,根据名字就能知 ...

K-s曲线是什么,如何进行绘制?

K-s曲线是什么,如何进行绘制?
2020-07-17
今天跟大家分享的是:K-s曲线,直接上干货。 一、K-s曲线是什么 K-s全称:Kolmogorov-Smirnov,中文名叫做洛伦兹曲线,Ks经常被用于模型风险区分能力进行评估, 指标衡量的是好坏样本累计分部之间的差值。好 ...

如何用python快速简单的制作柱状图?

如何用python快速简单的制作柱状图?
2020-07-16
柱状图大家都会制作,那么你会用python制作柱状图吗? 我们先来看一下柱状图的定义:柱形图,又被称为长条图、或者柱状统计图,也叫作条图、条状图、棒形图,本质上来说就是一种以长方形的长度为变量的统计图表 ...

玫瑰图是什么?如何进行绘制?

玫瑰图是什么?如何进行绘制?
2020-07-15
玫瑰图,全称为南丁格尔玫瑰图(Nightingale rose diagram),或者又叫做鸡冠花图、极坐标区域图等。早在克里米亚战争期间,统计学家和医学改革家佛罗伦斯‧南丁格尔 (Florence Nightingale) 就层使用玫瑰图表传达 ...

如何使用seaborn绘制好看的直方图和密度图?

如何使用seaborn绘制好看的直方图和密度图?
2020-07-15
seaborn是一款常用的python可视化库,基于matplotlib,相比matplotlib,seaborn绘制的多数图表都具有统计学意义,如分布、关系、统计、回归等,今天小编跟大家分享的是如何使用seaborn绘制直方图和密度图。 Sea ...

关于层次聚类算法原理的简单理解及实现

关于层次聚类算法原理的简单理解及实现
2020-07-14
层次聚类,即Hierarchical Clustering,是一种聚类算法,通过对不同类别数据点间的相似度的计算,从而创建一棵有层次的嵌套聚类树。 一、层次聚类算法原理 在聚类树中,树的最底层是不同类别的原始数据点, ...

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你

吃货的自我修养 | 口味虾哪家最好吃?我用python告诉你
2020-07-14
CDA数据分析师 出品 作者:Mika、真达 数据:真达 后期:泽龙 【导读】今天我们用数据来聊一聊口味虾。 Show me data,用数据说话 今天我们聊一聊 口味虾 说起湖南这个地方,大家想到的 ...

机器学习中感知机是什么?如何实现?

机器学习中感知机是什么?如何实现?
2020-07-10
感知机(Perceptron)或者叫做感知器,是Frank Rosenblatt在1957年就职于Cornell航空实验室(Cornell Aeronautical Laboratory)时所发明的一种人工神经网络,是机器学习领域最基础的模型,被誉为机器学习的敲门砖。 ...

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了

什么是脏数据?怎样用箱型图分析异常值?终于有人讲明白了
2020-07-13
作者:张良均 谭立云 刘名军 江建明 来源:大数据DT(ID:hzdashuju) 内容摘编自《Python数据分析与挖掘实战》(第2版) 导读:数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是 ...

零基础学习python,这几本书少不了

零基础学习python,这几本书少不了
2020-07-10
python是世界上最强大、最受欢迎的编程语言之一,即使不是程序员,我们平时在工作中也会经常用到,例如用python分析竞品数据,做财务报表等等。目前,社会上已经掀起了一波学习python的热潮,但是很多人由于并 ...

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?

数据告诉你:辽宁为何会跌落神坛,从无敌队到鱼腩队是郭艾伦的错?
2020-07-07
CDA数据分析师 出品 作者:泽龙、Mika 数据:真达 后期:泽龙 【导读】 CBA重启开赛,辽宁为什么从冠军队变成鱼腩队?是侄子坑叔,还是亚洲第一控卫变身综艺咖,本期我们用全面的数据证明到底 ...

 这几个常用的python库你需要知道

这几个常用的python库你需要知道
2020-07-02
python可以说是近几年最火热、最实用的、最容易上手的工具之一了。功能强大、应用广泛,可以帮你搜集工作数据,还能帮你下载音乐,电影,于是就掀起了一波学习python的大潮,小编也毫不犹豫的加入了。但是对于向小 ...

seaborn的简单理解和入门

seaborn的简单理解和入门
2020-07-02
seaborn是建立在Matplotlib基础之上的高级的API,是比Matplotlib更为高级的的一种python可视化库。专攻于统计可视化,有丰富的可视化库,包括一些复杂类型,如时间序列、联合分布图(jointplots)和小提琴图(violind ...

OK