cda

数字化人才认证

首页 > 行业图谱 >

数据挖掘系列篇之DM解决几类问题
2016-05-25
数据挖掘系列篇之DM解决几类问题 宋代禅宗大师青原行思提出参禅的三重境界:“参禅之初,看山是山,看水是水;禅有悟时,看山不是山,看水不是水;禅中彻悟,看山仍然山,看水仍然是水。” 数据挖掘也是这样 ...

逻辑回归算法的原理及实现(LR)

逻辑回归算法的原理及实现(LR)
2016-05-19
逻辑回归算法的原理及实现(LR) 逻辑回归(Logistic Regression, LR)又称为逻辑回归分析,是分类和预测算法中的一种。通过历史数据的表现对未来结果发生的概率进行预测。例如,我们可以将购买的概率设置为因变量 ...
机器学习的认知和算法总结
2016-04-10
机器学习的认知和算法总结 相信不少人都没弄明白机器学习和数据挖掘的区别是什么?其实机器学习并不等同于数据挖掘,数据挖掘更多的是从目标角度去理解数据,然后利用算法建模探索有价值的结论;而机器学习 ...

大数据挖掘技术之DM经典模型(下)

大数据挖掘技术之DM经典模型(下)
2016-04-07
大数据挖掘技术之DM经典模型(下) 接着上篇大数据挖掘技术之DM经典模型(上)文章,接下来我们将探讨朴素贝叶斯模型、线性回归、多元回归、逻辑回归分析等模型。 4、朴素贝叶斯模型 表查询模型简单有效 ...

大数据、新方法和日常问

大数据、新方法和日常问
2016-01-10
大数据、新方法和日常问 如果让我们决定是否去看一部电影,有两种办法来做决策:我们可以上豆瓣了解这部电影质量如何,专家的评价怎么样;也可以在朋友圈浏览一下,看看身边有多少人去看了这部电影。实际生活没 ...

多重共线性问题的几种解决方法

多重共线性问题的几种解决方法
2016-01-08
多重共线性问题的几种解决方法 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,Xk中的任何一个都不能是其他解释变量的线性组合。如 ...
面板数据分析方法总结
2015-12-25
面板数据分析方法总结 横截面的异方差与序列的自相关性是运用面板数据模型时可能遇到的最为常见的问题,此时运用OLS可能会产生结果失真,因此为了消除影响,对我国东、中、西部地区的分析将采用不相关回归方法( S ...

一文带你快速了解机器学习中的多元线性回归到底是什么?

一文带你快速了解机器学习中的多元线性回归到底是什么?
2020-07-24
线性回归我们都很熟悉了,是有监督学习中最为简单的一种回归方式,小编今天就进一步跟大家分享一下多元线性回归。 一、什么是多元线性回归 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。线 ...

最大后验估计MAP是什么?它是怎么推导出来的?

最大后验估计MAP是什么?它是怎么推导出来的?
2020-07-08
最大后验估计(maximum a posteriori probability estimate), 简称为MAP。在贝叶斯统计学中,最大后验估计是通过利用经验数据获得对未观测量的点态估计。 与极大似然估计类似,不同的是,在似然函数后面多乘了一 ...

常见的机器学习中损失函数有哪些?

常见的机器学习中损失函数有哪些?
2020-07-03
今天我们来盘点一下那些常见的机器学习中的损失函数有哪些。 用于计算损失的函数称为损失函数。模型每一次预测的好坏用损失函数来度量。机器通过损失函数进行学习,如果预测值与实际结果偏离较远,损失函数会得 ...

python散点图:如何添加拟合线并显示拟合方程与R方?

python散点图:如何添加拟合线并显示拟合方程与R方?
2020-06-08
python散点图:如何添加拟合线并显示拟合方程与R方?我们可以使用polyfit()函数,使用最小二乘法将一些点拟合成一条曲线. numpy.polyfit(x, y, deg, rcond=None, full=False, w=None, cov=False) # x:要拟合点的 ...

机器学习中的有监督和无监督都包括些什么?

机器学习中的有监督和无监督都包括些什么?
2020-05-29
机器学习算法通常分为有监督的(训练数据有标记答案)和无监督的(可能存在的任何标签均未显示在训练算法中)。有监督的机器学习问题又分为分类(预测非数字答案,例如错过抵押贷款的可能性)和回归(预测 ...

有监督学习:从过去到现在的模型流行度(深度翻译好文)!

有监督学习:从过去到现在的模型流行度(深度翻译好文)!
2020-05-14
在过去的几十年中,机器学习领域发生了巨大的变化。诚然,有些方法已经存在很长时间了,但仍然是该领域的主要内容。例如,Legendre和Gauss已经在19世纪初提出了最小二乘的概念。在最近的几十年中,诸如神经网络等 ...

机器学习算法:无监督、半监督、有监督学习算法浅析

机器学习算法:无监督、半监督、有监督学习算法浅析
2020-05-06
随着人工智能的飞速发展,机器学习成为当下数据分析领域的热门之一,很多人在平时的工作中,或多或少都会使用到机器学习的算法。这里机器学习的算法进行了盘点,将有监督、无监督,半监督学习等进行了简单的解 ...

参数估计之点估计和区间估计

参数估计之点估计和区间估计
2020-04-09
作者 | CDA数据分析师 参数估计(parameter estimation)是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。人们常常需要根据手中的数据,分析或推断数据反映的本质规律。即根据 ...

一文讲解机器学习算法中的共线性问题

一文讲解机器学习算法中的共线性问题
2020-01-08
作者 | 宋老师 来源 | JSong的数据科学小站 多重共线性是使用线性回归算法时经常要面对的一个问题。在其他算法中,例如决策树和贝叶斯,前者的建模过程是逐步递进,每次拆分只有一个变量参 ...

作为一名数据科学从业者,你应该知道的P值

作为一名数据科学从业者,你应该知道的P值
2019-12-13
作者 | SHAROON SAXENA 编译 | CDA数据分析师 Everything you Should Know about p-value from Scratch for Data Science 介绍 当你向有抱负的数据科学家谈论p值时,以下情况 ...

梯度下降算法详解

梯度下降算法详解
2019-07-16
原创 | CDA数据分析研究院,转载需授权 介绍 如果说在机器学习领域有哪个优化算法最广为认知,用途最广,非梯度下降算法莫属。梯度下降算法是一种非常经典的求极小值的算法,比如在线性回归里我 ...

每个数据科学人都应该知道的7种回归技术

每个数据科学人都应该知道的7种回归技术
2019-05-21
介绍 事实是,有无数种形式的回归可以使用。每种形式的回归都有其自身的重要性和最适合应用的特定场景。在本文中,我会以简单的方式解释了数据科学中最常用的7种回归形式。通过这篇文章,我也希望人们能够对回 ...

机器学习中的回归算法(下)

机器学习中的回归算法(下)
2019-04-28
我们在上一篇文章中给大家介绍了机器学习中的回归算法的部分知识,其实机器学习中的回归算法的知识还是有很多的,我们在这篇文章中继续为大家介绍机器学习中的回归算法剩余部分知识,希望能够帮助到大家更好地 ...

OK