首页 > 行业图谱 >
- 【R语言进行数据挖掘】回归分析
- 2016-07-30
-
【R语言进行数据挖掘】回归分析
1、线性回归
线性回归就是使用下面的预测函数预测未来观测量:
其中,x1,x2,...,xk都是预测变量(影响预测的因素),y是需要预测的目标变量(被预测变量)。
线性 ...
- 通过数据解释过去
- 2016-07-26
-
通过数据解释过去
数据的作用主要体现在两方面:解释过去和预测未来。本篇文章介绍如何通过数据解释过去发生的事情。包括过去发生了什么事情?这些事情有什么样的规律?驱动因素是什么?是否有明显的改进或提升?等 ...
- 7种常用的互联网数据挖掘技术
- 2016-07-06
-
7种常用的互联网数据挖掘技术
数据挖掘的技术有很多种,按照不同的分类有不同的分类法。
下面着重讨论一下互联网数据挖掘中常用的一些技术:统计技术,关联规则,连接分析,决策树,神经网络,差别分析,概 ...
- 数据的标准化处理及实际应用
- 2016-07-01
-
数据的标准化处理及实际应用
数据标准化处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理, ...
- 数据分析新手入门教程
- 2016-06-04
-
数据分析新手入门教程
一、认识数据——产品经理与数据分析
1.1数据的客观性
数据是量化事物的手段,投射到不同的人身上又会导致解读的结论偏差,因此我能需要“求证”地分析第三方网站提供的调研数据( ...
- R语言-回归分析笔记
- 2016-06-02
-
R语言-回归分析笔记
使用若干自变量并建立公式,以预测目标变量
目标变量是连续型的,则称其为回归分析
(1)一元线性回归分析
y=kx+b
sol.lm<-lm(y~x,data)
abline(sol.lm)
使模型误差的平方和 ...
- 数据可视化专家的七个秘密
- 2016-05-30
-
数据可视化专家的七个秘密
数据可视化的道路上充满了不可见的陷阱和迷宫,最近ClearStory Data的两位数据可视化开发人员分享了他们总结出来的数据可视化开发的7个不宣之秘,普通开发者了解这些方法能提升视野, ...
- 你能排第几?2016互联网行业薪酬数据分析
- 2016-05-23
-
你能排第几?2016互联网行业薪酬数据分析
需求量大薪资高?选产品还是技术?什么是最好的编程语言?希望这篇文章能够帮你更好地制定职业规划和发展方向。
我们通过抓取某著名互联网招聘平台的全部招聘数据, ...
- 多重线性回归分析的四大纪律三项注意
- 2016-05-19
-
多重线性回归分析的四大纪律三项注意
鉴于多重线性回归已经到了滥用的程度,特总结一下在使用线性回归时需要注意的问题,总结为四大纪律加三项注意。
四大纪律
四大纪律之一: 自变量与因变量之间要 ...
- 控制在线问卷数据质量的具体方法
- 2016-05-08
-
控制在线问卷数据质量的具体方法
在对互联网产品进行的用户研究中,通过在线问卷收集数据是一个非常普遍的方式。 在线问卷,不受访问的环境限制,回收速度很快,具有明显的优势。但是由于被访者没有相关的指导,在设 ...
- 两样本估计和假设检验范例分析
- 2016-05-06
-
两样本估计和假设检验范例分析
基础准备
两样本推断性统计基础:两样本估计和假设检验基础。
均值差
通过对比单样本估计和假设检验的学习,可以列出独立两样本均值差的估计和假设检验在不同情 ...
- 从最大似然到EM算法浅解
- 2016-05-05
-
从最大似然到EM算法浅解
机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人 ...
- 8个经过证实的方法:提高机器学习模型的准确率
- 2016-05-05
-
8个经过证实的方法:提高机器学习模型的准确率
提升一个模型的表现有时很困难。如果你们曾经纠结于相似的问题,那我相信你们中很多人会同意我的看法。你会尝试所有曾学习过的策略和算法,但模型正确率并没有改 ...
- 机器学习和统计模型的差异
- 2016-04-28
-
机器学习和统计模型的差异
在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么?
这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别 ...
- SPSS常用函数
- 2016-04-24
-
SPSS常用函数
SPSS函数
是一个常用程序(rountine),并且利用一个或多个自变量(参数)来执行。每个SPSS函数均有一个关键名称(keywordname),且绝不能写错。通常,函数的格式为:函数名称(自变量,自变量,……) ...
- 如何用SPSS绘制质量控制图?
- 2016-04-17
-
如何用SPSS绘制质量控制图?
控制图(Control Chart)又称管理图,它是用来区分是由异常原因引起的波动,还是由过程固有的原因引起的正常波动的一种有效的工具。控制图通过科学的区分正常波动和异常波动, ...
- 从客户满意度出发建立呼叫中心质检评分标准
- 2016-04-17
-
从客户满意度出发建立呼叫中心质检评分标准
背景:提升客户满意度是呼叫中心永恒的话题之一,从大的方面来看,主要是通过优化系统、完善流程、提升座席的服务质量三方面入手。本文主要介绍的,是基于统计学 ...
- 机器学习&统计模型&数据挖掘的差别是什么
- 2016-04-15
-
机器学习&统计模型&数据挖掘的差别是什么
在各种各样的数据科学论坛上这样一个问题经常被问到——机器学习和统计模型的差别是什么?这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两 ...
- 详细解释数据挖掘中的十大算法
- 2016-03-08
-
详细解释数据挖掘中的十大算法
在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。
一旦你知道了这些算法是什么、怎么工作、能做什么、在哪 ...
- R语言单元变量的数据可视化方法
- 2016-02-17
-
R语言单元变量的数据可视化方法
Uni-variate data 一元变量的数据分析方法
点图dot plot与抖动图jitter plot
当点都重叠在一起的时候,为了更直观分析数据分布情况,可以把点适当抖动到一定位置(适量的 ...