cda

数字化人才认证

首页 > 行业图谱 >

R语言自定义函数,利用QQ图和shaprio.test检验正态分布

R语言自定义函数,利用QQ图和shaprio.test检验正态分布
2018-03-11
R语言自定义函数,利用QQ图和shaprio.test检验正态分布 代码 #自定义函数 norm.test<-function(data,alpha=0.05,pic=TRUE){ #alpha为显著性水平,这里的默认值为0.05  if(pic==TRUE) ...

(笔记)spss的描述统计和比较均值

(笔记)spss的描述统计和比较均值
2018-03-05
(笔记)spss的描述统计和比较均值 描述统计: 分析-描述统计,包括:频率,描述,搜索,交叉表,比率,P-P图,Q-Q图 1,频率:分析多个样本中取值的出现频次,求得这些频次的 ...

Python 爬取淘宝商品数据挖掘分析实战

Python 爬取淘宝商品数据挖掘分析实战
2018-03-03
Python 爬取淘宝商品数据挖掘分析实战 项目内容 本案例选择>> 商品类目:沙发; 数量:共100页  4400个商品; 筛选条件:天猫、销量从高到低、价格500元以上。 项目目的 1. 对商 ...

SPSS之偏态分布的激素水平影响因素分析

SPSS之偏态分布的激素水平影响因素分析
2018-03-03
SPSS之偏态分布的激素水平影响因素分析 概况:某种激素水平对胃癌的发生有一定的作用,把病人分为实验组和对照组。 性别:男、女。 年龄:青年(<45岁)、中年(45岁~59岁)、 ...

使用Python进行描述性统计

使用Python进行描述性统计
2018-02-26
使用Python进行描述性统计 1 描述性统计是什么? 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...

机器学习中防止过拟合方法

机器学习中防止过拟合方法
2018-02-25
机器学习中防止过拟合方法 过拟合 在进行数据挖掘或者机器学习模型建立的时候,因为在统计学习中,假设数据满足独立同分布,即当前已产生的数据可以对未来的数据进行推测与模拟,因此都是使用历史数据建立模 ...

用python-pandas作图矩阵

用python-pandas作图矩阵
2018-02-24
用python-pandas作图矩阵 我们在采用机器学习算法对数据进行分析时,首先要对数据进行了解,而了解数据最快速的方式就是可视化。但是作者可视化采用的方法对很多data都通用,且采用的是各种图形的图矩阵,如直 ...

数据探索和数据准备的步骤

数据探索和数据准备的步骤
2018-02-22
数据探索和数据准备的步骤 如我们所知,数据分析工作的70%的时间都用作于数据清洗,数据探索和数据准备当中,这可以说是数据分析的核心所在。数据清洗主要是工具层面上的,这里先不讨论。我们这里讨论数据探索 ...

快学数据挖掘—数据探索—贡献度分析

快学数据挖掘—数据探索—贡献度分析
2018-02-22
快学数据挖掘—数据探索—贡献度分析 贡献度分析又称帕累托分析,它的原理是帕累托法则又称20/80定律。同样的投入放在不同的地方会产生不同的效益。例如,对一个公司来讲,80%的利润常常来自于20%最畅销的产品 ...

数据挖掘概念综述

数据挖掘概念综述
2018-01-29
数据挖掘概念综述 数据挖掘又称从数据库中发现知识(KDD)、数据分析、数据融合(Data Fusion)以及决策支持。KDD一词首次出现在1989年8月举行的第11届国际联合人工智能学术会议上。随后在1991年、1993年和199 ...

一名合格的数据分析师该怎样解释“买不起房”这件事

一名合格的数据分析师该怎样解释“买不起房”这件事
2018-01-29
一名合格的数据分析师该怎样解释“买不起房”这件事 北京很大,大到容得下两千多万人的吃喝拉撒睡。北京很小,小到装不下一个外地人的北漂梦。 我是一名北漂,来北京7年了,7年时间里不断地租房搬家,心里 ...

谷歌教你学 AI-第五讲模型可视化

谷歌教你学 AI-第五讲模型可视化
2018-01-26
谷歌教你学 AI-第五讲模型可视化 Google Cloud发布了名为\"AI Adventures\"的系列视频,用简单易懂的语言让初学者了解机器学习的方方面面。今天让我们来看到第五讲模型可视化。 观看更多国外公开课,点击\" ...

R语言使用随机森林方法对数据分类

R语言使用随机森林方法对数据分类
2018-01-19
R语言使用随机森林方法对数据分类 说明 随机森林是另一类可用的集成学习方法,该算法在训练过程中将产生多棵决策树,每棵决策树会根据输入数据集产生相应的预测输出,算法采用投票机制选择类别众数做为预测 ...

Python数据分析常用函数笔记

Python数据分析常用函数笔记
2018-01-10
Python数据分析常用函数笔记 1、生成随机数列表 import numpy as np array = np.random.permutation(20) 结果: array([12, 18, 16, 8, 10, 17, 1, 2, 9, 7, 3, 6, 15, 13, 11, 5, 4, 0, 14, 19]) 2、合并两个p ...

基于R统计分析—探索性数据分析

基于R统计分析—探索性数据分析
2018-01-10
基于R统计分析—探索性数据分析 数据的统计分析分为描述性统计分析和统计推断两部分, 前者又称为探索性统计分析, 它是通过绘制统计图形、编制统计表格、计算统计量等方法来探索数据的主要分布特征, 揭示 ...

SPSS—描述性统计分析—频数分析

SPSS—描述性统计分析—频数分析
2018-01-09
SPSS—描述性统计分析—频数分析 描述性统计量 分类 集中趋势分析——中心趋势的数值度量 反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总 ...

R语言用于数据分析的基本统计函数与基础可视化

R语言用于数据分析的基本统计函数与基础可视化
2017-12-17
R语言用于数据分析的基本统计函数与基础可视化 1.函数的基本用法 #将数据导入R中 > data(iris)    #平均数 > mean(iris$Sepal.Length) [1] 5.843333 #标准差 > sd(iris$Sepal.Length) [1] 0.8 ...

R语言学习路线和常用数据挖掘包

R语言学习路线和常用数据挖掘包
2017-12-13
R语言学习路线和常用数据挖掘包 对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的方式是— ...

原来,你是这样的R语言

原来,你是这样的R语言
2022-01-20
原来,你是这样的R语言 今天给大家介绍一款在开源世界里集万千宠爱于一身的软件——R语言。 有多受宠呢?简单说,你能想到的地方都有它的身影。 做学术?看看R在各大语言排名系统的表现 O' reilly m ...

这么漂亮的Excel图表,年终总结就用它了!(附福利)

这么漂亮的Excel图表,年终总结就用它了!(附福利)
2017-12-11
这么漂亮的Excel图表,年终总结就用它了!(附福利) 最近在某份研究报告中见到了这样一个图表: 看到它的瞬间,有一种看见美女惊为天人的感觉。很精致,很别致,让整个报告显得特别上档次。 所以, ...

OK