cda

数字化人才认证

首页 > 行业图谱 >

使用R对共线性检验

使用R对共线性检验
2018-03-11
使用R对共线性检验 高维数据常会出现共线性 、变量选择等问题 。如何消除共线性确定最佳模型,是回归分析的一个重点。 传统的最小二乘估计在处理多重共线性问题上 往往有令人不太满意的地方, 主要有两点: ...

Python 爬取淘宝商品数据挖掘分析实战

Python 爬取淘宝商品数据挖掘分析实战
2018-03-03
Python 爬取淘宝商品数据挖掘分析实战 项目内容 本案例选择>> 商品类目:沙发; 数量:共100页  4400个商品; 筛选条件:天猫、销量从高到低、价格500元以上。 项目目的 1. 对商 ...

SPSS之偏态分布的激素水平影响因素分析

SPSS之偏态分布的激素水平影响因素分析
2018-03-03
SPSS之偏态分布的激素水平影响因素分析 概况:某种激素水平对胃癌的发生有一定的作用,把病人分为实验组和对照组。 性别:男、女。 年龄:青年(<45岁)、中年(45岁~59岁)、 ...

R描述性统计分析

R描述性统计分析
2018-02-27
R描述性统计分析 概念 数据摘要,有损地提取数据特征的过程,包含基本统计,分布/累计统计,数据特征(相关性,周期性等),数据挖掘 数据有很多变量和观测值,可以用一些简单表格,图形和少数汇总数字 ...

使用Python进行描述性统计

使用Python进行描述性统计
2018-02-26
使用Python进行描述性统计 1 描述性统计是什么? 描述性统计是借助图表或者总结性的数值来描述数据的统计手段。数据挖掘工作的数据分析阶段,我们可借助描述性统计来描绘或总结数据的基本情况,一来可以梳 ...

用python-pandas作图矩阵

用python-pandas作图矩阵
2018-02-24
用python-pandas作图矩阵 我们在采用机器学习算法对数据进行分析时,首先要对数据进行了解,而了解数据最快速的方式就是可视化。但是作者可视化采用的方法对很多data都通用,且采用的是各种图形的图矩阵,如直 ...

数据探索和数据准备的步骤

数据探索和数据准备的步骤
2018-02-22
数据探索和数据准备的步骤 如我们所知,数据分析工作的70%的时间都用作于数据清洗,数据探索和数据准备当中,这可以说是数据分析的核心所在。数据清洗主要是工具层面上的,这里先不讨论。我们这里讨论数据探索 ...

R语言学习笔记之聚类分析

R语言学习笔记之聚类分析
2018-02-15
R语言学习笔记之聚类分析 使用k-means聚类所需的包: factoextra cluster #加载包 library(factoextra) library(cluster)l  #数据准备 使用内置的R数据集USArrests ...

数据分析|微信红包金额分配的秘密

数据分析|微信红包金额分配的秘密
2018-02-14
数据分析|微信红包金额分配的秘密 “微信红包”是腾讯公司开发的社交软件——微信的一个附加功能。它可以在一对一聊天当中发送,也可以在群聊中发送。在群聊当中,可以一次性发送多于1个的红包,每个群成员可 ...

上市公司财务指标综合分析

上市公司财务指标综合分析
2021-03-08
一、案例综述 案例编号: 101003 案例名称: 财务管理领域的应用——上市公司财务指标综合分析 作者姓名(或单位、或来源): 刘莎莎 案例所属行业: 69 证券 案例所用软件: ...

R语言使用密度聚类笔法处理数据

R语言使用密度聚类笔法处理数据
2018-01-18
R语言使用密度聚类笔法处理数据 说明 除了使用距离作为聚类指标,还可以使用密度指标来对数据进行聚类处理,将分布稠密的样本与分布稀疏的样本分离开。DBSCAN是最著名的密度聚类算法。 操作 将使用mlb ...

R语言线性回归诊断

R语言线性回归诊断
2018-01-15
R语言线性回归诊断 回归诊断主要内容 (1).误差项是否满足独立性,等方差性与正态 (2).选择线性模型是否合适 (3).是否存在异常样本 (4).回归分析是否对某个样本的依赖过重,也就是模型是否具有稳定性 (5).自变量 ...

R语言中qplot()的用法

R语言中qplot()的用法
2018-01-15
R语言中qplot()的用法 a, b, c, d, e, f, g, h = range(8) ggplot2()函数 ggplot2是一个强大的作图工具,它可以让你不受现有图形类型的限制,创造出任何有助于解决你所遇到问题的图形。 qplot() qplot()属于gg ...

R语言回归分析之影响分析

R语言回归分析之影响分析
2018-01-14
R语言回归分析之影响分析 说明 影响分析就是探查对估计有异常影响的数据,如果一个样本不遵从某个模型,但是其余数据遵从这个模型,称为这个样本点为强影响点,也称为高杠杆点,影响分析的一个重要功能就是 ...

R语言与回归分析几个假设的检验

R语言与回归分析几个假设的检验
2018-01-14
R语言与回归分析几个假设的检验 一、从线性回归的假设说起 对于线性回归而言,若要求回归估计有一些良好性质比如无偏性,就需要加上一些假定条件。比如要达到估计的无偏性,我们通常需要加上高斯-马尔科夫条 ...

避开十大误区,别做渣渣图表

避开十大误区,别做渣渣图表
2018-01-03
避开十大误区,别做渣渣图表 设计师要做的,不仅仅是选择合适的图表类型,更要以一种容易理解的方式来呈现信息,设计出更直观的导航系统,让观众做尽可能减少理解方面的麻烦,做到一目了然。 大数据魔镜 ...

大数据在企业运营中可落地的八大应用

大数据在企业运营中可落地的八大应用
2017-12-30
大数据在企业运营中可落地的八大应用 由于任何问题都有可能在某种程度得到优化,问题在于,大数据在企业运营中到底有哪些应用值得我们关注? 无论规模大小,无论是生产型还是服务型,无论是盈利还是非盈利 ...

用SPSS做数据分析?先弄懂SPSS的基础知识

用SPSS做数据分析?先弄懂SPSS的基础知识
2022-01-20
易用性强:操作界面极为友好,操作简单                 为高级用户提高编程能力               &nbs ...

网站用户行为分析案例

网站用户行为分析案例
2021-03-08
一、案例综述 案例编号:101001 案例名称:互联网行业——网站用户行为分析 作者姓名(或单位、或来源):刘莎莎 案例所属行业:G6020 互联网信息 案例所用软件: MYSQL、 Sas EG、 TOA ...

R语言用于数据分析的基本统计函数与基础可视化

R语言用于数据分析的基本统计函数与基础可视化
2017-12-17
R语言用于数据分析的基本统计函数与基础可视化 1.函数的基本用法 #将数据导入R中 > data(iris)    #平均数 > mean(iris$Sepal.Length) [1] 5.843333 #标准差 > sd(iris$Sepal.Length) [1] 0.8 ...

OK