首页 > 行业图谱 >
- 机器学习中的各种相似性、距离度量
- 2017-07-25
-
机器学习中的各种相似性、距离度量
本文主要关注点在于各个距离、相似度之间的优缺点,及使用时候的注意事项。
1. 闵可夫斯基距离
基本认识
该距离最常用的 p 是 2 和 1, 前者是欧几里得距离(Euc ...
- R语言多元分析系列
- 2017-07-21
-
R语言多元分析系列
R语言多元分析系列之一:主成分分析
主成分分析(principal components analysis,
PCA)是一种分析、简化数据集的技术。它把原始数据变换到一个新的坐标系统中,使得任何数据投影的第一 ...
- R语言因子分析
- 2017-07-18
-
R语言因子分析
因子模型: X=μ + A*F* + ε
其中F=[(f1,f2,…,fm)]^T为公共因子向量,[ε=(ε1,ε2,…,εp)]^T为特殊因子向量,A=[(aij)]^(p×m)为因子载荷矩阵。
I.参数估计
为了建立因子模型,需要要 ...
- SPSS分析技术:简单对应分析
- 2017-07-12
-
SPSS分析技术:简单对应分析
分类型数据(包括定类数据和定序数据)在数据分析中扮演着重要的角色,例如,分类型数据能够帮助我们对每个数据记录进行分门别类,但是由于分类型数据的特点,很多基于均值、方差和 ...
- SPSS中的T检验
- 2017-06-25
-
SPSS中的T检验
1.单样本T检验(One-Sample T Test)
单样本T检验主要用于样本均数和已知总体均数的比较,还可以计算相应的描述性统计量及样本均数和总体均数之差的95%可信区间。
如果Sig(P)>0.05,差异 ...
- SPSS详细教程 | 配对样本的t检验
- 2017-06-25
-
SPSS详细教程 | 配对样本的t检验
1、问题与数据
某研究使用克矽平治疗矽肺病患者10名,分别测得治疗前、后患者的血红蛋白含量(g/dL),数据如下。试问该药对矽肺患者的血红蛋白含量有无影响?
2、 ...
- SPSS统计分析案例:对应分析
- 2017-06-22
-
SPSS统计分析案例:对应分析
两个分类变量间的关系,无法直接使用常见的皮尔逊相关系数来表述,多采用频数统计、交叉表卡方检验等过程进行处理,当分类变量的取值较多时,列联表频数的形式就变得更为复杂,很难 ...
- 时间序列分析算法【R详解】
- 2017-06-10
-
时间序列分析算法【R详解】
在商业应用中,时间是最重要的因素,能够提升成功率。然而绝大多数公司很难跟上时间的脚步。但是随着技术的发展,出现了很多有效的方法,能够让我们预测未来。不要担心,本文并不会 ...
- R语言解读资本资产定价模型CAPM
- 2017-05-30
-
R语言解读资本资产定价模型CAPM
伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...
- 主成分分析法及其在SPSS中的操作
- 2017-05-02
-
主成分分析法及其在SPSS中的操作
一、主成分分析基本原理
概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。
思路:一个研究对象,往往 ...
- 利用SPSS进行主成分分析
- 2017-05-02
-
利用SPSS进行主成分分析
【例子】 以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。
图1 原始数据(未经标准化)
第二步:打开“因子分析”对话框。
沿着主菜 ...
- R语言构建配对交易量化模型
- 2017-04-07
-
R语言构建配对交易量化模型
散户每天都在经历中国股市的上蹿下跳,赚到钱是运气,赔钱是常态。那么是否有方法可以让赚钱变成常态呢?
我们可以通过“统计套利”的方法,发现市场的无效性。配对交易,就统计 ...
- 【新手必备】SAS常用函数整理
- 2017-04-01
-
【新手必备】SAS常用函数整理
本文根据网络资源对SAS的常用函数进行了整理。主要内容包括:
1. 数学函数
2. 数组函数
3. 字符函数
4. 日期和时间函数
5. 分布密度函数,分布函数
6. 分位数函 ...
- 简单易学的机器学习算法——协同过滤推荐算法(2)
- 2017-03-25
-
简单易学的机器学习算法——协同过滤推荐算法(2)
一、基于协同过滤的推荐系统
协同过滤(Collaborative Filtering)的推荐系统的原理是通过将用户和其他用户的数据进行比对来实现推荐的。比对 ...
- 简单易学的机器学习算法—协同过滤推荐算法(1)
- 2017-03-25
-
简单易学的机器学习算法—协同过滤推荐算法(1)
一、推荐系统的概念
推荐系统(Recommendation System, RS),简单来说就是根据用户的日常行为,自动预测用户的喜好,为用户提供更多完善的服务 ...
- SPSS分析技术:线性回归分析
- 2017-02-28
-
SPSS分析技术:线性回归分析
相关分析可以揭示事物之间共同变化的一致性程度,但它仅仅只是反映出了一种相关关系,并没有揭示出变量之间准确的可以运算的控制关系,也就是函数关系,不能解决针对未来的分析与预 ...
- R语言解读一元线性回归模型
- 2017-02-26
-
R语言解读一元线性回归模型
R语言作为统计学一门语言,一直在小众领域闪耀着光芒。直到大数据的爆发,R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入,R语言的社区在迅速扩大成长 ...
- 用R语言建立学生的学习表现和性格特征数据模型
- 2017-02-26
-
用R语言建立学生的学习表现和性格特征数据模型
一、项目介绍:
方法包括以下步骤
S1:将个体表现数据输入到数据库;
S2:建立学习者的学习表现数据库和性格特征数据库;
S3:建立学习者的学习表现 ...
- R语言统计与分布的相关知识
- 2017-02-25
-
R语言统计与分布的相关知识
变量
变量按变量值是否连续可分为连续变量与离散变量两种。 连续变量(continuous variable)与离散变量(discrete variable)
连续变量
在一定区间内可以任意取值的 ...
- R语言的三种聚类方法
- 2017-02-24
-
R语言的三种聚类方法
一、层次聚类
1)距离和相似系数
r语言中使用dist(x, method = “euclidean”,diag = FALSE, upper = FALSE, p = 2) 来计算距离。其中x是样本矩阵或者数据框。method表示计算哪种距离 ...