cda

数字化人才认证

首页 > 行业图谱 >

机器学习—局部加权线性回归

机器学习—局部加权线性回归
2018-06-01
机器学习—局部加权线性回归 机器学习—局部加权线性回归 介绍之前先提稍微一下线性回归,用最小二乘法等方法,拟合出最适合训练集的一条直线。 我们得到了最小二乘的损失函数为   , 通 ...

量化分析师的Python日记

量化分析师的Python日记
2018-05-19
量化分析师的Python日记 一、SciPy概述 前篇已经大致介绍了NumPy,接下来让我们看看SciPy能做些什么。NumPy替我们搞定了向量和矩阵的相关操作,基本上算是一个高级的科学计算器。SciPy基于NumPy提供了更为丰富 ...

海量数据对比分析,技术面试里的那些门道

海量数据对比分析,技术面试里的那些门道
2018-05-18
海量数据对比分析,技术面试里的那些门道 最近有很多用户说到了年终需要回顾这一年的工作,根据这一年的数据看看有没有异常的情况,那么哪种图能够清晰直观地展现出这一信息呢? 答案只有一个,那就是… ...

面试了8家公司,他们问了我这些机器学习题目......

面试了8家公司,他们问了我这些机器学习题目......
2018-05-04
面试了8家公司,他们问了我这些机器学习题目...... 今年年初以来,作者一直在印度找数据科学、机器学习以及深度学习领域的工作。在找工作的这三十四天里,他面试了8到10家公司,其中也包括初创公司、基于服务 ...

利用Python进行异常值分析实例代码

利用Python进行异常值分析实例代码
2018-04-29
利用Python进行异常值分析实例代码 异常值是指样本中的个别值,也称为离群点,其数值明显偏离其余的观测值。常用检测方法3σ原则和箱型图。其中,3σ原则只适用服从正态分布的数据。在3σ原则下,异常值被定义 ...

如何用纯SQL查询语句可以实现神经网络

如何用纯SQL查询语句可以实现神经网络
2018-03-29
如何用纯SQL查询语句可以实现神经网络 我们熟知的SQL是一种数据库查询语句,它方便了开发者在大型数据中执行高效的操作。但本文从另一角度嵌套SQL查询语句而构建了一个简单的三层全连接网络,虽然由于语句的嵌 ...

Stata软件对截断和删失数据处理方法介绍

Stata软件对截断和删失数据处理方法介绍
2018-03-24
Stata软件对截断和删失数据处理方法介绍 截断和删失是完全不同的现象,都会导致我们的样本不完整。这些现象出现在医疗科学、工程、社会科学和其他研究领域。如果忽略截断和删失,当我们分析数据时,我们的人口 ...

利用Stata进行概要统计及交互表统计

利用Stata进行概要统计及交互表统计
2018-03-24
利用Stata进行概要统计及交互表统计 【命令范式】 summarize y1 y2 y3 对所列变量计算简单的概要统计量 summarize y1 y2 y3, detail 获取详细的描述性统计,包括百分位数,中位数,平均数,标准差,方差,偏度 ...

本人用到了spss重要功能总结

本人用到了spss重要功能总结
2018-03-19
本人用到了spss重要功能总结 一、SPSS篇 (1)用spss剔除异常值 异常值:一组观测值中与平均值的偏差超过两倍标准差的测定值。 一、analyze >> descriptive statistics >>des ...

R语言中的概率论和数理统计

R语言中的概率论和数理统计
2018-03-13
R语言中的概率论和数理统计 一、随机变量 (一)、什么是随机变量? 1.定义 随机变量(random variable)表示随机现象各种结果的实值函数。随机变量是定义在样本空间S上,取值在实数域上的函数, ...

R语言中的几种图

R语言中的几种图
2018-03-12
R语言中的几种图 R语言中,常见的图有直方图、箱线图、条形图、点阵图、饼图、QQ图。 1.直方图 直方图是直观了解数据分布的常用图形,它将连续型数据分为等间距的组,并以矩形的高低来显示相应组中所 ...

R语言之随机数与抽样模拟篇

R语言之随机数与抽样模拟篇
2018-03-12
R语言之随机数与抽样模拟篇 R语言生成均匀分布随机数的函数是runif() 句法是:runif(n,min=0,max=1)    n表示生成的随机数数量,min表示均匀分布的下限,max表示均匀分布的上限;若省略参数mi ...

R语言中执行二项分布检验

R语言中执行二项分布检验
2018-03-12
R语言中执行二项分布检验 我们在做某项决定时, 我们希望证明给出的假设并不是偶然成立,而是具有统计显著性.在假设检验中存在两种假设:原假设以及备择假设(称为研究假设),假设检验的结果的目的是验证实验 ...

使用R完成正太分布检验

使用R完成正太分布检验
2018-03-11
使用R完成正太分布检验 什么是正太分布检验? 判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验。 方法一概率密度曲线比较法 看样本与正太分布概率密度曲线的拟合程度,R代码如下: nor ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

方差、标准差、均方差、均方误差区别总结

方差、标准差、均方差、均方误差区别总结
2018-03-07
方差、标准差、均方差、均方误差区别总结 一、百度百科上方差是这样定义的: (variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即 ...

数字信号处理中均值、方差、均方值、均方差计算和它们的物理意义

数字信号处理中均值、方差、均方值、均方差计算和它们的物理意义
2018-03-06
数字信号处理中均值、方差、均方值、均方差计算和它们的物理意义 1 均值 均值表示信号中直流分量的大小,用E(x)表示。对于高斯白噪声信号而言,它的均值为0,所以它只有交流分量。 2 均值的平方 ...

probit模型

probit模型
2018-03-06
probit模型 今天看计算广告学,谈到最大熵与指数簇的一些关系,网上查资料,期间发现这个probit模型的概念,以前竟然完全没听过。因此花点时间来搞懂,网上的资料并不是很详细,因此形成一篇,分享给大家。 ...

(笔记)spss的描述统计和比较均值

(笔记)spss的描述统计和比较均值
2018-03-05
(笔记)spss的描述统计和比较均值 描述统计: 分析-描述统计,包括:频率,描述,搜索,交叉表,比率,P-P图,Q-Q图 1,频率:分析多个样本中取值的出现频次,求得这些频次的 ...

用spss判断正态性检验的几种方法

用spss判断正态性检验的几种方法
2018-03-03
用spss判断正态性检验的几种方法 题目:  某地 120 名男性红细胞数(blood)的数据(见程序中“BEGIN DATA”与“END DATA”之间的数据),此数据呈正态分布吗?(引自马斌荣主编书著,2001. P.150) syn ...

OK