cda

数字化人才认证

首页 > 行业图谱 >

123456789 3/9
R语言中样本平衡的几种方法
2017-06-07
R语言中样本平衡的几种方法 在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。在不平衡的数据中,任一算法都没法从样本量少的类中 ...

机器学习需要哪些数学基础

机器学习需要哪些数学基础
2017-05-20
机器学习需要哪些数学基础 过去的几个月中,有几人联系我,诉说他们对尝试进入数据科学的世界,以及用机器学习的技术去探索统计规律并构建无可挑剔的数据驱动型产品的热忱。然而,我发现一些人实际上缺乏必要的 ...

一行R代码来实现繁琐的可视化

一行R代码来实现繁琐的可视化
2017-05-13
一行R代码来实现繁琐的可视化 ggfortify 是一个简单易用的R软件包,它可以仅仅使用一行代码来对许多受欢迎的R软件包结果进行二维可视化,这让统计学家以及数据科学家省去了许多繁琐和重复的过程,不用对结果进 ...
R语言学习之矩阵
2017-05-11
R语言学习之矩阵 很多人是在线性代数课学的矩阵,当时什么问题都没有,除了一个问题:学习矩阵到底有什么用呢?矩阵是一个集合,它里面可以存放很多对象,比如一个行就是一个对象(或者说记录),每一个对象又 ...

【案例】数据挖掘与生活:算法分类和应用

【案例】数据挖掘与生活:算法分类和应用
2017-05-06
【案例】数据挖掘与生活:算法分类和应用 本文,主要想简单介绍下数据挖掘中的算法,以及它包含的类型。然后,通过现实中触手可及的、活生生的案例,去诠释它的真实存在。 一、数据挖掘的算法类型 一 ...

主成分分析法及其在SPSS中的操作

主成分分析法及其在SPSS中的操作
2017-05-02
主成分分析法及其在SPSS中的操作 一、主成分分析基本原理 概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。从数学角度来看,这是一种降维处理技术。 思路:一个研究对象,往往 ...

机器学习中的kNN算法及Matlab实例

机器学习中的kNN算法及Matlab实例
2017-03-18
机器学习中的kNN算法及Matlab实例 K最近邻(k-Nearest  Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即 ...

机器学习中的降维算法:ISOMAP & MDS

机器学习中的降维算法:ISOMAP & MDS
2017-03-11
机器学习中的降维算法:ISOMAP & MDS 降维是机器学习中很有意思的一部分,很多时候它是无监督的,能够更好地刻画数据,对模型效果提升也有帮助,同时在数据可视化中也有着举足轻重的作用。 一说到降维,大家第 ...

大数据风控模型的基本流程

大数据风控模型的基本流程
2017-01-23
大数据风控模型的基本流程 金融的本质是将风险偏好不同的资金供给方和风险不同的资金需求方匹配起来。而大数据风控看两个方面的能力,一个是数据积累,另一个就是技术能力。分析可知,大数据风控模型的基本流程 ...

数据挖掘实战:PCA算法

数据挖掘实战:PCA算法
2016-11-23
数据挖掘实战:PCA算法 为什么要进行数据降维?因为实际情况中我们的训练数据会存在特征过多或者是特征累赘的问题,比如: 一个关于汽车的样本数据,一个特征是”km/h的最大速度特征“,另一个是”英里每 ...

数据挖掘与数据分析梳理

数据挖掘与数据分析梳理
2016-10-11
数据挖掘与数据分析梳理 一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: ...
Python和R语言之分析对比
2016-10-10
Python和R语言之分析对比 在Python中调用R或在R中调用Python,为什么是“和”而不是“或”? 在互联网中,关于“R和Python”的文章,排名前十的搜索结果中只有2篇讨论了一起使用R和Python的优点,而不是把这 ...

【案例】R语言与机器学习学习笔记(分类算法)

【案例】R语言与机器学习学习笔记(分类算法)
2016-09-22
【案例】R语言与机器学习学习笔记(分类算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经 ...
将Python和R整合进一个数据分析流程
2016-08-21
将Python和R整合进一个数据分析流程 在Python中调用R或在R中调用Python,为什么是“和”而不是“或”? 在互联网中,关于“R Python”的文章,排名前十的搜索结果中只有2篇讨论了一起使用R和Python的优点, ...
数据挖掘分类方法小结
2016-07-31
数据挖掘分类方法小结 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业、科研等活动的决策提供所需要的知识。分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势的 ...
大数据时代网络舆情工作挑战与机遇并存
2016-07-23
大数据时代网络舆情工作挑战与机遇并存 近日,由北京市网信办、首都互联网协会组织的“大数据时代网络舆情工作座谈会暨数据分析专业委员会第一次工作会议”在京召开,来自清华大学、中国传媒大学、 中国人民大 ...

大数据实时推荐-不只是统计

大数据实时推荐-不只是统计
2016-06-05
大数据实时推荐-不只是统计 随着大数据时代的来临,如何帮助用户从大量信息中迅速获得对自己有用的信息成为众多商家的重要任务,个性化推荐系统应运而生。个性化推荐系统以海量数据挖掘为基础,引导用户发现自 ...

基于机器学习的高价值用户自动发现

基于机器学习的高价值用户自动发现
2016-06-05
基于机器学习的高价值用户自动发现 自2014年起,猎聘建立全球职业发展中心(Global Career Develop Center, 简称GCDC),同时服务企业和求职者,作为两者互动的桥梁发挥着重要的作用。不同于其他互联网招聘企业, ...

城市大数据的生态模型及应用

城市大数据的生态模型及应用
2016-05-26
城市大数据的生态模型及应用 从提出一个生态模型开始,阐述了建立一个可持续的城市大数据生态所需要的关键角色以及地方政府在演进这些角色中所能发挥的作用。接着,给出了一个实际案例作为这个模型的参考实现 ...

机器学习—海量数据挖掘解决方案

机器学习—海量数据挖掘解决方案
2016-04-12
机器学习—海量数据挖掘解决方案 大数据时代里,互联网用户每天都会直接或间接使用到大数据技术的成果,直接面向用户的比如搜索引擎的排序结果,间接影响用户的比如网络游戏的流失用户预测、支付平台的欺 ...
123456789 3/9

OK