cda

数字化人才认证

首页 > 行业图谱 >

机器学习中的特征选择

机器学习中的特征选择
2018-03-21
机器学习中的特征选择 特征选择是一个重要的数据预处理过程,获得数据之后要先进行特征选择然后再训练模型。主要作用:1、降维 2、去除不相关特征。 特征选择方法包含:子集搜索和子集评价两个问题。 子集搜 ...

南京大学宣布成立人工智能学院

南京大学宣布成立人工智能学院
2018-03-07
南京大学宣布成立人工智能学院 据了解,南京大学昨日晚上已经发布通知,宣布成立南京大学人工智能学院。今日,南京大学新闻网上正式发布相关新闻。 南京大学 3 月 5 日发布的通知 在新闻中,南 ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

数据挖掘中常用的数据清洗方法

数据挖掘中常用的数据清洗方法
2018-03-01
数据挖掘中常用的数据清洗方法 对于数据挖掘来说,80%的工作都花在数据准备上面,而数据准备,80%的时间又花在数据清洗上,而数据清洗的工作,80%又花在选择若干种适当高效的方法上。用不同方法清洗的数据,对 ...

上市公司财务指标综合分析

上市公司财务指标综合分析
2021-03-08
一、案例综述 案例编号: 101003 案例名称: 财务管理领域的应用——上市公司财务指标综合分析 作者姓名(或单位、或来源): 刘莎莎 案例所属行业: 69 证券 案例所用软件: ...

收藏 | 机器学习、NLP、Python和Math最好的150余个教程

收藏 | 机器学习、NLP、Python和Math最好的150余个教程
2018-01-22
收藏 | 机器学习、NLP、Python和Math最好的150余个教程 尽管机器学习的历史可以追溯到1959年,但目前,这个领域正以前所未有的速度发展。最近,我一直在网上寻找关于机器学习和NLP各方面的好资源,为了帮助到和 ...

利用R语言如何判别和分类

利用R语言如何判别和分类
2018-01-21
利用R语言如何判别和分类 判别分析(discriminant analysis)是一种分类技术。它通过一个已知类别的“训练样本”来建立判别准则,并通过预测变量来为未知类别的数据进行分类。       ...

北京焦灼?上海颓废?大数据如何解读城市性格?

北京焦灼?上海颓废?大数据如何解读城市性格?
2018-01-19
北京焦灼?上海颓废?大数据如何解读城市性格? 城市如人,在形成的过程中也会显现出独特的性格。具有特殊文化品格和精神气质的城市,无疑是最具吸引力而叫人难忘的。但你是否想过,如何用大数据深度探寻一个城 ...

主成分分析和因子分析及其在R中的…

主成分分析和因子分析及其在R中的…
2018-01-13
主成分分析和因子分析及其在R中的… 主成分分析和探索性因子分析是两种用来探索和简化多变量复杂关系的常用方法,它们之间有联系也有区别。 主成分分析(PCA)是一种数据降维方法,它能将大量相关变量转化为 ...

主成分分析、因子分析、聚类的概览与比较

主成分分析、因子分析、聚类的概览与比较
2018-01-12
主成分分析、因子分析、聚类的概览与比较 主成分分析:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差——协方差结构,即每个主 ...

主成分分析和因子分析十大不同点

主成分分析和因子分析十大不同点
2018-01-11
主成分分析和因子分析十大不同点 主成分分析和因子分析无论从算法上还是应用上都有着比较相似之处,本文结合以往资料以及自己的理解总结了以下十大不同之处,适合初学者学习之用。 1.原理不同 主成分 ...

一文读懂聚类算法

一文读懂聚类算法
2018-01-11
一文读懂聚类算法 1. 聚类的基本概念 1.1 定义 聚类是数据挖掘中的概念,就是按照某个特定标准(如距离)把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇中 ...

硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值

硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值
2018-01-10
硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值 从外表来看,数据科学通常被认为完全是由高等统计学和机器学习技术组成。然而,另一个重要组成部分往往被低估或遗忘:探索性数据分析(EDA)。EDA指对已 ...

数据科学的基本内容

数据科学的基本内容
2018-01-08
数据科学的基本内容 什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都 ...

数据科学家需要掌握的10个基本统计技术

数据科学家需要掌握的10个基本统计技术
2018-01-08
数据科学家需要掌握的10个基本统计技术 无论您在数据的科学性问题上持哪种看法,都无法忽视数据的持续重要性,也不能轻视分析、组织和情境化数据的能力。 根据大量的就业数据和员工反馈信息统计,在“25个最 ...

克服大数据集群的挑战

克服大数据集群的挑战
2018-01-04
克服大数据集群的挑战 数据存储曾经是大数据的最大挑战。由于云计算基础设施的进步,存储数据不再是关键问题。如今,数据科学家所面临的最大问题是数据收集。 集群化使得大数据分析更容易。然而,集群也给数 ...

奇异值分解(SVD)原理详解及推导

奇异值分解(SVD)原理详解及推导
2017-12-22
奇异值分解(SVD)原理详解及推导 在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补充的,特别是关于矩阵和映射之间的对应关系。前段时间看了国外的一篇文章,叫A Singularly Valuable Deco ...

深入浅出,一篇超棒的机器学习入门文章

深入浅出,一篇超棒的机器学习入门文章
2017-12-19
深入浅出,一篇超棒的机器学习入门文章 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇 ...
大话机器学习之数据预处理与数据筛选
2017-12-12
大话机器学习之数据预处理与数据筛选 数据挖掘和机器学习这事,其实大部分时间不是在做算法,而是在弄数据,毕竟算法往往是现成的,改变的余地很小。 数据预处理的目的就是把数据组织成一个标准的形式。 ...

机器学习必知的15大框架

机器学习必知的15大框架
2017-12-07
机器学习必知的15大框架 机器学习工程师是开发产品和构建算法团队中的一部分,并确保其可靠、快速和成规模地工作。他们和数据科学家密切合作来了解理论知识和行业应用。数据专家和机器学习工程师的主要区别是 ...

OK