cda

数字化人才认证

首页 > 行业图谱 >

特征值和特征向量的详细计算及几何意义

特征值和特征向量的详细计算及几何意义
2020-07-08
矩阵特征值与特征向量在机器学习算法中经常会用到,每次出现都有着其独特的意义,如果不能深入理解特征值和特征向量两个概念,对我们机器学习的实际应用会有很大影响。小编今天整理了特征值和特征向量的概念计算以 ...

你需要掌握的4种常用数据降维方法

你需要掌握的4种常用数据降维方法
2020-07-09
近来数据记录和规模属性都在急剧增长,由于大多数数据挖掘算法都是直接逐列处理数据,因此导致算法越来越慢。为了保证减少数据列数的同时,丢失的数据信息尽可能少, 数据降维处理算法应运而生。 一、降维的 ...

关于混淆矩阵(Confusion Matrix)概念的分析和理解

关于混淆矩阵(Confusion Matrix)概念的分析和理解
2020-07-08
混淆矩阵(confusion matrix),又被叫做错误矩阵(error matrix)。矩阵的每一列代表分类器对于样本的类别预测,矩阵的每一行代表版本所属的真实类别。 ’混淆矩阵‘这个名字来源于,它能够很容易的看到机器学习是 ...
python数据挖掘的基本任务是什么?
2020-07-07
数据挖掘(data mining,简称DM),是指从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知的、且有价值的信息和知识的过程。在python对数据的处理方式中,数据挖掘和数据分析是两个重要的方式,目 ...
特征工程是什么?常用的方法有哪些?
2020-07-07
“数据决定了机器学习的上限,而算法只是尽可能逼近这个上限”,这里的数据指的就是经过特征工程得到的数据。特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更好的训练数据特征,使得机器 ...

Hadoop是什么意思,有哪些作用?

Hadoop是什么意思,有哪些作用?
2020-07-07
Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,可编写和运行分布式应用处理大规模数据,是专为离线和大规模数据分析而设计的,对那种对几个记录随机读写的在线事务处 ...
常用的python缺失值处理方法有哪几种?
2020-07-06
缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类、分组、删失或截断。它指的是现有数据集中某个或某些属性的值是不完全的。 python缺失的处理一般情况下有三种方法: (1)删掉缺失值数据 删除法是 ...

强强联合|美林数据牵手CDA共同推动大数据分析人才培养

强强联合|美林数据牵手CDA共同推动大数据分析人才培养
2020-07-06
近日,美林数据与CDA(Certified Data Analyst)达成战略合作,以促进大数据与人工智能产业发展为目标,充分发挥双方优势,共同推动大数据分析人才培养,为国家大数据与人工智能产业发展提供满足行业需求的优质 ...

集成学习是什么?有哪些分类?

集成学习是什么?有哪些分类?
2020-07-03
今天小编给大家带来的是现在非常火爆的机器学习方法——集成学习。集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、 ...

逻辑回归(Logistic Regression)有哪些优缺点?

逻辑回归(Logistic Regression)有哪些优缺点?
2022-12-23
逻辑回归也是机器学习中常见的一种学习方法,今天我们就来看一看逻辑回归的优缺点。 逻辑回归(Logistic Regression)是一种有监督的统计学习方法,主要用于对样本进行分类。逻辑回归是机器学习中做分类任务常用的方 ...
SVM和LR有哪些相同点和不同点
2020-07-03
SVM和LR是机器学习中常用的算法,今天就让我们来看一下这两者有哪些相同点和不同点吧。 SVM和LR的相同点: 1.LR和SVM都是有监督的学习 2.LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在 ...
SVC,NuSVC,LinearSVC有什么区别
2020-07-03
相信大家在机器学习中,一定常见到;SVC,NvSVC,LinearSVC,今天我们就来看看这三者的区别。 SVC(C-Support Vector Classification): 支持向量分类,基于libsvm实现的,数据拟合的时间复杂度是数据样本的二 ...

支持向量机SVM 概念及特征介绍

支持向量机SVM 概念及特征介绍
2020-07-03
支持向量机SVM(Support Vector Machine),是常见的一种判别方法。在机器学习领域,是有监督学习模型,通常用来进行模式识别、分类及回归分析,主要针对小样本数据进行学习、分类和预测,类似的根据样本进行学习的 ...

PCA降维原理(主成分分析)的数学理论

PCA降维原理(主成分分析)的数学理论
2020-07-03
在机器学习中,有成千上万甚至几十万的维度的数据需要处理,这种情况下机器学习的资源消耗是不可接受的,并且很大程度上影响着算法的复杂度,因此对数据降维是必要的。PCA(Principal Component Analysis)是一种常 ...
简单理解文本挖掘的定义与过程
2020-07-02
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...

 这几个常用的python库你需要知道

这几个常用的python库你需要知道
2020-07-02
python可以说是近几年最火热、最实用的、最容易上手的工具之一了。功能强大、应用广泛,可以帮你搜集工作数据,还能帮你下载音乐,电影,于是就掀起了一波学习python的大潮,小编也毫不犹豫的加入了。但是对于向小 ...

实用又好看的Python可视化库有哪些?

实用又好看的Python可视化库有哪些?
2020-07-02
Python是一款功能强大的数据分析工具,其中Python可视化功能更是受到许多数据分析师的青睐,下面小编就给大家分享一些Python可视化库,希望对各位数据分析师小伙伴有所帮助。 1.Matplotlib Matplotlib是一个 ...
想报名CDA建模分析师,有什么要求?
2020-07-01
“CDA数据分析师认证”是一套专业化,科学化,国际化,系统化的人才考核标准,分为CDA LEVELⅠ ,LEVEL Ⅱ,LEVEL Ⅲ,CDA Level II:建模分析师,专指金融、电信、零售、互联网、电商、医学等行业专门从事数据分 ...

想成为数据分析师,需要重点学习什么技能?

想成为数据分析师,需要重点学习什么技能?
2020-09-28
随着科技的创新和发展,数据分析师也越来越吃香,各行各业都需要这种技能分析数据又能实现业务增长的人才,前很多小伙伴也正在转行中。但是,想成为数据分析师需要学习的知识有很多,大家必须建立一个清晰的知识体 ...
协同过滤:基于用户的协同过滤和基于物品的协同过滤
2020-07-01
协同过滤(CollaborativeFiltering)是推荐算法中最经典、应用最广泛的类型,主要的功能是预测和推荐。它的原理是通过了解用户与物品之间的关系进行推荐,物品本身的属性不考虑在内。主要由线的协同和离线的过滤两部 ...

OK