cda

数字化人才认证

首页 > 行业图谱 >

数据分析从哪里开始入门学习,可以推荐的书有哪些

数据分析从哪里开始入门学习,可以推荐的书有哪些
2018-04-10
数据分析从哪里开始入门学习,可以推荐的书有哪些 数据行业在迅速的发展,几乎每天都会出现新的技术和方法。因此,想要跟上这个行业的步伐是有挑战性的。之前CDA数据分析师曾列出了15位在科技和数据科学领域最 ...

人工智能、数据挖掘、区块链、支持向量机SVM等 带您读懂近30个大数据热词!

人工智能、数据挖掘、区块链、支持向量机SVM等 带您读懂近30个大数据热词!
2020-05-20
1.AI人工智能 Artificial Intelligence 人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智 ...

教你用Python实现简单监督学习算法

教你用Python实现简单监督学习算法
2018-04-05
教你用Python实现简单监督学习算法 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程 ...

机器学习的几种主要学习方法

机器学习的几种主要学习方法
2018-04-02
机器学习的几种主要学习方法 根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智能领域,人们首先会考虑算法的学习方法。在机器学习领域,有几种主要的学习方法。将算法按照学习方法分类 ...

在机器学习分类中如何处理训练集中不平衡问题

在机器学习分类中如何处理训练集中不平衡问题
2018-04-01
在机器学习分类中如何处理训练集中不平衡问题 很多机器学习任务中,训练集中可能会存在某个或某些类别下的样本数远大于另一些类别下的样本数目。即类别不平衡,为了使得学习达到更好的效果,因此需要解决该类别 ...

数据分析师—技术面试

数据分析师—技术面试
2018-03-29
数据分析师—技术面试 三月份开始找实习,到现在已经有半年的时间了,在这半年的时间中,该经历的基本上都已经经历,春招实习时候,拿到了7个offer,校招时候,成功的拿下一份心仪的工作,结束了我的秋招旅程。 ...

非平衡数据集的机器学习常用处理方法

非平衡数据集的机器学习常用处理方法
2018-03-26
非平衡数据集的机器学习常用处理方法 定义:不平衡数据集:在分类等问题中,正负样本,或者各个类别的样本数目不一致。 例子:在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人 ...

机器学习中非平衡数据集的常用处理方法

机器学习中非平衡数据集的常用处理方法
2018-03-25
机器学习中非平衡数据集的常用处理方法 不平衡数据集: 在分类等问题中,正负样本,或者各个类别的样本数目不一致。 :在人脸检测中,比如训练库有10万张人脸图像,其中9万没有包含人脸,1万包含人脸, ...

机器学习中的特征选择

机器学习中的特征选择
2018-03-21
机器学习中的特征选择 特征选择是一个重要的数据预处理过程,获得数据之后要先进行特征选择然后再训练模型。主要作用:1、降维 2、去除不相关特征。 特征选择方法包含:子集搜索和子集评价两个问题。 子集搜 ...

超详细的大数据分析师职业规划

超详细的大数据分析师职业规划
2018-03-20
超详细的大数据分析师职业规划 最近有不少同学咨询有关数据分析职业发展的问题,由此可见,随着大数据的飞速发展,数据分析职业也成为很多同学关注的目标。不要急,这就给大家介绍数据分 ...

机器学习几个重要概念

机器学习几个重要概念
2018-03-20
机器学习几个重要概念 统计学习的算法可以分为以下几个类别:监督学习、非监督学习、半监督学习以及强化学习。 监督学习的输入数据都有对应的类标签或是一个输出值,其任务是学习一个模型,使模型能够对任意 ...

数据统计学习的5个基本流程

数据统计学习的5个基本流程
2018-03-19
数据统计学习的5个基本流程 统计学、大数据应用很广泛,常常被提及!统计学习也有一定的规律流程,下面我们大圣众包小编分享一位朋友关于统计学习流程步骤的看法,看看他怎么说。 统计学习现在市面上谈论到 ...

本人用到了spss重要功能总结

本人用到了spss重要功能总结
2018-03-19
本人用到了spss重要功能总结 一、SPSS篇 (1)用spss剔除异常值 异常值:一组观测值中与平均值的偏差超过两倍标准差的测定值。 一、analyze >> descriptive statistics >>des ...

为什么你学完了68个Python函数,却依旧做不好数据分析?

为什么你学完了68个Python函数,却依旧做不好数据分析?
2018-03-08
为什么你学完了68个Python函数,却依旧做不好数据分析? 数据分析老鸟都知道,相比于自己作出好的数据分析报告,“教别人如何入门数据分析”这事情简单多了。 什么for循环呀,def函数呀,print输出呀,自变 ...

常用的机器学习&数据挖掘知识点

常用的机器学习&数据挖掘知识点
2018-03-07
常用的机器学习&数据挖掘知识点 Basis(基础): MSE(Mean Square Error 均方误差),LMS(LeastMean Square 最小均方),LSM(Least Square Methods 最小二乘法),MLE(MaximumLikelihood Estimation最 ...

数据挖掘之KNN分类

数据挖掘之KNN分类
2018-03-05
数据挖掘之KNN分类 分类算法有很多,贝叶斯、决策树、支持向量积、KNN等,神经网络也可以用于分类。这篇文章主要介绍一下KNN分类算法。 1、介绍 KNN是k nearest neighbor 的简称,即k最邻近,就是找k个 ...

大数据入门,你需要懂这四个常识

大数据入门,你需要懂这四个常识
2018-03-02
大数据入门,你需要懂这四个常识 一、大数据分析的五个基本方面 1、可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可 ...

数据挖掘中的分类技术

数据挖掘中的分类技术
2018-02-27
数据挖掘中的分类技术 KNN(K最近邻算法) 算法核心:如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别,则该样本也属于这个类别,并具有这个类别的特征 在确定分类时只依靠最邻近的一个 ...

数据挖掘模型中的IV和WOE详解

数据挖掘模型中的IV和WOE详解
2018-02-25
数据挖掘模型中的IV和WOE详解 1.IV的用途 IV的全称是Information Value,中文意思是信息价值,或者信息量。 我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我 ...

机器学习新手必看十大算法

机器学习新手必看十大算法
2018-02-23
机器学习新手必看十大算法 本文介绍了机器学习新手需要了解的 10 大算法,包括线性回归、Logistic 回归、朴素贝叶斯、K 近邻算法等。 在机器学习中,有一种叫做「没有免费的午餐」的定理。简而言之,它指出 ...

OK