cda

数字化人才认证

首页 > 行业图谱 >

机器学习中的Accuracy,Precision,Recall和F1-Score

机器学习中的Accuracy,Precision,Recall和F1-Score
2017-03-18
机器学习中的Accuracy,Precision,Recall和F1-Score 在模式识别和信息检索领域,二分类的问题(binary classification)是常会遇到的一类问题。例如,银行的信用卡中心每天都会收到很多的信用卡申请,银行必 ...
对大数据的八大观点分析
2016-10-16
对大数据的八大观点分析 越来越多程序员也涌入大数据行业,但是仔细问一些从业人员什么是大数据?鲜有人知道?就算知道的,最常引用Victor的4V理论,大量(Volume),快速(Velocity),种类多(Variety),价值(Value) ...

数据挖掘与数据分析梳理

数据挖掘与数据分析梳理
2016-10-11
数据挖掘与数据分析梳理 一、数据挖掘和数据分析概述 数据挖掘和数据分析都是从数据中提取一些有价值的信息,二者有很多联系,但是二者的侧重点和实现手法有所区分。 数据挖掘和数据分析的不同之处: ...

2017校招数据分析岗位笔试/面试知识点

2017校招数据分析岗位笔试/面试知识点
2016-09-30
2017校招数据分析岗位笔试/面试知识点 2017校招正在火热的进行,后面会不断更新涉及到的相关知识点。尽管听说今年几个大互联网公司招的人超少,但好像哪一年都说是就业困难,能够进去当然最好,不能进去是不是 ...
《大数据的“道”“术”“释”》----读书摘录+思考
2016-09-28
《大数据的“道”“术”“释”》----读书摘录+思考 这本书是看到我老师的朋友圈推荐才买的,看了一下目录,比较喜欢。就认真的读了下去,这不是一本讲什么是大数据的书,而是一本为什么要用到大数据分析的书。 ...

以数据挖掘技术预测用户流失情况的方法

以数据挖掘技术预测用户流失情况的方法
2016-09-23
以数据挖掘技术预测用户流失情况的方法 所有网络服务及在线游戏的硬伤是什么?也就是游戏开始头几分钟或几小时内出现的大量用户流失情况。已经有不少人通过多种方式探索这个问题的解决之道,其中多由界面的易用 ...
中国大数据的发展以及商业价值
2016-09-16
中国大数据的发展以及商业价值 首先小编给你分享一个小故事介绍大数据入门是怎么一回事:以前有个国王很高兴想奖赏他的宠臣,然后说让他来提任何奖励,这个大臣给国王看下面这个棋盘,是个8*8的方格,如果我 ...
数据挖掘系列分类算法评价
2016-08-15
数据挖掘系列分类算法评价 一、引言 分类算法有很多,不同分类算法又用很多不同的变种。不同的分类算法有不同的特定,在不同的数据集上表现的效果也不同,我们需要根据特定的任务进行算法的选择,如何选择 ...

R语言与分类算法的绩效评估

R语言与分类算法的绩效评估
2016-05-18
R语言与分类算法的绩效评估 关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。 既然要对分类算法进行评价,那 ...
20个问题揭穿冒牌数据科学家
2016-05-12
20个问题揭穿冒牌数据科学家 如今数据科学家正式成为21世纪最性感的工作,人人都想来分一杯羹。 这也意味着会有一些冒牌货。这些人自称数据科学家,却不具有相应的技能。 这不见得是有意欺骗。数据科学是 ...

数据科学管理之道 关于管理数据科研团队的经验和教训

数据科学管理之道 关于管理数据科研团队的经验和教训
2016-04-22
数据科学管理之道 关于管理数据科研团队的经验和教训 当我初次到一家研究数据挖掘和机器学习的创业公司担任工程部副总裁时,其他高管都对这个问题感到好奇。他们知道,这是一支天赋异禀的团队,看上去也工作得 ...
揭穿冒牌数据科学家20个问题
2016-02-20
揭穿冒牌数据科学家20个问题 如今数据科学家正式成为21世纪最性感的工作,人人都想来分一杯羹。 这也意味着会有一些冒牌货。这些人自称数据科学家,却不具有相应的技能。 这不见得是有意欺骗。数据 ...

硅谷大数据的过去与未来

硅谷大数据的过去与未来
2016-01-31
硅谷大数据的过去与未来 在硅谷大家非常热情地谈创业谈机会,我也通过自己的一些观察和积累,看到了不少最近几年涌现的热门创业公司。这个是华尔街网站的全世界创业公司融资规模评选。它本来的标题是billion s ...

CDA数据分析练习题3

CDA数据分析练习题3
2024-09-12
《数据分析专项练习题库》 《CDA数据分析认证考试模拟题库》 《企业数据分析面试题库》 75.利用Apriori算法计算频繁项集可以有效降低计算频繁集的时间复杂度。在以下的购物篮中产生支持度不小于3的 ...
发现假数据科学家的20个问题
2016-01-05
 发现假数据科学家的20个问题 现在,数据科学家是21世纪最性感的职业,每个人都希望分一块蛋糕。 这表示会有一些装腔作势的数据人士。这些人称自己为数据科学家,但他们并不掌握对应的技能。 这个 ...

关于混淆矩阵(Confusion Matrix)概念的分析和理解

关于混淆矩阵(Confusion Matrix)概念的分析和理解
2020-07-08
混淆矩阵(confusion matrix),又被叫做错误矩阵(error matrix)。矩阵的每一列代表分类器对于样本的类别预测,矩阵的每一行代表版本所属的真实类别。 ’混淆矩阵‘这个名字来源于,它能够很容易的看到机器学习是 ...

使用python构建一个推荐系统需要几步?

使用python构建一个推荐系统需要几步?
2020-05-29
在我看来,作为一位中国人的我们不管做什么决定都在面临多种选择。例如,如果我这个时候想要买一本书,但是我却不知道我想看什么书、不知道类型、不知道方向,那么这个时候打开各种进行软件搜索可能会出现各种各样 ...

机器学习python应用,简单机器学习项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

模型评估:K-s曲线值变化有什么规律?

模型评估:K-s曲线值变化有什么规律?
2020-05-19
K-s是模型验证的最常用的“武器”之一,而K-s曲线指洛伦兹曲线之间的差值。 K-S曲线主要是验证模型的区分能力,通常是在模型预测全体样本的信用评分后,将全体样本按违约与非违约分为两部分,然后用K-S统计量来检验 ...

机器学习中的评价指标

机器学习中的评价指标
2019-12-17
作者 | 我的智慧生活 来源 | 咪付 在人工智能领域,机器学习的效果需要用各种指标来评价。本文将阐述机器学习中的常用性能评价指标,矢量卷积与神经网格的评价指标不包括在内。 训练与 ...

OK