cda

数字化人才认证

首页 > 行业图谱 >

 机器学习 数据降维方法:PCA主成分分析

机器学习数据降维方法:PCA主成分分析
2020-06-16
PCA在机器学习中很常用,是一种无参数的数据降维方法。PCA步骤: 将原始数据按列组成n行m列矩阵X 将X的每一行(代表一个属性字段)进行零均值化,即减去这一行的均值 求出协方差矩阵 求 ...

 机器学习 基础:无监督异常检测和半监督异常检测!

机器学习基础:无监督异常检测和半监督异常检测!
2020-06-12
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。离群点和新奇点检测是不同的,有一个重要的区分必须掌 ...

 机器学习 的数据清理以及数据标准化!

机器学习的数据清理以及数据标准化!
2020-05-29
没有干净的原始数据,为了满足机器学习怼数据的要求,必须过滤数据。例如, 1、查看数据,并排除所有缺少大量数据的列。 2、再次查看数据,然后选择要用于预测的列(特征选择)。进行迭代时,可能需要 ...

 机器学习 中的有监督和无监督都包括些什么?

机器学习中的有监督和无监督都包括些什么?
2020-05-29
机器学习算法通常分为有监督的(训练数据有标记答案)和无监督的(可能存在的任何标签均未显示在训练算法中)。有监督的机器学习问题又分为分类(预测非数字答案,例如错过抵押贷款的可能性)和回归(预测 ...

如何正确选择线性回归、逻辑回归、决策等 机器学习 算法

如何正确选择线性回归、逻辑回归、决策等机器学习算法
2020-05-27
机器学习既是艺术又是科学。但当您查看机器学习算法时,没有一种解决方案或一种适合所有情况的算法。有几个因素会影响您选择哪种机器学习。 有些问题非常具体,需要采取独特的方法。例如,如果您使用推荐系统, ...

 机器学习 python应用,简单 机器学习 项目实践!

机器学习python应用,简单机器学习项目实践!
2020-05-25
上一篇文章中介绍了机器学习的简单知识,还有python中进行机器学习实践需要的生态环境,接下来将会通过鸢尾花分类这个例子对机器学习做一个简要的介绍。通过一步一步地实现这个项目来介绍以下内容。 导入和 ...

 机器学习 python算法应用,监督学习、无监督学习等!

机器学习python算法应用,监督学习、无监督学习等!
2020-05-25
本系列文章主要介绍机器学习在实践中的应用,介绍利用 python 的生态环境,使用机器学习的算法来解决工程实践中的问题,而不是介绍算法本身。本系列文章参考了《机器学习Python实践》,会通过例子一步一步地引导大 ...

 机器学习 中集成学习指什么?

机器学习中集成学习指什么?
2020-05-21
集成学习本身不是一个单独的机器学习算法,是通过建立一组独立的机器学习模型,构建并结合多个机器学习器来完成学习任务,以达到减小方差(bagging)、偏差(boosting)或改进预测(stacking)的效果。 机器学习中 ...

 机器学习 中的概率估计指什么?

机器学习中的概率估计指什么?
2020-05-19
机器学习算法会涉及到大量的数学基础内容,数学好的童靴们,你们的优势来了。在机器学习中涉及到了三个数学工具,分别是线性代数、概率统计(概率估计)、最优化理论。 今天,我们来讲概率统计,在机器学习中会涉及 ...

 机器学习 :混淆矩阵的简单概述!

机器学习:混淆矩阵的简单概述!
2020-05-11
混淆矩阵(Confusion Matrix),也成为误差矩阵,是用n行n列矩阵形式来表示的表,这张表通过对比已知分类结果的测试数据的预测值和真实值表来描述衡量分类器的性能。 在二分类的情况下,混淆矩阵是展示预测 ...

 机器学习 算法:无监督、半监督、有监督学习算法浅析

机器学习算法:无监督、半监督、有监督学习算法浅析
2020-05-06
随着人工智能的飞速发展,机器学习成为当下数据分析领域的热门之一,很多人在平时的工作中,或多或少都会使用到机器学习的算法。这里机器学习的算法进行了盘点,将有监督、无监督,半监督学习等进行了简单的解 ...

AI、 机器学习 、数据科学与深度学习研究在2020年的发展趋势(二)

AI、机器学习、数据科学与深度学习研究在2020年的发展趋势(二)
2020-04-03
作者 | Matthew Mayo 编译 | CDA数据分析师 在2019年(及之前的几年)中,我们询问了许多顶级专家,2019年和2020年AI,分析,机器学习,数据科学和深度学习领域最重要的发展趋势 ...

AI、 机器学习 、数据科学与深度学习在2020年的主要发展趋势(一)

AI、机器学习、数据科学与深度学习在2020年的主要发展趋势(一)
2020-04-02
作者 | Matthew Mayo 编译 | CDA数据分析师 正如我们告别上一年并期待新的一年一样,KDnuggets再次征求了众多研究和技术专家对2019年最重要的发展及其2020年关键趋势预测的意见 ...

 机器学习 如何推动数据中心发展?

机器学习如何推动数据中心发展?
2020-04-01
作者 | CDA数据分析师 1、前言 大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源。本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器 ...

 机器学习 入门必读:6种简单实用算法及学习曲线、思维导图

机器学习入门必读:6种简单实用算法及学习曲线、思维导图
2020-03-26
作者 | 卢誉声 大部分的机器学习算法主要用来解决两类问题——分类问题和回归问题。在本文当中,我们介绍一些简单但经典实用的传统机器学习算法,让大家对机器学习算法有一个基本的感性认识。 ...

看 机器学习 如何推动我们去定义公平

机器学习如何推动我们去定义公平
2020-03-16
偏见是机器学习的原始罪过。它嵌入在机器学习的本质中:系统从数据中学习,因此 很容易发现数据所代表的人为偏见。例如,接受过美国现有职业培训的ML招聘系统很可能会“学到”,女性与首席执行官之间的联系不 ...

如何选取 机器学习 的特征选择方法?

如何选取机器学习的特征选择方法?
2020-03-09
作者 | Jason Brownlee 编译 | CDA数据分析师 特征选择是在开发预测模型时减少输入变量数量的过程。 希望减少输入变量的数量,以减少建模的计算成本,并且在某些情况下,还需要改善模 ...

 机器学习 :供应链中的创新技术

机器学习:供应链中的创新技术
2020-03-06
作者 | GEORGIA WILSON 编译 | CDA数据分析师 Watson是IBM的人工智能(AI)服务,应用程序和工具套件。Watson旨在帮助企业以新的方式释放数据的价值,并消除员工的重复任务,从而 ...

当前 机器学习 用于保险业和信用评分的可能性分析

当前机器学习用于保险业和信用评分的可能性分析
2020-03-06
作者 | Daniel Faggella 编译 | CDA数据分析师 机器学习在金融领域的出现,让人们对使用AI自动执行从欺诈检测到客户服务的流程产生了强烈的兴趣。 尽管某些用例的确定性不如其他用例,但我们的研究使我 ...

 机器学习 算法和超参数选择艺术

机器学习算法和超参数选择艺术
2020-03-06
作者 | Mischa Lisovyi & Rosaria Silipo 编译 | CDA数据科学研究院 从智能手机到航天器,机器学习算法无处不在。他们会告诉您明天的天气预报,将一种语言翻译成另一种语言,并建议您接下来想在Netflix ...

OK