cda

数字化人才认证

首页 > 行业图谱 >

简单理解文本挖掘的定义与过程
2020-07-02
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...
机器学习之有监督学习
2020-07-01
机器学习分为:有监督学习,无监督学习,半监督学习等。今天跟小编一起来看有监督学习的内容吧。 一、有监督学习定义 有监督学习,就是大家常说的分类,通过某种或某些特性的样本作为训练集,建立一个最优模 ...
机器学习是什么?怎么理解?
2020-06-29
科技创新是经济发展的根本动力。在如今这一时代,AI人工智能就是推动经济发展的最重要的科技动力。特别是近些年来行业与AI人工智能的结合,释放了行业的潜力,重塑着人们的日常工作和生活。在AI人工智能备受关注、 ...

【案例】用支持向量机SVM进行新奇点检测!

【案例】用支持向量机SVM进行新奇点检测!
2020-06-12
异常值检测一般要求新发现的数据是否与现有观测数据具有相同的分布或者不同的分布,相同的分布可以称之为内点(inlier),具有不同分布的点可以称之为离群值。 下图是一个使用支持向量机SVM进行新奇点检测 ...

层次聚类算法:Affinity Propogation算法学习指南

层次聚类算法:Affinity Propogation算法学习指南
2020-06-10
Affinity Propogation最初是由Brendan Frey 和 Delbert Dueck于2007年在Science上提出的。相比其它的层次聚类算法,Affinity Propogation算法不需要预先指定聚类个数。 Affinity Propogation算法的原理可以简单 ...

有监督学习:提高深度学习数据效率的计划-自我监督学习

有监督学习:提高深度学习数据效率的计划-自我监督学习
2020-06-09
尽管深度学习在人工智能领域做出了巨大贡献,但它还是有一个不太好的地方:它需要大量数据。这是深度学习的先驱者和批评家都同意的一件事。实际上,由于有用数据的有限可用性有限以及处理该数据的计算能力不 ...

Kmeans算法精简版(无for loop循环)

Kmeans算法精简版(无for loop循环)
2020-05-27
大家在学习算法的时候会学习到关于Kmeans的算法,但是网络和很多机器学习算法书中关于Kmeans的算法理论核心一样,但是代码实现过于复杂,效率不高,不方便阅读。这篇文章首先列举出Kmeans核心的算法过程 ...

神经网络的泛化能力差吗?

神经网络的泛化能力差吗?
2020-05-21
泛化能力,英文全称generalization ability,指机器学习算法对新鲜样本的适应能力,一种预测新的input类别的能力。 通过学习找到隐含在数据背后的规律,并对具有同一规律的学习集以外的数据,这种经过训练的网络可 ...

机器学习:混淆矩阵的简单概述!

机器学习:混淆矩阵的简单概述!
2020-05-11
混淆矩阵(Confusion Matrix),也成为误差矩阵,是用n行n列矩阵形式来表示的表,这张表通过对比已知分类结果的测试数据的预测值和真实值表来描述衡量分类器的性能。 在二分类的情况下,混淆矩阵是展示预测 ...

准确率已成过去式,AI人工智能领域的这些趋势在2020年更受关注

准确率已成过去式,AI人工智能领域的这些趋势在2020年更受关注
2020-03-31
作者 | 机器之心 人工智能不是将要改变世界,而是正在改变世界。在新年以及新的十年开启之际,VentureBeat 采访了人工智能领域最杰出的头脑,来回顾人工智能在 2019 年的进展,展望机器 ...

机器学习入门必读:6种简单实用算法及学习曲线、思维导图

机器学习入门必读:6种简单实用算法及学习曲线、思维导图
2020-03-26
作者 | 卢誉声 大部分的机器学习算法主要用来解决两类问题——分类问题和回归问题。在本文当中,我们介绍一些简单但经典实用的传统机器学习算法,让大家对机器学习算法有一个基本的感性认识。 ...

盘点AI人工智能的炒作周期——究竟是危言耸听,还是大局已定?

盘点AI人工智能的炒作周期——究竟是危言耸听,还是大局已定?
2020-03-24
1、前言 2、大胆的期望 2.1 到2035年人工智能的力量预测 例如,雷·库兹韦尔(Ray Kurzweil)预测:“到2029年,人工智能将达到人类的水平。” 埃隆·马斯克(Elon Musk) ...

R语言与tableau集成之可视化应用

R语言与tableau集成之可视化应用
2020-04-16
tableau是一款非常棒的数据可视化商业软件,通过拖拉拽的方式迅速的实现数据可视化。而且该软件可以连接任何一种数据库,在处理大型数据时一点都不逊色。缺点是其无法从事数据分析和挖掘工作,幸运的是,从tab ...

如何将机器学习应用于实际的业务问题

如何将机器学习应用于实际的业务问题
2020-03-02
作者 | Daniel Faggella 编译 | CDA数据分析师  自2012年以来,很容易看到风险投资,会议和与业务相关的“机器学习”查询的广泛普及-但大多数技术主管通常很难确定他们的业务可能将机 ...

33 个神经网络「炼丹」技巧

33 个神经网络「炼丹」技巧
2019-12-26
作者 | Andrej Karpathy 编译 | AI有道 特斯拉人工智能部门主管 Andrej Karpathy 发布新博客,介绍神经网络训练的技巧。 Andrej Karpathy 是深度学习计算机视觉领域、与领域的研究员 ...

一文带你深入了解,什么是深度学习及其工作原理

一文带你深入了解,什么是深度学习及其工作原理
2019-12-25
作者 | CraigStedman 编译 | CDA数据科学研究院 深度学习是机器学习(ML)和人工智能(AI)的一种,它模仿人类获取某些类型的知识的方式。深度学习是数据科学的重要元素,其中包括统计和预 ...

机器学习之深度学习的未来

机器学习之深度学习的未来
2019-12-09
作者 | Francois Chollet 编译 | CDA数据分析师 The future of deep learning 鉴于我们对深网的工作原理,局限性以及研究现状的了解,我们能否预测中期的发展方向?这是一些纯粹的个 ...

机器学习与深度学习核心知识点总结(二)

机器学习与深度学习核心知识点总结(二)
2019-12-03
作者 | 小小挖掘机 来源 | SIGAI 主成分分析 主成分分析是一种数据降维和去除相关性的方法,它通过线性变换将向量投影到低维空间。对向量进行投影就是对向量左乘一个矩阵,得到结果向量 ...

22道机器学习常见面试题目汇总!(附详细答案)

22道机器学习常见面试题目汇总!(附详细答案)
2019-12-03
作者 | 数据分析1480 来源 | lsxxx2011 (1) 无监督和有监督算法的区别? 有监督学习:对具有概念标记(分类)的训练样本进行学习,以尽可能对训练样本集外的数据进行标记(分类)预测。 ...

机器学习与深度学习核心知识点总结(一)

机器学习与深度学习核心知识点总结(一)
2019-12-02
作者 | 小小挖掘机 来源 | SIGAI 数学 1.列举常用的最优化方法 梯度下降法 牛顿法, 拟牛顿法 坐标下降法 梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。 ...

OK