cda

数字化人才认证

首页 > 行业图谱 >

SVM算法原理是什么?如何实现?

SVM算法原理是什么?如何实现?
2020-07-30
今天跟大家介绍的是SVM算法原理以及实现,废话不多说,直接来看干货吧! 一、SVM概念 SVM的全称为Support Vector Machine,也就是我们经常提到的支持向量机,主要被用来解决模式识别领域中的数据分类问题,是 ...

带你弄清楚到底什么是合页损失函数(hinge loss function)?

带你弄清楚到底什么是合页损失函数(hinge loss function)?
2020-07-30
损失函数,loss function的定义为:将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。在机器学习中,损失函数经常被当作学习准则与优化问题相联系,也就是通过最小化 ...

一文带你了解中文文本分类的关键技术--中文分词

一文带你了解中文文本分类的关键技术--中文分词
2020-07-28
通常来说,计算机对于网络上存在的大量半结构化或结构化的文本数据,计算机很难直接进行处理,因此我们需要在文本分类之前对这些数据作相应的预处理。 文本的预处理分为:文本分词、去除停用词、词义消歧、统 ...

屠杀机器人和无处不在的监控:AI是我们最大的生存威胁?

屠杀机器人和无处不在的监控:AI是我们最大的生存威胁?
2020-07-27
导读:几十年来,人工智能(artificial intelligence,AI)一直是学术界的白日梦。计算机可以像人类一样学习的想法似乎是不可能的。 随着处理能力成本的大幅下降,科学家们终于发现了如何编写和实现人工智能程 ...

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

KNN最近邻算法原理是什么?如何实现?

KNN最近邻算法原理是什么?如何实现?
2020-07-24
把近朱者赤,近墨者黑这一思想运用到机器学习中会产生什么?当然是KNN最邻近算法啦!KNN(全称K-Nearest Neighbor)最邻近分类算法是数据挖掘分类算法中最简单的算法之一,白话解释一下就是:由你的邻居来推断出你的类 ...

如何简单通俗的理解交叉熵损失函数?

如何简单通俗的理解交叉熵损失函数?
2020-07-24
前面小编给大家简单介绍过损失函数,今天给大家继续分享交叉熵损失函数,直接来看干货吧。 一、交叉熵损失函数概念 交叉熵损失函数CrossEntropy Loss,是分类问题中经常使用的一种损失函数。公式为: ...

CNN、RNN、GAN都是什么?终于有人讲明白了

CNN、RNN、GAN都是什么?终于有人讲明白了
2020-07-23
导读:深度学习已经存在了几十年,不同的结构和架构针对不同的用例而进行演变。其中一些是基于我们对大脑的想法,另一些是基于大脑的实际工作。本文将简单介绍几个业界目前使用的先进的架构。 作者:谢林·托马 ...

过拟合是如何产生的?有什么好的解决方法?

过拟合是如何产生的?有什么好的解决方法?
2020-07-23
在机器学习中,相对于欠拟合,过拟合出现的频次更高。这是因为,假设某一数据集其对应的模型为‘真’模型,我们通常是采用提高模型的复杂度的方法,来避免欠拟合现象的产生,但与此同时,我们又很难把网络设计成和 ...

欠拟合产生的原因有哪些?应该如何解决?

欠拟合产生的原因有哪些?应该如何解决?
2020-07-23
对于机器学习或者是深度学习模型来说,我们既希望这个模型能在训练数据中表现良好(训练误差),又希望这个模型在测试集中也能有良好的表现(泛化误差)。而过拟合和欠拟合就是用来描述泛化误差的。欠拟合问题与过拟合 ...

正则化---提高深度学习模型的泛化能力

正则化---提高深度学习模型的泛化能力
2020-07-23
前面文章小编简单给大家介绍了泛化能力的一些基础知识,今天给大家带来的是提高模型泛化能力的方法--正则化。 一、首先来回顾一下什么是泛化能力 泛化能力(generalization ability),百科给出的定义是:机器 ...

业务分析模型,该怎么搭建

业务分析模型,该怎么搭建
2020-07-22
文章来源: 接地气学堂 作者:接地气的陈老师 很多同学最怕听“建模型”仨字。尤其是建立“业务分析模型”。往往自己辛辛苦苦搞得LR、SVM、CNN被业务方狂喷:你这都是啥东西!脱离业务!不切实际! ...

数据分析认证证书,为啥成了香饽饽?百度搜不到的答案来了!

数据分析认证证书,为啥成了香饽饽?百度搜不到的答案来了!
2022-04-03
2020年是特殊的一年,突如其来的疫情,阻断了全球经济高速发展的步伐,很多城市经济陷入低迷。同样,对很多人而言,2020年亦是充满机遇的一年。 古有云:时势造英雄。在遭遇重大危机时,安于现状者无法独善其身 ...

什么是数字孪生体?来自西门子、PTC、北航的精华观点和实践

什么是数字孪生体?来自西门子、PTC、北航的精华观点和实践
2020-07-17
导读:众多企业管理者都将“数字化转型”视为战略核心,那么“数字化转型”应该已经有了一个清晰的概念才对,但实际上却并非如此。经过笔者多方收集,似乎大家对“数字化转型”都有自己的理解。数字孪生具有多种定 ...

人工智能自拍之后,会怎样给自己P图?

人工智能自拍之后,会怎样给自己P图?
2020-07-16
导读:领导让数据叔写篇关于人工智能的原创,于是数据叔决定求助于人工智能。 作者:数据叔 来源:大数据DT(ID:hzdashuju) 01 智能辅助创新 人工智能领域的发展前景广阔。 数学 ...

如何快速安装tensorFlow?需要注意哪些地方?

如何快速安装tensorFlow?需要注意哪些地方?
2020-07-14
tensorFlow是机器学习中应用最广泛,最受欢迎的算法库之一。Tensorflow由谷歌人工智能团队谷歌大脑(Google Brain)开发和维护,Google几乎在所有应用程序中都使用tensorFlow来实现机器学习。 下面小编整理了tensorF ...

半监督学习的种类都有哪些?

半监督学习的种类都有哪些?
2020-07-14
半监督学习(SSL),全称Semi-Supervised Learning,类属于机器学习(Machine Learning,ML)。在只有少量标记样本,大部分样本都是无标记的情况下,可以使用半监督学习方法,根据无标记样本与标记样本间的相似度、以及 ...

spark入门必读:核心概念介绍及常用RDD操作

spark入门必读:核心概念介绍及常用RDD操作
2020-07-13
作者:肖冠宇 来源:大数据DT(ID:hzdashuju) 内容摘编自《企业大数据处理:Spark、Druid、Flume与Kafka应用实践》 导读:Spark是由加州大学伯克利分校AMP实验室开源的分布式大规模数据处理通用引擎,具 ...
应该怎样理解深度学习Caffe?
2020-07-13
Caffe是深度学习框架中经常遇到的,那么到底Caffe是什么?我们又应该怎样理解呢?下面,小编对于Caffe做了一个简单的介绍,希望对大家有所帮助。 一、Caffe基本概念 Caffe全称为:Convolutional Architecture ...

NLP自然语言处理基础概念的理解与介绍

NLP自然语言处理基础概念的理解与介绍
2020-07-13
NLP(Natural Language Processing)自然语言处理是数据科学领域的一个非常重要的分支,它包含了,以一种高效的方式去分析,理解并从文本中提取信息等重要过程,终极目标是让计算机拥有自然语言处理交际能力。通过利 ...

OK