cda

数字化人才认证

首页 > 行业图谱 >

如何理解欠拟合?常用的处理方法有哪些?

如何理解欠拟合?常用的处理方法有哪些?
2020-07-08
一、欠拟合概念及理解 机器学习中欠拟合是一个常见的问题,简单来说就是模型在训练和预测时表现都欠佳的情况。一个欠拟合的机器学习模型不是一个良好的模型并且在训练数据上表现不好这是显而易见的。 图 ...

你需要掌握的4种常用数据降维方法

你需要掌握的4种常用数据降维方法
2020-07-09
近来数据记录和规模属性都在急剧增长,由于大多数数据挖掘算法都是直接逐列处理数据,因此导致算法越来越慢。为了保证减少数据列数的同时,丢失的数据信息尽可能少, 数据降维处理算法应运而生。 一、降维的 ...
数据湖是什么?它与数据仓库一样吗?
2020-07-07
数据湖或hub的概念最初是由大数据厂商提出的,表面上看,数据都是承载在基于可向外扩展的HDFS廉价存储硬件之上的。但数据量越大,越需要各种不同种类的存储。最终,所有的企业数据都可以被认为是大数据,但并不是 ...

4分钟带你看懂究竟什么是数据仓库?

4分钟带你看懂究竟什么是数据仓库?
2020-07-06
【导语】: 数据仓库是商业和数据科学中最热门的话题之一。 但是,如果你是该领域的新手,你可能想知道什么是数据仓库?为什么我们需要它,它是怎么运行的? 别担心,因为在接下来的4分钟,你将知晓这所有 ...

集成学习是什么?有哪些分类?

集成学习是什么?有哪些分类?
2020-07-03
今天小编给大家带来的是现在非常火爆的机器学习方法——集成学习。集成学习,顾名思义,通过将多个单个学习器集成/组合在一起,使它们共同完成学习任务,有时也被称为“多分类器系统(multi-classifier system)”、 ...

逻辑回归(Logistic Regression)有哪些优缺点?

逻辑回归(Logistic Regression)有哪些优缺点?
2022-12-23
逻辑回归也是机器学习中常见的一种学习方法,今天我们就来看一看逻辑回归的优缺点。 逻辑回归(Logistic Regression)是一种有监督的统计学习方法,主要用于对样本进行分类。逻辑回归是机器学习中做分类任务常用的方 ...

线性可分支持向量机、线性支持向量机、非线性支持向量机的区别有哪些

线性可分支持向量机、线性支持向量机、非线性支持向量机的区别有哪些
2020-07-03
支持向量机是一种二类分类模型.它的基本模型是定义在特征空间上的间隔最大的线性分类器。其学习策略是间隔最大化,可形式化为求解凸二次规划问题,也等价于正则化的合叶损失函数的最小化问题。 支持向量机学习 ...
SVM和LR有哪些相同点和不同点
2020-07-03
SVM和LR是机器学习中常用的算法,今天就让我们来看一下这两者有哪些相同点和不同点吧。 SVM和LR的相同点: 1.LR和SVM都是有监督的学习 2.LR和SVM都可以处理分类问题,且一般都用于处理线性二分类问题(在 ...

PCA降维原理(主成分分析)的数学理论

PCA降维原理(主成分分析)的数学理论
2020-07-03
在机器学习中,有成千上万甚至几十万的维度的数据需要处理,这种情况下机器学习的资源消耗是不可接受的,并且很大程度上影响着算法的复杂度,因此对数据降维是必要的。PCA(Principal Component Analysis)是一种常 ...
简单理解文本挖掘的定义与过程
2020-07-02
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法,主要用途 ...

运营er常用的数据分析方法有哪些?

运营er常用的数据分析方法有哪些?
2020-07-02
小编常说,不会数据分析的小编不是好运营。想小编区区一介小编,是运营环节最不起眼的人了,编文章是应该最主要工作,可是现在除了写文章,小编还要策划活动,对接社群,平时还得自己修修图啥的,让小编心烦的就是 ...

机器学习:关于最小二乘法基本概念的理解

机器学习:关于最小二乘法基本概念的理解
2020-07-01
今天小编给大家分享一下最小二乘法的一些内容。 一、最小二乘法概念 最小二乘法Least Square Method,做为分类回归算法的基础,有着悠久的历史(由马里·勒让德于1806年提出)。主要是通过最小化误差的平方以 ...

朴素贝叶斯算法的简单理解和介绍

朴素贝叶斯算法的简单理解和介绍
2020-07-01
贝叶斯分类是一类分类算法的总称,这类算法都是以贝叶斯定理为基础,所以统称为贝叶斯分类。贝叶斯分类中最简单,同时也是常见的一种分类方法就是朴素贝叶斯分类。下面小编来简单介绍一下朴素贝叶斯分类。 一、 ...

线性回归的原理和表达式

线性回归的原理和表达式
2020-07-01
有监督学习的主要任务是分类和回归,而其中最简单的一种回归方式就是线性回归。下面跟随小编一起来看线性回归的内容吧。 线性回归得出的模型不一定是一条直线,在只有一个变量的时候,模型是平面中的一条直线; ...
数据清洗中常用的异常值检测的几种方法
2020-06-30
异常值是指样本中的个别值,其数值明显偏离它(或它们们)所属样本的其余观测值。异常值分析目的是检验是否有录入错误的数据以及是否含有不合常理的数据时。如果对异常值的存在忽视不见,在数据的计算分析过程中把异 ...
机器学习里的无监督学习是什么?
2020-06-30
无监督学习是机器学习里的一种学习方式,下面将给大家具体解释一下无监督学习到底是什么? 首先我们可以对照监督学习来对比理解一下无监督学习的概念。 机器学习中,监督学习是一种明确的训练方式,你能够很 ...

机器学习中,线性与非线性的区别

机器学习中,线性与非线性的区别
2020-06-30
在机器学习中经常会遇到两个概念:线性、非线性。今天就让我们一起来看以下线性与非线性的。 一、一般在线性代数中,线性有以下两个特征: 齐次性:f(a*x)=a*f(x); 可叠加行:f(x+y)=f(x)+f(y)。 只要 ...

12306验证码为什么那么变态?都是这项深度学习应用给逼的

12306验证码为什么那么变态?都是这项深度学习应用给逼的
2020-06-29
作者:莫凡 来源:大数据DT(ID:hzdashuju) 导读:12306为什么要设置那么复杂的验证码机制呢?就是因为OCR。 今天聊OCR。 OCR是人工智能、机器学习特别是深度学习,在图像识别方向最为重要的应用之一。 ...
机器学习是什么?怎么理解?
2020-06-29
科技创新是经济发展的根本动力。在如今这一时代,AI人工智能就是推动经济发展的最重要的科技动力。特别是近些年来行业与AI人工智能的结合,释放了行业的潜力,重塑着人们的日常工作和生活。在AI人工智能备受关注、 ...

什么是数字化转型?来自IBM、微软、阿里的精华观点和实践

什么是数字化转型?来自IBM、微软、阿里的精华观点和实践
2020-06-28
作者:付晓岩 来源:大数据DT(ID:hzdashuju) 导读:众多企业管理者都将“数字化转型”视为战略核心,那么“数字化转型”应该已经有了一个清晰的概念才对,但实际上却并非如此。经过笔者多方收集,似乎大家 ...

OK