cda

数字化人才认证

首页 > 行业图谱 >

如何快速有效地进行客户细分?需要注意的问题有哪些?

如何快速有效地进行客户细分?需要注意的问题有哪些?
2020-08-05
数据分析的最终目的是实现帮助企业实现业务增长,在现阶段,原来的以生产为中心、以销售产品为目的的市场战略已经逐步被以客户为中心、以服务为目的的市场战略所取代。这也就意味着,那个企业能更好地掌握客户的需 ...

教你使用3σ原则来进行异常值处理

教你使用3σ原则来进行异常值处理
2020-07-31
在python数据清洗过程中,我们经常会遇到一些偏离正常范围的数据,例如人的体重为56吨,这些数据叫做异常值,如果不做异常值处理,会对我们最终的数据分析造成影响。小编今天给大家带来了一种很实用的异常值处理方 ...

SVM算法原理是什么?如何实现?

SVM算法原理是什么?如何实现?
2020-07-30
今天跟大家介绍的是SVM算法原理以及实现,废话不多说,直接来看干货吧! 一、SVM概念 SVM的全称为Support Vector Machine,也就是我们经常提到的支持向量机,主要被用来解决模式识别领域中的数据分类问题,是 ...

这几种常见的假设检验方法,你了解吗?

这几种常见的假设检验方法,你了解吗?
2020-07-28
假设检验问题是统计推断中的一类重要问题,小编在之前给大家整理,分享过假设检验的基本步骤,今天给大家带来的是常见的假设检验方法,希望对大家有所帮助。 一、假设检验基本概念 假设检验是用来判断样本与 ...

一文带你了解中文文本分类的关键技术--中文分词

一文带你了解中文文本分类的关键技术--中文分词
2020-07-28
通常来说,计算机对于网络上存在的大量半结构化或结构化的文本数据,计算机很难直接进行处理,因此我们需要在文本分类之前对这些数据作相应的预处理。 文本的预处理分为:文本分词、去除停用词、词义消歧、统 ...

想从事大数据行业,报什么专业比较好

想从事大数据行业,报什么专业比较好
2020-07-27
文章来源:接地气学堂微信公众号 作者: 陈老师 又到一年高考时,又要填志愿,很多人问:“想从事大数据行业的话,报什么专业比较好???”刚好一些同学也有类似问题,今天系统解答一下   ...

机器学习中最小二乘法是什么,如何实现?

机器学习中最小二乘法是什么,如何实现?
2020-07-24
最小二乘法,相信大家都不陌生,统计学中很是常见,而且其理论相对简单,用途也很广泛。今天小编就给大家具体介绍一下最小二乘法。 一、最小二乘概念 最小二乘,或者也可以叫做最小平方和,它目的就是通过最 ...

解决交通拥堵、监测核辐射、野外搜救…无人机将有哪些神应用?

解决交通拥堵、监测核辐射、野外搜救…无人机将有哪些神应用?
2020-07-24
导读:随着应用的不断发展,无人机市场有望迅速发展。本节的目的是概述自主飞行技术的广泛潜在应用:灾难响应、事故监测(安全保障)、搜索和救援等。 作者:雅斯米娜·贝索伊·塞班(Yasmina Bestaoui Sebbane ...

数据工程师需要掌握的18个python库

数据工程师需要掌握的18个python库
2020-07-24
python之所以这么火,是因为它的应用广泛,之所以应用广泛,是因为它包含有许多功能强大的库。对于不是专业数据分析人员的我们,平时在工作和生活中,主要是用python来获取信息,制作可视化报表,但是专业的数据工 ...

无监督机器学习中,这几种聚类算法,你知道吗?

无监督机器学习中,这几种聚类算法,你知道吗?
2020-07-24
机器学习中,我们最常遇到的就是无监督,有监督,半监督了。无监督和有监督的区别,小编之前跟大家分享过,今天跟大家分享的是无监督机器学习中常见的聚类算法,希望对大家无监督学习有所帮助。 一、基本概念 ...

KNN最近邻算法原理是什么?如何实现?

KNN最近邻算法原理是什么?如何实现?
2020-07-24
把近朱者赤,近墨者黑这一思想运用到机器学习中会产生什么?当然是KNN最邻近算法啦!KNN(全称K-Nearest Neighbor)最邻近分类算法是数据挖掘分类算法中最简单的算法之一,白话解释一下就是:由你的邻居来推断出你的类 ...

数据清洗之python实现缺失值处理

数据清洗之python实现缺失值处理
2020-07-24
在实际的数据清洗过程中,我们经常会遇到数据内容丢失的情况,这些丢失的数据内容就是缺失值。缺失值的产生的原因多种多样,主要分为机械原因和人为原因。 机械原因,也就是由于例如,数据存储失败,存储器损坏 ...

朴素贝叶斯算法的优缺点是什么?如何实现?

朴素贝叶斯算法的优缺点是什么?如何实现?
2020-07-24
在文本分类,垃圾邮件过滤的场景中,我们经常会用到的是朴素贝叶斯算法,今天小编就具体给大家介绍一下朴素贝叶斯算法 一、朴素贝叶斯算法简介 1.朴素贝叶斯算法概念 朴素贝叶斯法是基于贝叶斯定理与特征 ...

一文带你快速了解机器学习中的多元线性回归到底是什么?

一文带你快速了解机器学习中的多元线性回归到底是什么?
2020-07-24
线性回归我们都很熟悉了,是有监督学习中最为简单的一种回归方式,小编今天就进一步跟大家分享一下多元线性回归。 一、什么是多元线性回归 在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。线 ...

如何简单通俗的理解交叉熵损失函数?

如何简单通俗的理解交叉熵损失函数?
2020-07-24
前面小编给大家简单介绍过损失函数,今天给大家继续分享交叉熵损失函数,直接来看干货吧。 一、交叉熵损失函数概念 交叉熵损失函数CrossEntropy Loss,是分类问题中经常使用的一种损失函数。公式为: ...

机器学习中有监督学习和无监督学习的区别表现在什么方面?

机器学习中有监督学习和无监督学习的区别表现在什么方面?
2020-07-23
机器学习主要分为:有监督学习,无监督学习,以及半监督学习等。小编今天给大家分享的主要是有监督学习和无监督学习的比较,希望对于大家机器学习有所帮助。 一、首先来了解一下有监督学习和无监督学习的概念 ...

机器学习中Apriori是什么?如何实现?

机器学习中Apriori是什么?如何实现?
2020-07-23
前面小编在介绍FP-Growth算法时,提到了Apriori算法,其实FP-Growth是基于Apriori的,今天小编就具体给大家介绍一下Apriori算法。 一、什么是Apriori算法 Apriori算法是一种最有影响的挖掘数据关联规则频繁 ...

欠拟合产生的原因有哪些?应该如何解决?

欠拟合产生的原因有哪些?应该如何解决?
2020-07-23
对于机器学习或者是深度学习模型来说,我们既希望这个模型能在训练数据中表现良好(训练误差),又希望这个模型在测试集中也能有良好的表现(泛化误差)。而过拟合和欠拟合就是用来描述泛化误差的。欠拟合问题与过拟合 ...

正则化---提高深度学习模型的泛化能力

正则化---提高深度学习模型的泛化能力
2020-07-23
前面文章小编简单给大家介绍了泛化能力的一些基础知识,今天给大家带来的是提高模型泛化能力的方法--正则化。 一、首先来回顾一下什么是泛化能力 泛化能力(generalization ability),百科给出的定义是:机器 ...

关于python语音识别,那还需要掌握这些内容

关于python语音识别,那还需要掌握这些内容
2020-07-22
我们都知道python是一款功能强大的数据分析工具,而且使用起来相对简单,被广泛应用于数据分析,web开发,人工智能等很多领域。语音识别,也叫作自动语音识别,其是以计算机自动将人类的语音内容转换为相应文字为 ...

OK