cda

数字化人才认证

首页 > 行业图谱 >

傻傻分不清系列 | python中各种字符串处理方法

傻傻分不清系列 | python中各种字符串处理方法
2020-05-25
python易混淆知识系列:pandas字符串方法和字符串内建函数,使用python的一个优势就是字符串处理起来比较容易。 Python的初学者在学习字符串内建函数的时候往往会很困惑:字符串的内建函数是对单个字符串对象处 ...

好书推荐:如何利用A/B测试来做营销决策!

好书推荐:如何利用A/B测试来做营销决策!
2020-05-25
Hello兄弟姐妹萌好,我是不想努力的小P。今天继续为大家推荐一本好书:《A/B测试:创新始于试验》,推荐指数三星半。(以下简称A/B测试)本书的作者是吆喝科技的创世人王晔,先后任职于NEC、微软、谷歌等国际知名 ...

如何用python预测“命定的那个TA”什么时候住酒店?

如何用python预测“命定的那个TA”什么时候住酒店?
2020-05-25
作者:野水晶体  来源:livandata 看到这个题目,大家是否会有一些小小的想法?别闹了!笔者是一个正经人,讨论的也是一个有关python的技术问题,哈哈~ 每个人的行为都是有迹可循的,这些 ...

Caffe框架主要用来做什么?

Caffe框架主要用来做什么?
2020-05-21
Caffe框架,是一个兼具表达性、速度和思维模块化的深度学习框架,用于特征抽取的卷积框架。同时,它一个清晰、可读性高、快速的深度学习框架。 Caffe英文全称为Convolutional Architecture for Fast Fea ...

机器学习中集成学习指什么?

机器学习中集成学习指什么?
2020-05-21
集成学习本身不是一个单独的机器学习算法,是通过建立一组独立的机器学习模型,构建并结合多个机器学习器来完成学习任务,以达到减小方差(bagging)、偏差(boosting)或改进预测(stacking)的效果。 机器学习中 ...

神经网络的泛化能力差吗?

神经网络的泛化能力差吗?
2020-05-21
泛化能力,英文全称generalization ability,指机器学习算法对新鲜样本的适应能力,一种预测新的input类别的能力。 通过学习找到隐含在数据背后的规律,并对具有同一规律的学习集以外的数据,这种经过训练的网络可 ...

kmeans优化算法:二分K-means聚类算法

kmeans优化算法:二分K-means聚类算法
2020-05-21
Bi这里是的意思就是Binary,二进制的意思,所以有时候叫这个算法为二进Kmeans算法。为什么我们需要用BiKmeans呢?就是为了解决初始化k个随机的质心点时其中一个或者多个点由于位置太极端而导致迭代的过程中消失的 ...

有监督学习和无监督学习算法怎么理解?

有监督学习和无监督学习算法怎么理解?
2020-05-19
在判断是有监督学习还是在无监督学习上,我们可以具体是否有监督(supervised),就看输入数据是否有标签(label)。输入数据有标签,则为有监督学习,没标签则为无监督学习。 什么是学习(learning)? 一个成语 ...

下采样和池化的区别是什么?

下采样和池化的区别是什么?
2020-05-19
有部分同学,在学习初期,会认为下采样和池化是指同样的事情,只是叫法不同而已,其实这是一种错误的认知。 下采样(subsampled),或称为降采样(downsampled),指缩小图像。其主要目是使得图像符合显示区域的 ...

feature importance函数的简要介绍!

feature importance函数的简要介绍!
2020-05-19
feature importance指特征重要性,在特征选择的许多方法中,我们可以使用随机森林模型中的特征重要属性来筛选特征,并得到其与分类的相关性。 由于随机森林存在的固有随机性,该模型可能每次给予特征不同的重要性 ...

机器学习中的概率估计指什么?

机器学习中的概率估计指什么?
2020-05-19
机器学习算法会涉及到大量的数学基础内容,数学好的童靴们,你们的优势来了。在机器学习中涉及到了三个数学工具,分别是线性代数、概率统计(概率估计)、最优化理论。 今天,我们来讲概率统计,在机器学习中会涉及 ...

有监督学习:从过去到现在的模型流行度(深度翻译好文)!

有监督学习:从过去到现在的模型流行度(深度翻译好文)!
2020-05-14
在过去的几十年中,机器学习领域发生了巨大的变化。诚然,有些方法已经存在很长时间了,但仍然是该领域的主要内容。例如,Legendre和Gauss已经在19世纪初提出了最小二乘的概念。在最近的几十年中,诸如神经网络等 ...

爬虫解析库xpath功能很强大吗?

爬虫解析库xpath功能很强大吗?
2020-05-14
xpath,英文全称XML Path Language,即XML路径语言,它是一种用来确定XML文档中某部分位置的语言,可以在 XML文档中查找相关的信息,相对而言功能还是比较强大的。 xpath最初是一个通用的、介于XPointer与XSL间的语 ...

postgreSQL的简单介绍?

postgreSQL的简单介绍?
2020-05-14
postgreSQL是一款先进的开源数据库,拥有非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),可面向企业复杂SQL的OLTP业务场景,支持多项企业级功能,能解决使用数据库的各种难题。 PostgreSQL的优势有很多 ...

维度表和事实表的含义是什么?

维度表和事实表的含义是什么?
2020-05-14
维度表和事实表,在构建企业级数据仓库时经常能见到。维度表被看成是用户用来分析一个事实的窗口,它里面的数据应该是对事实的各个方面描述,简而言之就是基础表,如:时间维度表,它里面的数据就是一些日,周,月, ...

T分布是一条以0为中心左右对称的曲线吗?

T分布是一条以0为中心左右对称的曲线吗?
2020-05-11
最近,看到一道有关T分布的试题《T分布是一条以0为中心左右对称的曲线吗?》确实,T分布是以0为中心,左右对称的一簇单峰曲线。不过,当其自由度越小,曲线的峰度越低,尾部越高,当自由度趋于无穷大时,t分布就是标 ...

大数据如何改善营销决策?

大数据如何改善营销决策?
2020-05-08
近几年,数据的增长速度呈现爆炸式趋势,数据营利成为或将成为收入的主要来源。大部分的商业智能应用均针对营销决策,在这一领域的主要影响如下。   (1)、规划分析   数据科学家为营销部门提供 ...

 矩阵分析、矩阵理论、矩阵论三者的适用范围!

矩阵分析、矩阵理论、矩阵论三者的适用范围!
2020-05-08
矩阵分析、矩阵理论、矩阵论是三种较为常见学科,这里为大家介绍一些它们的适用范围和区别。 ——矩阵分析 主要包括线性空间与线性变换,内积空间,矩阵的相似标准形,矩阵分解,矩阵函数等内容,侧 ...

8个流行的Python可视化工具包,你喜欢哪个?

8个流行的Python可视化工具包,你喜欢哪个?
2020-04-28
把这三个包放在一起有几个原因:首先 Seaborn 和 Pandas 是建立在 Matplotlib 之上的,当你在用 Seaborn 或 Pandas 中的 df.plot() 时,用的其实是别人用 Matplotlib 写的代码。因此,这些图在美化方面是 ...

千亿数据优化,如何绕过数据倾斜这头拦路虎?

千亿数据优化,如何绕过数据倾斜这头拦路虎?
2020-04-21
作者:dantezhao 前言: 数据倾斜是大数据领域绕不开的拦路虎,当你所需处理的数据量到达了上亿甚至是千亿条的时候,数据倾斜将是横在你面前一道巨大的坎。 迈的过去,将 ...

OK