cda

数字化人才认证

首页 > 行业图谱 >

123456 4/6

数据分析之数据挖掘入门指南

数据分析之数据挖掘入门指南
2022-10-25
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

数据分析师之数据挖掘入门

数据分析师之数据挖掘入门
2022-10-19
数据分析 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。 常用的第三方库 ...

什么是数据科学

什么是数据科学
2022-10-18
什么是数据科学?它和已有的信息科学、统计学、机器学习等学科有什么不同?作为一门新兴的学科,数据科学依赖两个因素:一是数据的广泛性和多样性;二是数据研究的共性。现代社会的各行各业都充满了数据,这些数据 ...

在头部保险集团任产品经理的我是这样备考的|CDA持证人分享 杨讯

在头部保险集团任产品经理的我是这样备考的|CDA持证人分享 杨讯
2024-08-13
CDA数据分析师 出品 作者:杨迅 CDA Level Ⅰ 持证人 大家好,我叫杨迅,是一名CDA Level Ⅰ 持证人,今天很高兴跟大家分享一下我的CDA认证备考经验。 总的来说 Level Ⅰ 的内容是比较基础的,我认 ...
没有学位如何进入数据科学
2022-03-14
这篇文章是为那些属于下列类别之一的人准备的: 你没有大专学位,但你对数据科学感兴趣。 你没有STEM相关的学位,但你对数据科学感兴趣。 你在一个与数据科学完全无关的领域工作,但你对数 ...
数据科学中的高级统计概念
2022-02-28
在我以前的文章初学者数据科学统计指南和推断统计数据科学家应该知道中,我们讨论了几乎所有的统计基本知识(描述性和推断性),它们通常用于理解和处理任何数据科学案例研究。在这篇文章中,让我们稍微超越一 ...

年轻人为什么会猝死?这篇Python数据分析报告不可错过

年轻人为什么会猝死?这篇Python数据分析报告不可错过
2022-02-25
作者:俊欣 来源:关于数据分析与可视化 当很多人都仗着自己年轻而对自己的身体漠不关心、眼里只想着赚钱的同时,熟不知死神已经悄悄地在逼近,今天小编就来和大家聊聊什么是猝死、猝死呈现年轻化,诱因又是 ...

手把手教你数据造假-本福特定律和统计中的造假检测

手把手教你数据造假-本福特定律和统计中的造假检测
2022-02-16
来源:小伍哥聊风控 大家好,我是小伍哥,今天给大家分享一个好像有用,好像又没啥用的奇奇怪怪的知识,风控嘛,就是玩儿。 “本福特定律”(Benford's law),也称“本福特法则”,它说明一堆从实际生活得 ...

30岁,放弃国企稳定的工作,转行数据分析

30岁,放弃国企稳定的工作,转行数据分析
2022-01-24
很多人问我会不会后悔? 在决定转行之前,很多亲朋好友听说之后,大部分都是劝我“年龄不小了,就不要折腾了”。 以上是我的一些感受,下面我讲讲我的情况。 体制内,每天就是复制粘贴,肉体停顿,精神 ...

CDA LEVEL 1 考试,知识点《抽样分布及参数估计》

CDA LEVEL 1 考试,知识点《抽样分布及参数估计》
2021-03-12
1.随机试验 可以在相同的条件下重复的进行。 进行一次试验之前不能确定哪一个结果会出现。 在概率论中,随机事件(或简称事件)指的是一个被赋予机率的事物集合,也就是样本空间中的一个子集。简单 ...

工资比同事低,这些关键技能,你掌握了吗

工资比同事低,这些关键技能,你掌握了吗
2021-02-03
前几天公司面试了几个数据分析岗位,一连面试了一周,结果没有一个被录取,感触颇深。 数据分析师每天需要接触大量的数据,可是这些候选人连最基础的拆解业务场景,制定数据指标,以及通过什么样的工具 ...

时序数据处理难题攻略(上)

时序数据处理难题攻略(上)
2020-11-10
作者:计量与统计 来源:公众号计量与统计 时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。它一般采用曲线拟合和参数估计方法(如非线性最小二乘法 ...
如何用Python进行大数据挖掘和分析?快速入门路径图
2018-08-30
如何用Python进行大数据挖掘和分析?快速入门路径图 大数据无处不在。在时下这个年代,不管你喜欢与否,在运营一个成功的商业的过程中都有可能会遇到它。 什么是 大数据 ? 大数据就像它看起来那样——有 ...

数据挖掘算法:EM算法

数据挖掘算法:EM算法
2018-08-06
数据挖掘算法:EM算法 1. 极大似然 极大似然(Maximum Likelihood)估计为用于已知模型的参数估计的统计学方法。 比如,我们想了解抛硬币是正面(head)的概率分布θ;那么可以通过最大似然估计方法求得。 ...

机器学习之分类算法之朴素贝叶斯分类

机器学习之分类算法之朴素贝叶斯分类
2018-06-23
机器学习之分类算法之朴素贝叶斯分类 最近自己对机器学习比较感兴趣,做个笔记,还请大牛不喜轻喷,多多指教。 朴素贝叶斯分类基于概率论中的贝叶斯原理: P(A|B) = P(B|A)*P(A)/P(B) 所谓朴素即是特征属性之间 ...

如何解决分类中的样本倾斜问题

如何解决分类中的样本倾斜问题
2018-04-09
如何解决分类中的样本倾斜问题 先来说说样本的偏斜问题,也叫数据集偏斜(unbalanced),它指的是参与分类的两个类别(也可以指多个类别)样本数量差异很大。比如说正类有10,000个样本,而负类只给了10 ...

机器学习中的概率问题

机器学习中的概率问题
2018-03-13
机器学习中的概率问题 机器学习的过程可以理解为计算机通过分析大量的数据获得模型,并通过获得的模型进行预测的过程。机器学习的模型可以有多种表示,例如线性回归模型,SVM模型,决策树模型,贝叶斯模 ...
浅谈利用逻辑回归来解决文本分类时的模型调优
2018-01-18
浅谈利用逻辑回归来解决文本分类时的模型调优 想和数据挖掘沾点边,所以最近在复习一些算法,因为又学了点R,深感这是个统计分析挖掘的利器,所以想用R实现一些挖掘算法。 朴素贝叶斯法大概是最简单的一种挖 ...
从奇异值分解(SVD)看潜在语义索引(LSI)
2017-12-22
从奇异值分解(SVD)看潜在语义索引(LSI) 1. SVD 简介 SVD中文称为“奇异值分解”,是一种矩阵分解方法。其公式如下: 定理:设A为m*n阶复矩阵,则存在m阶矩阵U和n阶矩阵V,使得:       A ...

文本主题模型之潜在语义索引(LSI)

文本主题模型之潜在语义索引(LSI)
2017-12-22
文本主题模型之潜在语义索引(LSI) 在文本挖掘中,主题模型是比较特殊的一块,它的思想不同于我们常用的机器学习算法,因此这里我们需要专门来总结文本主题模型的算法。本文关注于潜在语义索引算法(LSI)的原理。 ...
123456 4/6

OK