cda

数字化人才认证

首页 > 行业图谱 >

理解关联规则算法

理解关联规则算法
2021-03-15
作者:小伍哥 一、基础概念 关联规则挖掘可以让我们从数据集中发现项与项(item 与 item)之间的关系,它在我们的生活中有很多应用场景,“购物篮分析”就是一个常见的场景,这个场景可以从消费者交易记录 ...

CDA LEVEL 1 考试,知识点《机器学习基本概念》

CDA LEVEL 1 考试,知识点《机器学习基本概念》
2024-10-04
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。(—— Arthur Samuel,1959) 二、模型构建流程 既然我们机器学习是借助数学模型理解数学,那么最重要的原材料就是数据了。获取数据 ...

一个Python爬虫工程师的修养

一个Python爬虫工程师的修养
2021-02-26
来源:麦叔编程 作者:麦叔 练武不练功,到老一场空 练武的人都知道:练武不练功,到老一场空! 说的是只练花架子,不练习内功,最终也都是一个菜鸟级武师。 学习编程何尝不是!我时常见到已经 ...

CDA LEVEL I 数据分析认证考试模拟题库(二十六)

CDA LEVEL I 数据分析认证考试模拟题库(二十六)
2021-02-25
不过,在出题前,要公布上一期41-45题的答案,大家一起来看! 42、C 44、A 你答对了吗? 51.某产品在一年内卖出300件,退回50件,请问销量是多少 B.250件 D.无法统计 A.销量 C.城市 53 ...

关于均数和标准差相关计算的梳理

关于均数和标准差相关计算的梳理
2021-01-28
作者:麦叔 说的是只练花架子,不练习内功,最终也都是一个菜鸟级武师。 学习编程何尝不是!我时常见到已经学习相当一段时间的程序员,连稍微深点的基本知识都没有掌握。可叹,可悲啊!根子不牢,注定走 ...

再见2020,程序员如何走向鄙视链的顶端?

再见2020,程序员如何走向鄙视链的顶端?
2021-01-19
来源:麦叔编程 作者:麦叔 1.程序员鄙视链的顶端 在程序员的世界里,有一个鄙视链。鄙视链的顶端差不多是算法工程师。 一等码农搞算法,吃香喝辣调调参; 二等码农搞架构,高并低延能吹牛; ...

干货 | 你想知道的数据仓库知识,这里都有!

干货 | 你想知道的数据仓库知识,这里都有!
2020-11-19
数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrate)、稳定的(Non-Volatile)、反映历史变化的(Time Variant)数据集合,用于支持管理决 ...

用Excel竟然不知道瀑布图?财务分析必备图

用Excel竟然不知道瀑布图?财务分析必备图
2020-10-30
作者:小伍哥 来源:AI入门学习 一、图形介绍 瀑布图是由麦肯锡顾问公司所独创的图表类型,因为形似瀑布流水而称之为瀑布图( Waterfall Plot)。此种图表采用绝对值与相对值结合的方式,适用于表达数 ...

6种数据格式对比,用Jupyter+pandas高效数据分析

6种数据格式对比,用Jupyter+pandas高效数据分析
2020-10-27
编译:刘早起(有删改) 来源:towardsdatascience、GitHub等 在使用python进行数据分析时,Jupyter Notebook是一个非常强力的工具,在数据集不是很大的情况下,我们可以使用pandas轻松对txt或csv等纯文 ...

为什么说python内置函数并不是万能的?

为什么说python内置函数并不是万能的?
2020-10-20
作者:豌豆花下猫 来源:Python猫 之前我们对比了两种创建列表的方法,即字面量用法 [] 与内置类型用法 list(),进而分析出它们在运行速度上的差异。 在分析为什么 list() 会更慢的时候,文中说到它 ...

R语言描述统计第一弹 | 计算泰坦尼克号不同舱位的存活率

R语言描述统计第一弹 | 计算泰坦尼克号不同舱位的存活率
2020-09-28
作者:丁点helper 来源:丁点帮你 今天开始学习在R语言中做描述性统计。为了便于大家边学边练,可以下载这个数据: 文件名:titanic.csv 链接:https://pan.baidu.com/s/1Pj0EsaBZdnw6mHPpeVd9Aw ...

python进阶,详解collections工具库!

python进阶,详解collections工具库!
2020-09-04
作者:梁唐 来源:早起Python 大家好,今天为大家介绍python当中一个很好用也是很基础的工具库,叫做collections。collection在英文当中有容器的意思,所以顾名思义,这是一个容器的集合。这个库当中的 ...

学习numpy,看这篇文章就够啦

学习numpy,看这篇文章就够啦
2020-09-02
【导语】在数据分析当中,python用到最多的第三方库就是numpy,今天我们就来讲讲! 作者:王皓 来源:大数据DT(ID:hzdashuju) 01 ndarray创建与索引 在学习Numpy之前我们需要了解一个概念:数 ...
【上海思勰投资管理有限公司】招聘数据分析师
2018-08-27
【上海思勰投资管理有限公司】招聘数据分析师    思勰投资是一家专注于投资二级市场高流动性资产(股票、期货)的量化对冲基金公司,自主开发了先进的程序化自动交易系统、风控系统。主要采用量化投资策略 ...
【北京慧都时代科技有限公司】招聘数据分析师
2018-08-24
【北京慧都时代科技有限公司】招聘数据分析师 慧都时代是一家专业从事服务与销售相关业务的顾问型应用服务提供商。经过无数慧都人的辛勤耕耘和不懈追求,慧都在不断帮助客户创造价值的同时,也在实践过程中潜心研究 ...

大数据赋能产业发展,谋定而后动为不二法门

大数据赋能产业发展,谋定而后动为不二法门
2018-08-24
大数据赋能产业发展,谋定而后动为不二法门 最近几年,资本一直追着大数据跑,大数据也一直在积极赋能众多产业,包括金融、医疗、教育等,有数据显示,到2020年,中国大数据产业规模或达13626亿元的高点。毫无 ...
海量数据分析处理方法
2018-08-24
海量数据分析处理方法 一、Bloom filter 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数 ...
用Python创建声明性迷你语言的教程
2018-08-19
用Python创建声明性迷你语言的教程 大多数程序员考虑编程时,他们都要设想用于编写应用程序的 命令式样式和技术。最受欢迎的通用编程语言(包括 Python 和其它面向对象的语言)在样式上绝大多数都是命令式的。 ...
数据仓库必须保障可访问性和可用性
2018-08-18
数据仓库必须保障可访问性和可用性 大多数人都理解企业数据破坏造成的负面效果。在解决数据仓库的安全性方面,有两个特别重要的问题。第一是,数据仓库必须能够控制数据访问权限(数据权利)。第二是,提供业务 ...
人工神经网络概念梳理与实例演示
2018-08-17
人工神经网络概念梳理与实例演示 神经网络是一种模仿生物神经元的机器学习模型,数据从输入层进入并流经激活阈值的多个节点。 递归性神经网络一种能够对之前输入数据进行内部存储记忆的神经网络,所以他们能 ...

OK