cda

数字化人才认证

首页 > 行业图谱 >

停止学习数据科学寻找目的,找到目的学习数据科学
2022-02-21
作者布兰登·科斯利,FastDataScience.ai 数据科学家需求不足,没有两种方法。工作岗位嗯,有很多空缺,这个行业似乎只是在这个后疫情时代的数字世界里才有所增长。因此,数据科学专业的学生也是世界劳动力 ...
如何回答数据科学编码面试问题
2022-02-18
你应该如何回答数据科学编码面试问题,这是没有秘诀的。没有一种方法总是有效的。但是,在大多数情况下,有一些指导原则将帮助您更好地回答编码问题。 这些指导方针是根据参加面试和回答编码问题的经验形成 ...
数据网及其分布式数据架构
2022-02-16
企业要想更快地做出反应并提供一流的客户体验,就必须对数据管理进行全面的改造。到目前为止,技术已经解决了存储和处理大数据的问题。它也已经达到了将大数据用于深度分析的能力。当我们在做这件事的时候,预计到 ...

干货 | 如何利用Python处理JSON格式的数据,建议收藏

干货 | 如何利用Python处理JSON格式的数据,建议收藏
2022-02-11
来源: 关于数据分析与可视化 什么是JSON JSON模块的使用方法 JSON(JavaScript Object Notation, JS对象简谱)是一种轻量级的数据交换格式,通常是以键值对的方式呈现,其简洁和清晰的层次结构 ...

数据质量类岗位每天需要做什么?通过一个案例了解下

数据质量类岗位每天需要做什么?通过一个案例了解下
2022-01-21
CDA数据分析师 出品 编辑:JYD 大家好,我是曹鑫老师,今天要给大家分享的是数据质量类岗位。 下面我们截取一小段数据演示一个实际案例,帮您更好的了解这类岗位。 例如:某车企在全国各地有不同 ...

22个案例详解Pandas数据分析/预处理时的实用技巧,超简单(CDA内容分享)

22个案例详解Pandas数据分析/预处理时的实用技巧,超简单(CDA内容分享)
2022-01-12
来源:关于数据分析与可视化 Pandas计算交叉列表 Pandas将字符串与数值转化成时间类型 Pandas将字符串转化成数值类型 首先我们来讲一下Pandas模块当中的crosstab()函数,它的作用主要是进 ...

全文4000字、20个案例详解Pandas当中的数据统计分析与排序(CDA干货内容分享)

全文4000字、20个案例详解Pandas当中的数据统计分析与排序(CDA干货内容分享)
2022-01-06
来源:关于数据分析与可视化 今天小编来给大家讲一下Pandas模块当中的数据统计与排序,说到具体的就是value_counts()方法以及sort_values()方法。 导入模块并且读取数据库 output 常规的用法 ...

全文2500字,详解Pandas与Lambda结合进行高效数据分析

全文2500字,详解Pandas与Lambda结合进行高效数据分析
2021-12-22
来源:关于数据分析与可视化 这篇文章小编来讲讲lambda方法以及它在pandas模块当中的运用,熟练掌握可以极大地提高数据分析与挖掘的效率 我们第一步需要导入模块以及数据集 import pandas as pd df = pd ...

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏

干货分享 | 推荐一个更高效的数据清洗方法,建议收藏
2021-12-20
来源:关于数据分析与可视化 01、导入库和读取数据 我们先来大致地看一下数据集中各个特征值的情况,通过info()这个方法 df.info() 02、去除掉缺失值和重复值 要是数据集中存在大量的缺失值, ...

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)
2021-12-14

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)
2021-12-13
作者:俊欣 来源:关于数据分析与可视化 大家好,又是新的一周。大家一般会用Pandas模块来对数据集进行进一步的分析与挖掘关键信息,但是当我们遇到数据集特别特别大的时候,内存就会爆掉,今天小编就来分享 ...

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位

用Python抓取2500份数据类岗位需求,终于发现了未来最吃香岗位
2021-11-30
来源:关于数据分析与可视化 数据抓取的流程与步骤 数据清洗的流程与步骤 可视化的结果与分析 我们用Python当中的requests模块来发送与接收请求,然后用BeautifulSoup模块也解析返回 ...

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能

Pandas/Sklearn进行机器学习之特征筛选,有效提升模型性能
2021-11-22
作者:俊欣 来源:关于数据分析与可视化 今天小编来说说如何通过pandas以及sklearn这两个模块来对数据集进行特征筛选,毕竟有时候我们拿到手的数据集是非常庞大的,有着非常多的特征,减少这些特征 ...

前瞻:数据科学中的探索性数据分析(DEA)

前瞻:数据科学中的探索性数据分析(DEA)
2021-11-16
CDA数据分析师 出品 作者: tukey 数据科学爱好者知道,在将原始数据输入到机器学习模型之前,需要对其进行大量数据预处理。为此,需要遵循一系列标准来准备数据,具体取决于手头问题的类型(回归或分类 ...

手把手教你用 pandas 分析可视化东京奥运会数据

手把手教你用 pandas 分析可视化东京奥运会数据
2021-09-26
作者:刘早起 数据读取 注意到上面的 df1 列名并没有完整,所以可以使用 rename 函数修改指定列的名称 df1.rename(columns={'Unnamed: 2':'金牌数', 'Unnamed: 3':' ...

机器学习如何应用于商业场景?三个真实的商业项目

机器学习如何应用于商业场景?三个真实的商业项目
2021-09-16
在国富如荷这些年的教学过程中,很多同学问到了一个问题: 在现实的商业世界中如何应用机器学习? 也就是说,虽然现在我们一直被各种算法文章和教程轰炸,但是关于企业中一个机器学习项目的“上下文”却 ...

我,一名国企数据人,决定在35岁开启自己的转型之路

我,一名国企数据人,决定在35岁开启自己的转型之路
2021-12-13
大家好,2017年我有幸成为CDA持证人,就此开启了自己数据人转型之路,一路学思维、学技术,并成为了我们公司数字化转型的推行负责人,以下是这几年工作中的一些思考。供同行参考,指正! 思考一:企业为什么要 ...
Python字典操作零基础学习,一步到位
2021-09-08
作者:阳哥 字典(dict)是 python 中的基础数据类型之一,字典的设计并不复杂,我们经常会用到这种数据类型。 学习任何一种编程语言,基础数据类型都是必备的底层基础,今天,我们来学习下 Python 中字典的 ...

OK