cda

数字化人才认证

首页 > 行业图谱 >

如何避免无效的数据分析结果,这六种错误不可忽视

如何避免无效的数据分析结果,这六种错误不可忽视
2021-12-08
导读:在数据清洗过程中,主要处理的是缺失值、异常值和重复值。所谓清洗,是对数据集通过丢弃、填充、替换、去重等操作,达到去除异常、纠正错误、补足缺失的目的。 作者:宋天龙 本文转自:大数据DT( ...

帅到爆炸!使用管道 Pipe 编写 Python 代码竟如此简洁

帅到爆炸!使用管道 Pipe 编写 Python 代码竟如此简洁
2021-11-29
作者:豆豆 来源:Python 技术 众所周知,Pytnon 非常擅长处理数据,尤其是后期数据的清洗工作。今天派森酱就给大家介绍一款处理数据的神器 Pipe。 什么是 Pipe 简言之,Pipe 是 Python 的一个三 ...

4000字归纳总结 Pandas+Sklearn 带你做数据预处理

4000字归纳总结 Pandas+Sklearn 带你做数据预处理
2021-11-24
作者:俊欣 来源:关于数据分析与可视化 今天我们就来讲讲数据预处理过程当中的一些要点与难点。我们大致会提到数据预处理中的 加载数据 处理缺失值如何处理 ...

手把手教你使用scrapy框架来爬取北京新发地价格行情(理论篇)

手把手教你使用scrapy框架来爬取北京新发地价格行情(理论篇)
2021-09-29
来源:Python爬虫与数据挖掘 作者:霖hero 大家好!我是霖hero。上个月的时候,我写了一篇关于IP代理的文章,手把手教你使用XPath爬取免费代理IP,今天在这里分享我的第二篇文章,希望大家可以喜欢。 前 ...

神器 Spider!几分钟入门分布式爬虫

神器 Spider!几分钟入门分布式爬虫
2021-09-27
作者:闲欢 来源:Python 技术 在上一篇文章《神器!五分钟完成大型爬虫项目!》,我们介绍了一个类似于 Scrapy 的开源爬虫框架——feapder,并着重介绍了该框架的一种应用——AirSpider,它是一个 ...

干货 | 如何用SQL做留存率分析

干货 | 如何用SQL做留存率分析
2021-09-26
本文为「心中有数」CDA征文作品 今天,就给大家分享下如何用SQL实现留存率的计算,以及日常工作中如何分析留存率这个指标。 留存顾名思义是指留下来。留存用户是指用户在APP产生行为后,在固定的第N日继续访 ...

数据搬砖,我竟然没动手

数据搬砖,我竟然没动手
2021-09-14
作者:李晓飞 来源:Python 技术 今天我来分享一个迁移过程的幕后小故事,有料,有趣,来听听吧。 并不丝滑 迁移公众号,是一个腾讯提供的业务,就是将原公号主体切换到另一个公号上,然后收回原公号 ...

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为

如何针对企业产品进行有效分析,看大佬用SQL分析淘宝用户行为
2021-09-08
淘宝网,是全球最受欢迎的网购零售平台之一,拥有近5亿的注册用户数,每天有超过6千万的固定访客,同时每天的在线商品数已经超过了8亿件,平均每分钟售出4.8万件商品。 分析目标与思路 何判断高价值用户, ...

企业到底需要啥样的数字化人才?看懂行人如何上岸

企业到底需要啥样的数字化人才?看懂行人如何上岸
2021-08-17
国家全面倡导数字化,显然是预见了经济发展的大趋势。为此,各大企业积极响应国家号召,紧锣密鼓地部署并推进数字化转型。然而,随着时间的推移,各种挑战和瓶颈逐渐暴露出来,越来越多转型的企业陷入四面楚歌、难 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十三期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十三期)
2024-10-05
不过,在出题前,要公布上一期Level Ⅲ 中61-65题的答案,大家一起来看! 62、ABD 64、ABD A.树长得太高容易过拟合 C.可以通过剪枝限制过拟合 67.决策树模型是一种描述对实例进行分类的树形结构 ...
一文搞懂Pandas数据排序
2021-08-13
来源:AI入门学习 作者:小伍哥 数据排序,是使用非常高频的功能,Pandas排序支持做的非常好,主要涉及两个函数,两种数据类型,组合起来四种情况。 Series排序 Series.sort_index ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十期)
2021-08-10
不过,在出题前,要公布上一期Level Ⅲ 中46-50题的答案,大家一起来看! 47、C 49、D A.数据泛化针对的对象是类别型字段 C.用省代替市是一种数据泛化 52、关联规则挖掘的目的是在数据项目中找出 ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第二期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第二期)
2021-07-27
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的6-10题。(单选题) 不过,在出题前,要公布上一期Level Ⅲ 中1-5题的答案,大家一起来看! ...

擅用子查询,让复杂问题简单化

擅用子查询,让复杂问题简单化
2021-07-20
来源:数据STUDIO 作者:云朵君 查询"01"课程比"02"课程成绩高的学生信息及课程分数 分析 第一步:根据需要查询的最终结果确认所需用到的表:"学生信息及课程分数",需要用到学生信息表与成绩表; ...

VLOOKUP很难理解?或许你就差这一个神器

VLOOKUP很难理解?或许你就差这一个神器
2021-07-13
来源:数据STUDIO 作者:云朵君 一说到Excel查找函数,你一定会想到VLOOKUP函数,虽然它是最基础实用的函数,但每次一看就会,一用就忘。接下来给大家分享一个VLOOKUP函数动态图解 ,记得收藏它哦,在 ...

对比学习,用Excel和Python绘制子弹图

对比学习,用Excel和Python绘制子弹图
2021-07-09

一个企业级数据挖掘实战项目,教育数据挖掘

一个企业级数据挖掘实战项目,教育数据挖掘
2021-07-06
来源:数据STUDIO 作者:云朵君 导读:大家好,我是云朵君!自从分享了一篇能够写在简历里的企业级数据挖掘实战项目,深受读者朋友们青睐,许多读者私信云朵君,希望多一些类似的数据挖掘实际案例。这就来了 ...

CDA LEVEL II 数据分析认证考试模拟题库(四十五)

CDA LEVEL II 数据分析认证考试模拟题库(四十五)
2024-08-14
不过,在出题前,要公布上一期LEVEL II中81-85题的答案,大家一起来看! 82、D 84、D A.数据仓库开发要从数据出发 C.数据仓库的开发是一个不断循环的过程,是启发式的开发 87、约束条件是在表和字 ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

小技巧 | 聊聊 Python 中数据库反向生成 Model 最优方案

小技巧 | 聊聊 Python 中数据库反向生成 Model 最优方案
2021-06-16
来源:AirPython 作者:星安果 1. 前言 大家好,我是安果! 熟悉 Django 的朋友应该知道,我们可以通过「 inspectdb 」命令将数据库表反向生成 Model 并写入到文件中 ...

OK