cda

数字化人才认证

首页 > 行业图谱 >

干货 | 数据分析实战案例——用户行为预测

干货 | 数据分析实战案例——用户行为预测
2021-12-22
CDA数据分析师 出品 作者:CDA教研组 编辑:Mika 案例介绍 背景:以某大型电商平台的用户行为数据为数据集,使用大数据处理技术分析海量数据下的用户行为特征,并通过建立逻辑回归模型、随机森林 ...

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(CDA内容分享)
2021-12-14

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)

2000字详解,当Pandas遇上超大规模的数据集该如何处理呢?(cda干货分享)
2021-12-13
作者:俊欣 来源:关于数据分析与可视化 大家好,又是新的一周。大家一般会用Pandas模块来对数据集进行进一步的分析与挖掘关键信息,但是当我们遇到数据集特别特别大的时候,内存就会爆掉,今天小编就来分享 ...

矩阵分析法,做商业决策必备的经典分析思维

矩阵分析法,做商业决策必备的经典分析思维
2021-11-26
众所周知,无论是一个国家还是一个企业,在制定决策策略的时候,都不会询问每一个人的意见,对于国家而言,通常会收集各行各业代表的意见;对于企业而言,则是会选择一些有代表性的人员来进行意见调研。 同 ...

实用 | 利用 aardio 配合 Python 快速开发桌面应用

实用 | 利用 aardio 配合 Python 快速开发桌面应用
2021-10-18
作者:星安果 1. 前言 我们都知道 Python 可以用来开发桌面应用,一旦功能开发完成,最后打包的可执行文件体积大,并且使用 Python 开发桌面应用周期相对较长 2. Aardio 介绍 它是一款免费的 ...

CDA Level Ⅲ 数据分析认证考试模拟题库

CDA Level Ⅲ 数据分析认证考试模拟题库
2021-10-11
嗨喽,各位同学又到了公布CDA数据分析师认证考试Level Ⅲ的模拟试题时间了,今天给大家带来的是模拟试题(一)中的91-95题。(材料题) 不过,在出题前,要公布上一期Level Ⅲ 中86-90题的答案,大家一起来看! ...

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)

CDA Level Ⅲ 数据分析认证考试模拟题库(第十六期)
2024-08-14
不过,在出题前,要公布上一期Level Ⅲ 中76-80题的答案,大家一起来看! 77、ABD 79、BCD A、方差选择 C、卡方检验 82、对数变换是我们在处理特征工程当中常用的处理方法,以下关于对数变换的描 ...

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史

命运多舛的东京奥运会开幕在即,用可视化带你纵览120年奥运史
2021-07-19
CDA数据分析师 出品 作者:Mika 【导读】 今天带大家用数据可视化解读120 年奥运变迁史。 几经波折,东京奥运会终于即将迎来开幕的时刻,距离7月23日东京奥运会开幕只有不到一周的时间了。 这 ...

快看,教你怎么上班摸鱼

快看,教你怎么上班摸鱼
2021-07-14
来源:数据STUDIO 作者:云朵君 工作中,当你需要对某个文件夹或多个文件夹内的大量类似文件做相同操作(增删改查)时,你还在拼命加班做一个没有感情的工具人嘛?掌握以下几个操作,瞬间完成任务,然后你就 ...

数据挖掘中常用的基本降维思路及方法总结

数据挖掘中常用的基本降维思路及方法总结
2021-06-29
来源:数据STUDIO 作者:云朵君 01、降维的意义 降低无效、错误数据对建模的影响,提高建模的准确性。 少量切具有代表性的数据将大幅 ...

盘点Python加密解密模块hashlib的7种加密算法

盘点Python加密解密模块hashlib的7种加密算法
2021-05-28
来源:Python爬虫与数据挖掘 作者: 黄伟 前言 在程序中我们经常可以看到有很多的加密算法,比如说MD5 sha1等,今天我们就来了解下这下加密算法的吧,在了解之前我们需要知道一个模块嘛就是hashlib,他就 ...

再见云服务器!教你将 Python 脚本快速部署在手机上(详细)

再见云服务器!教你将 Python 脚本快速部署在手机上(详细)
2021-05-19
来源:AirPython 作者:星安果 1. 前言 大家好,我是安果! 最近有读者后台给我留言,说这段时间云服务器涨价了,自己日常就运行一些简单的脚本,因此不太想入坑云服务器,问我能不能提供一个不一 ...

数据分析师知识点汇总(主成分分析)

数据分析师知识点汇总(主成分分析)
2021-02-19
一、具体方法 1.主成分分析的具体方法 主成分分析是一类常用的针对连续变量的降维方法,选取能够最大化解释数据变异的成分,将数据从高维降到低维,同时 保证各个维度之间正交。 对变量的协方差矩阵或相关系 ...

聊聊python 办公自动化之 Word(中)

聊聊python 办公自动化之 Word(中)
2020-11-24
作者:星安果  来源:AirPython(公众号) 上一篇文章,对 Word 写入数据的一些常见操作进行了总结,详情请看聊聊python 办公自动化之 Word(上)。相比写入数据,读取数据同样很实用!本篇文章, ...

数据分析师,这样才能指导运营,而不是被人追着要数!

数据分析师,这样才能指导运营,而不是被人追着要数!
2020-10-30
作者:接地气的陈老师 来源:接地气学堂 数据分析如何助力运营,直接上干货,开整! 问题场景:某电商公司,近期通过数据发现有大量用户出现添加商品至购物车但不付款(简称:加购未购)的情况,运营 ...

6种数据格式对比,用Jupyter+pandas高效数据分析

6种数据格式对比,用Jupyter+pandas高效数据分析
2020-10-27
编译:刘早起(有删改) 来源:towardsdatascience、GitHub等 在使用python进行数据分析时,Jupyter Notebook是一个非常强力的工具,在数据集不是很大的情况下,我们可以使用pandas轻松对txt或csv等纯文 ...

刷爆网络的动态条形图,3行Python代码就能搞定

刷爆网络的动态条形图,3行Python代码就能搞定
2020-10-26
作者:小伍哥 来源:AI入门学习 上次出了一个在网站「Flourish」画动态条形图的文章【动态条形图视频教程】,需要登录网址很多人可能觉得不方便,现在有大佬出了个python包,只需几行代码就能搞定动态条形图 ...

python之shutil模块11个常用函数详解

python之shutil模块11个常用函数详解
2020-09-03
作者:小伍哥  来源:AI入门学习 shutil 是 篇python 中的高级文件操作模块,与os模块形成互补的关系,os主要提供了文件或文件夹的新建、删除、查看等方法,还提供了对文件以及目录的路径操作 ...

深入浅出|深度学习算法之BP神经网络 详细公式推导

深入浅出|深度学习算法之BP神经网络 详细公式推导
2018-08-29
深入浅出|深度学习算法之BP神经网络 详细公式推导 所谓神经网络,目前用得最广泛的一个定义是“的神经网络是由具有适应性简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出 ...
海量数据分析处理方法
2018-08-24
海量数据分析处理方法 一、Bloom filter 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数 ...

OK