cda

数字化人才认证

首页 > 行业图谱 >

程序员之数据分析Python技术栈
2017-03-07
程序员之数据分析Python技术栈 Python是一种非常流行的脚本语言,其还提供了一个科学技术栈,可以进行快捷方便的数据分析,本系列文章将聚焦在如何使用基于Python的技术栈来构建数据分析的工具集合。工欲善其事 ...
一个大数据首席科学家眼中的大数据产业2016年终总结
2017-02-19
一个大数据首席科学家眼中的大数据产业2016年终总结 大数据产业发展了两年后,从探索阶段进入了应用阶段。数据被定义成重要的资源,正在得到企业的重视,在经营过程中发挥着重要的作用。企业看到了数据价 ...
大数据技能知多少
2016-10-20
大数据技能知多少 说起“大数据”一词,也是真正被吵够了。做个简单的统计也叫大数据,做个表格、画个图形出来,就叫大数据了。言谈间凡是不和“大数据”沾边,就感觉已经落伍了。其实,很多人除了知道简单的统 ...

如何用Python高效地学习数据结构

如何用Python高效地学习数据结构
2016-10-10
如何用Python高效地学习数据结构 今天的每日一答,我们来看看如何高效地学习一门语言的数据结构,今天我们先看Python篇。 所谓数据结构,是指相互之间存在一种或多种特定关系的数据类型的集合。 Pyt ...
11个方法教你如何提升R语言代码运算效率
2016-10-09
11个方法教你如何提升R语言代码运算效率 众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文 ...
建立数据场的七大技能
2016-03-29
建立数据场的七大技能 成为数据极客,建立自己的数据场需要哪些技能呢?遇到普通的数据,通过SQL做分析。如果数据量比较大,可以使用Hadoop等大数据框架处理。在深入挖掘上,可用Python或者R语言进行编程。 0 ...

大数据技术人员工具包最全集合

大数据技术人员工具包最全集合
2016-03-15
大数据技术人员工具包最全集合 数据科学融合了多门学科并且建立在这些学科的理论和技术之上,包括数学、概率模型、统计学、机器学习、数据仓库、可视化等。在实际应用中,数据科学包括数据的收集、清洗、分析、 ...

数据科学家和大数据技术人员工具包汇总

数据科学家和大数据技术人员工具包汇总
2016-03-14
本文简介:数据科学家的常用工具与基本思路,数据分析师和数据科学家使用的工具综合概述,包括开源的技术平台相关工具、挖掘分析处理工具、其它常见工具等几百种,几十个大类,部分网址。为数据科学教育和知识分享 ...

4位专家解读2015大数据技术进展

4位专家解读2015大数据技术进展
2016-01-13
2015年,整个IT技术领域发生了许多深刻而又复杂的变化。本文是大数据解读篇,在这篇文章里我们将回顾2015展望2016,看看过去的一年里广受关注的技术有哪些进展,了解下数据科学家这个职业的火热。 在关键技术进 ...

如何用R绘制地图

如何用R绘制地图
2016-01-10
如何用R绘制地图 本文主要包含三种绘制地图的方法:绘制基础地图、基于空间数据格式(shapefile)绘制地图以及如何调用百度地图和谷歌地图的数据来绘制地图。 基础地图 方法 从map()包里获取地图数据, ...

numpy学得还不错?来试试这20题!(上)

numpy学得还不错?来试试这20题!(上)
2020-08-27
作者:刘早起 来源:早起Python 大家好,又到了numpy进阶修炼专题。numpy大家应该不陌生了,看了太多的原理讲解之后,用刷题来学习是最有效的方法,本文将带来20个NumPy经典问题,附赠20段实用代码 ...

员工一言不合就离职怎么破?我有python员工流失预警模型

员工一言不合就离职怎么破?我有python员工流失预警模型
2020-08-24
CDA数据分析师 出品 作者:真达、Mika 数据:真达 后期:泽龙 【导读】 今天教大家如何用Python写一个员工流失预测模型。Show me data,用数据说话。我们聊一聊员工离职 ...

pandas的merge操作,像数据库一样尽情join

pandas的merge操作,像数据库一样尽情join
2020-08-18
作者:梁唐 来源:早起Python 今天是我们一起来聊聊pandas中dataframe的合并。 常见的数据合并操作主要有两种,第一种是我们新生成了新的特征,想要把它和旧的特征合并在一起。第二种是我们新获取了 ...

sparkSQL是什么,如何理解?

sparkSQL是什么,如何理解?
2020-08-11
一、sparkSQL简介 1.sparkSQL定义 sparkSQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。 2.sparkSQL来源 要想了解sparkSQL来源, ...

手把手教你如何使用seaborn绘图--数据集分布可视化

手把手教你如何使用seaborn绘图--数据集分布可视化
2020-08-10
seaborn是一款基于matplotlib的图形可视化python库,它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,它最大 ...

帝都房价回调?带你用python了解北京二手房市场现状

帝都房价回调?带你用python了解北京二手房市场现状
2020-08-10
CDA数据分析师 出品 作者:Mika 数据:真达 后期:泽龙 【导读】 今天让我们来聊一聊北京的二手房市场现状。 Show me data,用数据说话 今天我们聊 ...

最详细的matplotlib绘图教程就在这里了!

最详细的matplotlib绘图教程就在这里了!
2020-08-07
matplotlib是我们经常会用到的一款python绘图库,操作简单,几行代码就能很轻松地画一些或简单或复杂地图形,线图、直方图、功率谱、条形图、错误图、散点图以及费笛卡尔坐标图等都不在话下。今天小编就具体给大家 ...

20个能够有效提高 pandas数据分析效率的常用函数,附带解释和例子

20个能够有效提高 pandas数据分析效率的常用函数,附带解释和例子
2020-08-07
pandas 是为了解决数据分析任务而创建的一种工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法,它是使Python成为强大而高效的数据分析环境的重要因素之一。今天小编就给大家分享一篇关于常见pandas ...

可视化工具不知道怎么选?深度评测5大python数据可视化工具

可视化工具不知道怎么选?深度评测5大python数据可视化工具
2020-07-29
对于python,平常工作中大家最经常用到的就是它的可视化功能了。python有许多功能强大的可视化库,例如Matplotlib、Pyecharts、Seaborn、Plotly、Bokeh,大家一定不陌生,但是对于这五种可视化库的区别,以及什么 ...

火遍全网的自热火锅哪款最好吃?我们用python告诉你!

火遍全网的自热火锅哪款最好吃?我们用python告诉你!
2020-07-29
   CDA数据分析师 出品   作者:Mika 数据:真达   后期:泽龙 【导读】 随着自热食品越来越备受消费者的追捧,各种自热小火锅、自热米饭也成了妥妥的 ...

OK