热线电话:13121318867

登录
首页精彩阅读为什么数据分析需要会编程语言
为什么数据分析需要会编程语言
2016-09-03
收藏

为什么数据分析需要会编程语言

对于数据分析,如果只是给定准备好的数据集,做简单的描述性统计、简单绘图,那么不太需要掌握任何编程语言。问题是,现实中收集到的数据是多样的、基础的,很少能直接满足模型对数据规格的要求以及模型成立的假设,那么就需要在分析前变换、合并、分类、整理数据,此时可能需要从数据库用SQL跨表查询,数据整理好后利用模型做统计推断或者机器学习等等,形成样本内或样本外的预测,可能还要用可视化的方式呈现结果。

这整个过程中,各个环节都可能涉及到大量的参数需要调节,各种细节都需要控制,还有很多主观的选择。这样的过程如果用软件窗口去实现,窗口中的选项将非常复杂,整个过程需要在多个数据及上重复执行也很麻烦。用编程语言可以精确地描述整个过程,控制大部分细节,并且可以批量的重复实现。

数据分析和探索的过程是一个不断尝试想法、验证假设的过程,这就需要临时产生、执行新的代码,脚本语言如Python和R天生就是对这样的互动操作有很好的支持。如果这种过程都用C++或Java这些需要编译(二进制或bytecode)——执行的语言来完成,那么过程将比较痛苦。

因此对于专业的数据分析,掌握数据库的应用、数据分析的编程语言是很有必要的。题目中提到的编程语言一些是通用编程语言(如C++、Java)可以广泛地用于开发各种项目,而R作为脚本语言凭借其良好的互动性和丰富的扩展包资源可以方便地解决大部分数据处理、变换、统计分析、可视化的问题,并可以重现所有的细节。数据分析者最好通用语言和脚本语言各至少掌握一种,这样在处理许多项目时就能合理地发挥不同语言的优势,提高整体的生产力。对于数据分析,如果只是给定准备好的数据集,做简单的描述性统计、简单绘图,那么不太需要掌握任何编程语言。问题是,现实中收集到的数据是多样的、基础的,很少能直接满足模型对数据规格的要求以及模型成立的假设,那么就需要在分析前变换、合并、分类、整理数据,此时可能需要从数据库用SQL跨表查询,数据整理好后利用模型做统计推断或者机器学习等等,形成样本内或样本外的预测,可能还要用可视化的方式呈现结果。

这整个过程中,各个环节都可能涉及到大量的参数需要调节,各种细节都需要控制,还有很多主观的选择。这样的过程如果用软件窗口去实现,窗口中的选项将非常复杂,整个过程需要在多个数据及上重复执行也很麻烦。用编程语言可以精确地描述整个过程,控制大部分细节,并且可以批量的重复实现。

数据分析和探索的过程是一个不断尝试想法、验证假设的过程,这就需要临时产生、执行新的代码,脚本语言如Python和R天生就是对这样的互动操作有很好的支持。如果这种过程都用C++或Java这些需要编译(二进制或bytecode)——执行的语言来完成,那么过程将比较痛苦。

因此对于专业的数据分析,掌握数据库的应用、数据分析的编程语言是很有必要的。题目中提到的编程语言一些是通用编程语言(如C++、Java)可以广泛地用于开发各种项目,而R作为脚本语言凭借其良好的互动性和丰富的扩展包资源可以方便地解决大部分数据处理、变换、统计分析、可视化的问题,并可以重现所有的细节。数据分析者最好通用语言和脚本语言各至少掌握一种,这样在处理许多项目时就能合理地发挥不同语言的优势,提高整体的生产力。


数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询