热线电话:13121318867

登录
首页职业发展大数据分析的一把利剑_R语言_数据分析
大数据分析的一把利剑_R语言_数据分析
2014-11-04
收藏
大数据分析的一把利剑_R语言

R语言,我把它称之为大数据分析的一把利剑。

为什么这么说呢?

      先让我们看一下,什么是大数据分析?所谓大数据分析,就是以商业目的为驱动,所开展的获取数据、处理数据、分析数据、展示数据和撰写数据结构报告的一系列科学过程。而R语言都有相应的方法可以较好地处理和完成数据分析所涉及到的内容。

      接下来,让我们想想这些问题。

      R语言是什么?为什么要使用R语言?怎么学习R语言

      第一个问题,R是一种免费的、开源软件环境与平台,其初衷是为了统计计算和画图。但是,R语言现在能够做的事情已经远远地超出了其初衷,可以在诸多领域进行应用,比方说,数据挖掘机器学习、社交网络、生物信息、金融数据分析等。

      第二个问题:是否要使用这个工具,首先得看这个工具能否解决问题,也就是对于数据分析 各个环节中的问题,R语言都能够很好地胜任;其次,考虑这个工具的成本,R语言是免费开源的,R语言易学好用,并且有着非常多的资源和活跃的社区;最后, 思考工具的性能,R语言在不断发展的同时,性能得到进一步优化和提升,并且可以和其他编程语言进行混合使用。

      第三个问题:我的建议是“三多”精神,一要多学习,学习是永无止境的。学习R的书籍、学习R的资料,学习R的源代码、学习R的案例等等;二要多实践,实践出真知。结合自己的行业背景,针对自己的问题域,积极地尝试着使用R语言来分析和解答,通过在不断实践中认识和应用R;三要多分享,我为人人,人人为我。拥抱一颗分享的心,给他人便利的时候也是给自己便利。

    最近,Claranet针对企业的云迁移方式进行了一项调查。调查结果表明,超过四分之一的受访者视ROI为决策因素之一,而79%的受访者认为 ROI计算并不能真实反映业务优势。虽然该调查主要针对云迁移,但是由此可以合理推测,大数据迁移的情形也不会有太大差别。这二者均代表着一次未来的技术 飞跃。

误解5:结果不可保证

    大数据是个未知数。您正在做的就是分析无法估量、难以确定的数字。从本质上来说,大数据是不容易理解或者是抽象的。否则,您也就无需大数据技术了。 因此,企业必须认识到他们无法保证结果的准确性。企业试图获得结果和找到假设的支持数据是徒劳无益的。在上述示例中,航空公司可能希望飞机每50万飞行小 时维护一次,但是如果飞机每20万飞行小时就从空中坠落的话,航空公司的设想就将毫无意义。

    如果说人们对大数据存在一些误解,那么,有关大数据的一些关键事实则需要不太看好大数据的企业去认真理解。

关键事实

关键事实1:需要不同技能
    多数观察家都认同数据科学家短缺这一点。麦肯锡公司预测,到2019年,全球将缺少高达19万可处理大数据的科学家。原因不难发现。处理大数据项目需要完全不同于处理现有数据仓库
施的技能。而且它还不仅仅限于数据处理,还要求能够将数据转换为可执行的建议。

    “Hadoop 中有一个称为Map Reduce 的工具。它需要Java 编程技能,而这并不是当今很多数据分析师具有的技能。”Priestley举例说到。而事情还不止如此。处理大数据的理想人员还需要了解业务流程、Java和统计知识,甚至还可能需要一些SQL技能。这是个大问题,因此很多人也认为数据科学家的短缺将成为大数据技术采用的一个重要阻碍。

关键事实2:明确您的目标

    虽然企业不应当试图探究确定的结果,但是他们应当明确企业目标,一个需要实现的目标。例
如,大数据可提高绩效的途径之一是收集更加准确的信息,包括个人数据、客户行为和购买决
策等。

    麦肯锡公司发现,数字之大令人震惊。这家企业咨询公司声称,如果美国医疗产业采用大数据
,全美医疗费用将削减8%。另外,麦肯锡公司提到,通过减少诈骗诉讼和增加税收,欧洲公共
部门在运行效率方面可节省一千亿欧元。

关键事实3:人是推动因素

    大数据项目需要有人推动。技术并非关键问题。这不是指那些具有上述数据科学家技能的一些人,而是指那些能提出明确目标与需求,并能执行决策的一些人。

    这些人并不需要特殊的管理技能。这些责任可能落在首席财务官(CFO)、首席信息(CIO)\甚至首席执行官(CEO)的肩上,但最终,需要有一个人担 负此重任。正如Priestley所指出的:“大数据不仅仅是技术挑战,它还是业务挑战。企业需要了解这一点。对此,使用模式很重要。而在此方面,企业可 以有很多种模式,并以不同方式进行建模。”

关键事实4:不仅仅是数据

    大数据分析有三大要素:数据本身,数据分析,以及结果的呈现。拥有数据本身并没有实际意义。数据本身就已存在。重要的是如何处理、分析数据并呈现重 要信息,以将数据转变为重要价值。开展大数据项目需要周密规划。最好是从小规模起步,先实施单个项目,然后逐步扩展规模。数据采集之后需要进行详细的结果 分析。

关键事实5:大数据涉及所有人

    很多关于大数据的讨论都聚焦在大型组织上,对于这些庞大的官僚机构来说,令人窒息的海量数据已经制约了组织的有效运行。很多率先采用大数据技术的组织都属于这一范畴,不过它们并不是唯一的受益者。

    各类企业都希望获得评估隐藏数据并归纳模式的技能。有些小型企业需要处理大量工业数据。例如,FormulaOne设计公司的规模不大,但是管理的数据量十分庞大,因此即使是很小的企业也可以通过在日常工作中使用大数据而获益。

    这些公司可能希望超越Excel进行客户分析,寻找客户购买模式。例如,如果您的饭店菜单上曾经有一道特色鱼,但后来取消了。那么当这道菜再次出现 在菜单上可供顾客点用的时候,您就可以使用电子邮件通知之前曾经点过这道菜的所有顾客。或者,如果您是一个酒商,您的库存里有某种葡萄酒正在酿造期,当它 们即将出库时,您可以提醒这种酒的爱好者。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询