热线电话:13121318867

登录
首页精彩阅读不完整的数据质量将毫无意义_数据分析师考试
不完整的数据质量将毫无意义_数据分析师考试
2015-05-24
收藏

不完整的数据质量将毫无意义_数据分析师考试


大数据一定可能会乱,而数据质量对任何分析都非常重要。然而,关键是要记住数据将不可避免地混乱。即,会有很多杂乱,各种异常情况,以及不一致性。而重要的是要把重点放在数据的数量和种类,以及它们可否可修剪并用以做有价值的分析。换句话说,在这些混乱之中要寻找某种信号。在某些情况下,组织可能要解析和清理大量的数据源,而在其他情况下,这些也可能不太重要。可以考虑谷歌趋势分析。

谷歌趋势分析显示人们搜索的最热门事情,如整个2013年在谷歌搜索的最多的事情。这需要大量的存储空间,处理能力以及强大的分析技术以从搜索中筛选并排名。这是使用大数据而忽略GIGO的一个好例子。

从这个观点来看,许多人们会说“哦!这听起来的确是大的改变”是的!正如我的一个同事所说,可以用大数据的名字或动词意义做一个区分。也就是说,作为名词,把大数据仅仅当作需要被存储和安置的“非常多的东西”。作为动词,大数据就意味着动作。这个阵营的人们视大数据为破坏性的力量,是改变他们的操作方式的动力。利用大数据以创造性的方式测试好点子,从而以分析的方式解决业务问题,如进行A/B测试—请参考谷歌测试50色调的蓝色,去寻找人们最愿意点击的Gmail用户,而不是仅凭营销经理的猜测。或者想办法衡量没法衡量的事情,比如公司和大学找更好的方式来实现图像归类的自动化。以新的方式探索新点子—以数据来回答“假如……”的问题。

数据量杂而多的情况下,最好还能快速的分类整合。大数据魔镜是一款可以迅速将大数据整合分析的免费可视化分析工具,可以选择此类工具进行对大量数据提升质量的分析。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询