从“大数据”到“智能数据” _数据分析师
大部分专家都相信可以从巨量的数据中找到宝石和金子。英国牛津大学曾对全球各行业工作者做过一份调查问卷,2/3受访者认为,使用数据和分析软件可以使他们保持竞争优势。问题是,这些金矿挖掘者今天如何从如此巨大的数据山里挖到金子?
从3V到4V
等着要发掘的金子,指的是用于记录、存储和分析大量的数据,以及以合适的形式显示该结果的大数据 新技术。现在最被人们广泛讨论的话题是用户购物、搜索或网购的数据,或利用全球金融和通信网络而产生的数据。还有银行、电信和保险业通过建立使用者信息与 交易记录的分析模型,来增加利润和降低风险等等。大数据的时代,使我们能够探索人类的行为,探索人类本身的奥秘,这在以前在很大程度上是不可能的。我们经 常使用的工具和终端,帮助我们获得和体验这方面的感受。
由于都想成为掘金者,从大数据挖掘价值,目前具有深入的分析、数学、统计、规划技能的数据分析师正炙手可热,已没有足够多的人才可满足需求。美 国大型银行和联邦机构正在越来越多地聘请首席数据官(CDO)和数据分析师,以促进对于整个组织机构中的所有功能数据的收集、分析、分发和应用的战略 思考。
大数据有所谓的3V特征:即大量化(Volume)、多样化(Variety)和快速化(Velocity)。然而,光是大量的数据采 集是不够的,这些数据本身还需要有较高价值,即增加第四个V:Value(价值),成为4V。而经过大数据技术的处理(数据采集、数据分析、数据处 理、数据显示等)之后更会产生较高的价值。
用智能数据建立智能系统
啤酒+尿布是值得挖掘的数据;而从工业设施、建筑物、能源系统和医院产生的比特和字节,含金量更高,更值得挖掘,因为它们可以用于建立起智能系统,这些比特和字节就是智能数据。我们来谈谈智能数据如何建立起一个智能系统。
终端通过连接、把它们管道化,对人们带来了极大的便利,大大提高了生产率。但是这些还不够,还需要体现智能化,实现智能系统。现在我们经常在提 到智能手机、智能电表、智能电网、智能家居、智慧城市等等,都是希望人们使用的设备和终端能够根据人们的需要自动编程,实现自动化,尽量避免人工介入。
这样一种智能化,需要具备两个条件:首先是管道化(互联网思维的核心是管道化思维),就是把所有的终端或节点全部连接起来,互相之间能够有沟通(即发生交互作用);另一个是各个终端本身具备一个小电脑,即带有处理器芯片,可以通过软件处理和产生智能数据。有了这两个基本条件,就可以体现出一定程度的智能。
以抽水马桶为例。抽水马桶是已经管道化的马桶,再加上上述第二个条件,就可以变成一个智能马桶。具体可以这样来实施:在马桶里装有一片微处理器 芯片和一片生化芯片(Lab-on-Chip,LOC),对人们的排泄物自动提取和分析,然后把分析结果通过管道,如WiFi送到医生那里,医生把每天的 分析数据与事先存储的数据进行对比,给这位坐过这个马桶的人发出营养指标提醒和生理指标提醒,如果必要的话则写处方,提醒他服用药物或到医院进一步检查。 另一方面,根据这个马桶的软件分析结果,会得出缺少哪种营养的具体数据,然后通过无线通信的管道传送到超市,超市会根据这些数据选出合适的食品通过快递服 务送达家中。
抽水马桶还可以包含其他各种传感器进行管道连接,如每次使用自动记录用水量;如有漏水,自动通知维修人员或物业管理处派人来检修;如有堵塞,就会自动通知管道维修人员来疏通;如水漕不进水,也会自动通知相关人员来处理等等,这些都会产生一定的数据量。
我们必须了解这些智能数据的量,以便正确地评估它;我们必须知道各种器件和设施是如何工作的,了解我们需要哪些传感器和测量技术来获得真正重要的智能数据。决定性的因素不一定是数据量大,而是有价值的内容。
这样的智能数据可以体现在各个领域。如对于一个大型燃气轮机,有几百个传感器每秒钟在测量温度、压力、流量、气体组成。如果人们很了解设施的物理特 性,因此知道如何正确地分析这些数据,就可以给发电厂非常有用的建议,来提高电力的使用效率并减少污染。同样的措施可以用于风力发电、建筑物、钢铁厂和整 个城市。所有这些领域里,必须不仅收集数据,而且还理解数据。处理的数据是智能数据,得出的结论用于将企业或城市变得更智能。
适合于评估这些智能数据的算法还需要开发。这些算法可以帮助人们更好地节省能源、更好地有利于环境、更多地节省成本,以及使设备运行得更可靠。
在未来,智能数据可以帮助我们了解一个智能系统每时每刻发生了什么,更能够告诉我们为什么会发生。甚至还可以告诉我们接下来会发生什么,以及我们应 该如何应对。智能数据将改变企业的商业模式。例如一家跨国公司可以设立一个全球维修中心,全球各个分部的工厂都设有大量传感器并与网络相连,只需要在这个 中心分析大量的远程智能数据,就可以进行远程诊断和处理,而不需要技术人员到现场。这样的商业模式,对于火车、船舶、发电厂、医疗器械等等都是极其有用 的。例如,从一辆火车的运行中得到的测量数据,可以帮助火车驾驶者运行的更平稳、更节能。节省下来的资金,则可以在用户和智能数据提供者两者分成。这是双 赢的局面,也是如何从数据山中掘金的一个很好例子。
大数据如何成为智能数据
数据只是大,并没有太大意义,关键是如何最佳地挖掘高价值的数据、使用这些数据,使这些数据成为智能数据。这有几个方法:先评估数据的价值 和将会产生的价值;把数据和智能化相关联;把数据变成具有上下文意义的灵活的数据结构;随着时间的推移,根据这些收集了的大量数据,展现一幅绚丽多彩 的智能数据图。到最后,也不会再去思考大数据与智能数据有何区别,因为所有的数据都已经成为智能数据。
西方2000多年前就已发明的管道化的马桶开了物联网的先河。基于互联网的物联网(IoT)的到来,预示了新的创新设备、新的网络形态、新的商 业模式的不断涌现,也预示着智能数据的成千上百倍增长,智能化将体现在各种应用中。如按照今天所理解的大数据概念,是不充分的,大数据必须从3V演变为 4V,大数据必须演变成智能数据,整个家庭乃至整个城市也正在向智能化大步演进,才会有更多的掘金机会。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11