专家给大数据“泼冷水 ”:中国大数据仍在初级阶段
大数据成为时代的新宠儿,不知情的人以为,中国大数据已经发展的差不多了,在专家眼里,大数据还处在初级阶段,出现的许多问题都亟待解决,大数据还要再迈过几道坎儿。“我国意识到大数据的价值,并不比欧美晚,但并没有很好的大数据应用。”大数据运用还在法外“裸奔”,这都是大数据要...
“不少人以为,大数据技术很成熟了,甚至说大数据是万能的。”近日,在“中关村大数据日”上,西安交通大学数学与统计学教授徐宗本院士说,“大数据具有大价值,但也有大忽悠的一面。”在接受记者专访时,数据堂合伙人柴银辉认为,“大数据就像5年前的云,还处于初级阶段,还需要跨过几道坎。在这个过程中,要谨防泡沫出现”。
数据无差别存储:想要应用成本要降万倍左右
“数据无差别存储,使用起来成本太高。”柴银辉估计,“这些数据想要应用,成本要降到万倍左右。”
目前,很多人把“大数据”等同于“数据大”。在柴银辉看来,“分类存储的数据才能产生价值”。
对大数据拥有者进行分析,柴银辉认为,前景并不乐观。“大家说政府掌握数据,但很多部门只是把文件堆在那里,甚至没有数据库。国企有数据,却不知该怎么存放。无差别存储的数据,很难产生价值。”
柴银辉认为,大数据想要应用,就要经历全、新、细、准四个阶段,但目前很多数据还没完成第一个阶段。
“我国意识到大数据的价值,并不比欧美晚,但并没有很好的大数据应用。”电子科技大学教授周涛曾经分析,其中一个重要原因,是拥有大数据的人、拥有大数据分析技术的人、拥有数据分析需求的人是分离的。
他举例说明,比如遥感、水利、水文数据,如果国家不能有效管理起来,就没法产生价值,反而是一个巨大的负担。
技术上并不成熟:新分析方法还没出现
“不少人觉得,大数据技术很成熟了。”徐宗本说,这其实是一个误区。
徐宗本从处理和分析的区别入手加以说明:“我们想做一个简单统计,做一个查询,做一个排序,做一个比对,等等,这叫数据处理。它是用计算机的标准逻辑一步过的处理方式。而数据中有没有趋势、有没有共性结构、有没有关联数据,这些叫数据分析。”
为了更便于理解,徐宗本举了一个例子:“在这间屋子里,找出谁个子最高,这是处理,但找谁和谁关系最好,这叫分析。”
但在现实社会里,很多人把两者混为一谈。这也造成了他们对大数据技术的误读。徐宗本认为,大数据的成功是部分处理技术的成功。现有例子对于分析而言,基本还是传统方法,新方法并没有出现。
硬蛋首席技术官李世鹏告诉记者:“我们在做智能硬件孵化时发现,对于供应商和创业者需求的精准分析,大数据还需要进一步成熟。”
“大数据不是低端业务的简单整合。”数据堂CEO齐红威说,“现在的大数据应用还非常浅,远没到分析阶段。”
人才瓶颈制约发展:基础性数据分析人才缺口达1400万
“全球竞争对手,几乎早于我们半年,把顶尖大学大数据研究室里的优秀专家挖光了。”滴滴出行CEO程维说,“目前,我国每年培养的大数据深度学习方面的博士生大概只有50个人。”
“大数据发展的瓶颈是人才。”程维说,大数据健康发展,必须培养出世界领先的团队。
据中国商业联合会数据分析专业委员会统计,我国未来基础性数据分析人才缺口将达1400万;而在BAT企业招聘职位里,60%以上都在找大数据人才。
“一个大数据方面的普通大学生,年薪起码也有五六万美金,吸引力不能说不强,但现在还是缺人。”数联铭品CEO曾途告诉记者,“大数据是一个新兴事物,高校、院所里培养的人才还不多。这种现象短时间内很难改变。”
“现在大数据有很多问题,首先就是人才缺乏。”北京大数据研究院学术委员会主任张平文提到了一个担忧,“高端人才都在公司里,年薪上千万,学校雇不起。这可能会对基础研究产生影响。”在他看来,解决这个问题,需要高校、院所机制体制的突破。
个人隐私亟待保护:大数据运用还在法外“裸奔”
“前两天,家人甲状腺不舒服,我在网上查了相关知识。过了一天,就有人说是甲状腺医生,想加我为微信好友。”张平文所说的,正是人们对于数据安全的担忧。
“数据具有特殊性。如果反映的是群体趋势,这对生活是有益的;如果触及个人隐私,就可能造成伤害。”柴银辉说。
“在美国,你去贷款,但哪一年在图书馆借书忘了还或推迟还,就可能受影响。美国诚信体系建设比较完善。同时,几十年来,相关立法可以让个人隐私得到很好的保护。”曾途说,“目前,我国大数据还处在起步阶段,尚未进行立法监管。”
“存在可观的利润空间,就可能出现泄密、买卖信息。”曾途认为,不让大数据运用在法外“裸奔”,“立法应当提上议程”。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13