大数据开放面对的瓶颈究竟是什么
大数据无影无形却又无所不在,这个听起来冰冷的词汇,如今已经被商机包围。你上网搜索的关键词、你网上购物的记录,你在社交平台分享的消息,你去超市买口香糖的频次,甚至你在八达岭高速上拨出的一个电话,可能都极具“价值”,成为别人洽谈桌上的筹码。
被“窥视”的无奈
对于许多在网上购物的顾客来说,总能在网页上看到与他们浏览记录相似的产品广告, 这似乎让数据变得贴心起来,但大家也逐渐意识到这并不是巧合。网络浏览记录、交易记录、手机通话记录、收发邮件 记录、社交网络记录,你在网络上的每一个“足迹”都会以数据的形式记录并存储下来,它们精准、事无巨细。
不可否认,大数据为监测和预示人们的生活提供了极大的方便,然而个人隐私也随之暴露在无形的“第三只眼”之下。无论是电子商务、搜索引擎还是微博、微信等互联网服务商都对用户行为数据进行挖掘和分析,以获得商业利益,这一过程不可避免地威胁到普通人的隐私。大数据有可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。
一直以来,大家普遍认为,只要我们在网络中匿名就可以避免个人信息的泄露,但是大数据告诉我们,数据的交叉检验会使得匿名化失效。我们的隐私数据每天被记录,随时有可能被泄露。
“用户在使用微信的时候,免费使用并打开一些关联链接,但是平台拿到了你的信息并窥视了你的隐私,这代表我们享受了这种服务就牺牲了隐私,由于我国法律并没有对数据使用进行相关约束,也没有信用评估的机构进行监管,使得目前很多数据使用还游走在法律的边缘,数据拥有者如何用它、用到什么程度,没有清晰的界定,有触碰隐私的交易也没办法干涉。”中国联通网络技术研究院首席专家唐雄燕告诉记者。
当数据交易还处在不成熟时期时,哪些领域更应该注重数据隐私的保护和规避?大数据产业联盟会长董力明告诉《经济》记者,交易数据获取收益,就有可能涉及个人隐私,比如说在互联网广告领域。“这时就要做数据脱敏以保护隐私,目前在贵州建立的大数据交易所,更多的是和政府相关的数据,这就必然要对数据进行脱敏。”
目前,比较成熟的数据交易方式是通过数据报表交易,报表不涉及隐私,反映的是社会、产业、消费者群体的趋势,隐私数据不能开放不代表不能有数据生态,脱敏后的数据能够流通起来并创造很高的社会效益。
对此,唐雄燕也表示认同,他认为,个人数据最小,但是也最敏感。数据脱敏会把敏感信息进行编码,让这个编码代表唯一的一个人,但又不与他人重复。
追逐利益不能违反规则
作为掌握诸多数据的运营商、企业,如果深入挖掘这些数据,带来的收益非常可观,基于企业、运营商等对数据交易的需求,除去一些非法交易,数据交易今后怎么做?
唐雄燕表示,“由于行业壁垒重、法律不健全以及涉及顾客隐私,现阶段很多的数据还不能轻易进行交易。大家也在探索,作为运营商首先会考虑今后交易一些统计性数据。”
当国内一些大数据领域的互联网公司在数据交易上违反国家的法律和商业道德时,作为数据平台的专业人士,中金标准数据公司总经理郝文嘉认为,要从国家的层面立法打击,毕竟个人的隐私通过互联网被售卖以获取商业利益,这本身就违反了国家《民法》和《经济法》的规定,“国家立法机关要跟上基层进步的步伐”,在全球,隐私交易行为都是不被允许的,这种行为触碰了商业道德底线,想要建立起平等、公平的市场环境就要遵守规则。
可能有一些掌握信息的商业性机构或是管理机构,不注意数据保密,把信息泄露出去,利用信息去追求商业目的,全国政协委员、中华全国律师协会会长于宁向《经济》记者称,虽然国家在隐私保护法律上能找到相关条款,但在大数据领域涉及隐私保护的法律条文还没有跟上。
信息发达和发展带来新变化,这也引起了国家立法机构的重视,《民法》、《刑法》也渐渐地开始体现对隐私的保护,专家学者在反映,法律也在创制、调整,但是具体涉及国家立法的计划,还需要人大常委会的立法机构和法律专业人士进行引领和商讨。
但董力明认为,对某个领域如果监管太多,可能会抑制其活力。
就算利用法律去强制控制,法律和规则有的时候也难以规定得太过具体,所以中间肯定会存在灰色地带,唐雄燕表示,大数据在运营的过程中,“一些问题可能会随着时间逐步显现并规范,大家会形成共识,在一些问题还没显现的时候,不能先出现法律去遏制它的发展。目前的数据交易的平台也在尝试发现问题的过程中,然后去改善。”
别让政策阻碍了数据开放
数据只有连接起来才能创造价值,那么大数据市场真的得到开放了吗?董力明认为,离真正的数据开放还有很远的路要走,“美国和英国数据开放的第一步是跟生物相关的数据,政府希望通过开放这些数据,来增加社会效益,但是在与企业有关的数据上,大多数企业还保持谨慎态度,因为这是数据资产,不可能轻易地开放出来。另外与人相关的数据涉及隐私保护这个敏感地带,所以更是难以得到开放的。”目前社会上开放的,往往是与宏观、经济、政府的一些公共部门,比如说天气、地质相关的数据,这些数据不涉及如军事等相关的敏感信息。
如果技术不是阻碍大数据发展的瓶颈,那还有什么遏制了它的发展?数据开放面对的瓶颈究竟是什么?中国通讯协会常务副理事长兼秘书长张新生说,“是政策上的”,如果不把对各层面利益的分配架构打好,数据开放还是较为漫长的过程,但是也不要把政策看得太重,不盈利也要将大数据做起来。他表示,“别期望政府走在前面,这会遏制创新和产业的快速发展,企业要先动起来,探索的过程永远是未知大于已知。”
那么,数据的把控权利移交政府会否对数据安全有更好的把控?“我觉得政府很难完全控制大数据,只是能够制定一些规则,只有商业机构更清楚地知道数据的价值,政府主要还是保护数据的安全。”唐雄燕说。
大数据并不神秘,但是在国内这种环境下,真正运用大数据的很少,它还面临着认识和能力上的问题。郝文嘉说:“每一种数据都是有缺陷的,因为数据来源于互联网,同时互联网数据的发布也是海量的,这就会存在一些数据发布的参数、量质不符合应用和计算的状况,数据的价值有缺陷就影响发挥,这是任何行业都不可避免的,所以盲目地去相信大数据也不对,正是由于大数据的缺陷性,数据公司就更要努力把缺陷补足。”
目前这个阶段,还处于大数据发展的初级阶段,郝文嘉还认为,经过数据平台对数据的不断补足,对社会数据应用的提高,这个过程中,数据积累到一定程度达到成熟,就会推动整个社会成指数型进步,这也是走向人工智能化的一个基础。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩稳定, ...
2025-02-26在数据分析工作中,你可能经常遇到这样的问题: 从浏览到消费的转化率一直很低,那到底该优化哪里呢? 如果你要投放广告该怎么 ...
2025-02-25近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的,尤 ...
2025-02-25挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-25在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-25以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-25“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-25在数据分析中,地图是一种非常直观的可视化工具,能够帮助我们更好地理解数据在地理空间上的分布情况。无论是展示销售数据、人口 ...
2025-02-25春风拂面,金三银四的求职季如期而至。谁都想在这场竞争里拿下心仪offer。 一份亮眼简历是求职敲门砖,面试紧张则可能让机会溜 ...
2025-02-24当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04