12.12中关村大数据日暨CDA数据数据分析人才培养分论坛演讲嘉宾——SenzC创始人 冯小平
演讲实录如下:
大家好,各位领导、各位专家数据分析师们下午好。
这是我个人的简历,我叫冯小平,之前做信息安全,做一些工程、搜索,后来去了一家NGO,也是做技术,现在我们做的产品叫做情境感知技术,在国内是第一家,在国际上也差不多是两三年,即使在硅谷也是。
我请问大家有没有看过这个美剧,中文叫《疑犯追踪》,强烈推荐,不光是它评分特别高,它讲的就是大数据时代的社会的情况。我喜欢它的几点,我认为它真的是现实板的Matrix,我觉得这是非常现实,甚至有可能在当下发生的大数据故事。大家都说有些集表现上来说已经在日常生活中发生了,有人成立了POI教。它基本的故事是有一个AI通过收集大量的数据来控制整个社会发展,比如谁竞选、社会往哪边发展的故事。
里面有一句话讲,对于AI来说,人类社会最大的一个弱点就是人跟人之间的关系。这个趋势不可避免,大家想不到,我们先把自己炼化下来,看我能分析出什么,这是我当时的一个很小的想法,之后我创业的时候也是它的本源和初心就是这样。
刚才曹老师说Hadoop是这个数据的关键,我认为这都是工程师造出一堆堆的工具,反而不是数据分析师应该掌握的核心技能,数据分析师应该是用工具帮助你越来越高层地访问到这些数据、操作这些数据,不用管底层数据怎么存储、怎么扩展,所以你以后拿到的数据会越来越高层,你不知道从哪拿到,你输入一句话就可以拿到这样的数据了,我觉得数据分析师应该更多地了解工业界对数据分析的需求,就像刚才说造面包,数据分析师需要知道人类需要造什么,这些人需要买什么,除了面包之外,是不是我还要买起司、蛋挞之类的。我第一个方向的就是多玩Gadget,大家看到京东智能的一些小玩意,我觉得这是数据分析师的玩具。
这是我平时会随身携带收集数据用的东西,包括Kinect大家都很熟悉,Kinect windows你可以用的系统,包括iBeacon都是写几个代码就可以拿到数据;EyeX是一个民用级别的眼动移,这两个MotoX是我平时都会带的,录音记录,还有Nexus7是每天带在包里,你可以搜周围的信息。
Kinect for windows
比如说Kinect windows,这个是我摆在客厅、办公室里说这里什么时候有一个人在这边,这个东西持续记下来了,我们现在还不知道能分析什么,一旦有一天我们的算法更牛了,就可以算出来东西了。但是如果算法牛了,你没有这些数据就完了。
iBeacon
这是iBeacon,这个东西造价很便宜,如果你想知道你跟哪个东西距离多远,你就可以把这个贴到那个里面,你的手机如果接近这个东西,你就可以持续知道我离它1米、我离它3米,它是可以记录很多数据,比如你跟你的书包一天接触多久,当然你也可以做室内定位,比如说你在这个屋子里哪个位置待了多久。
MYO
MYO是一个绑在你手臂的机器,你通过几个代码就可以知道每一天手臂肌肉的数据。
Mindwave
这个是一个记录脑波的数据,它可以简单地记录出你一天的注意力的值,当然可能学过大脑神经的人知道各种波对人的精神状态是什么作用,它又做了一层,你可以知道这个人注意力多高,你有没有眨眼,你有没有很冷静。这个东西可以用来干嘛呢,我们后面会讲到。
NarrativeClip
这个NarrativeClip,这个是我戴在胸前的,它每隔几秒会拍一张照片,大家可能会说会不会侵犯隐私,如果数据分析师考虑隐私的话就没法做了。这个想象空间非常大,比如说前两天就是一个人记录了6个月的数据可以分析出这个人每一分钟在干什么。当然我戴这个也戴了一年半了,硬盘都堆了几个硬盘的数据,我也就是分析分析我每天接触什么东西。最后我分析的结果是我一天40%的时间都在看消息,我那一天只有5%的时间视角里有人。
EyeX
EyeX这个是放在笔记本上就可以看屏幕的区域,你什么时候在看哪,基本上每秒钟几十赫兹。
刚才那些设备都是市面上能买到的,你从中能拿到的数据,如果你自己做是基本上你要花几年,甚至十几年才可以做出的东西,这些Gadget给我们带来的好处就是我们可以站在它的肩膀上拿到很高级的数据,做深度的数据。
另外分享多去hackathon,我认为hackathon是一个线下同性交友社区,当然不一定同性。在hackathon一般大家花两天周末的时间一块去琢磨出一个小点子,然后把这个点子用两天的时间,有程序员,有设计师,能够实现出来,并且给大家展示出来。
比如说之前我们参加hackathon的时候,像MYO可以检测电流,后面紫色的灯也是可以通过API访问的,我们通过摆手的动作改变灯的颜色,我边摆手边听歌这个灯就可以变颜色,这个就是hackathon做的东西。
另外一个hackathon就是我们做了一个人到哪个屏幕旁边,内容就显示在那个屏幕旁边的一个简单的模式。我录了我写代码时候的脑波的情况,我注意力的值,我可以拿我注意力的值来评估我不同区域代码出BUG的几率,概率低的我就可以过去,高概率的地方我就仔细检查一下。
第三个分享就是多用API。
Mashup这个概念很早就提出来了,大家认为以后各种的技术都是堆占型的,大家都要基于别人的API做出自己的产品,其实现在已经这样了,你创业服务器肯定不用自己的,都用阿里云,都不用搭自己的后端服务,图象识别有,声音识别有迅飞,都有各种各样的服务。当时有一段时间很疏于技术,我花三十天时间去接触一些API,这些API都是我搜的最新的美国的创业项目他在用什么样的API做。
比如爬虫、图象识别、情绪识别,像刚才说的物体的其实都有在线的独立第三方提供API,如果你不知道这些API的话,你需要想我需要这样一个功能来实现我的想法的时候,你就不知道到底应该怎么做,难道图象识别、人脸识别我要重新做吗?那不可能的,去了解这些可以帮助你的API能够提升你效率和开拓眼界。我不知道大家在这里面能看到几个眼熟的东西。
最后一个分享就是多开脑洞。
因为记忆、情绪,大家现在越来越多地被证明是可以被机器替代的。我们就想到底人有什么可以不被机器替代的。谷歌有一个人说2020年可以实现人脑连入互联网,我觉得脑洞是人类残留的不可解的核心价值,我欢迎大家来我们私下组织的小团体搞了一个小节目,《说好的脑洞呢》,基于现在基础的技术,未来能够实现什么样很好的想法。比如说发光二维码,如果我们墓地放二维码,就可以看到死去的这些人的情况。这些都是脑洞,但是这些脑洞本身就代表着你思维的边界和你对现在技术的一些了解的体现。
精彩问答
我想问一下像这一类设备技术下一步会有哪些新的突破。
冯小平:这些设备肯定是越来越小型化,越来越接近人的穿戴,比如说脑波有人说拿脑波做环境的改善,比如说智能大厦会根据你身体的情况自动调节你所处的环境的温度、光照,更往前就是这些东西足够小型化,可以看到很多会越来越小,越来越让你感知不到它的存在,包括各种可穿戴设备也是这个趋势,就是不断地把你各种维度的数据以你舒适的方式收集下来,收集下来以后,就是他们怎么卖钱的问题了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31