在这次“数据盛宴”中,是否只有大公司的狂欢?并非如此,从事大数据产业的轻公司将无处不在。新兴的创业公司通过出售数据和服务更有针对性地提供单个解决方案,把大数据商业化、商品化,才是更加值得我们关注的模式。这将带来继门户网站、搜索引擎、社交媒体之后的新一波创业浪潮和产业革命,并会对传统的咨询公司产生强烈冲击。
这些更多初创型企业专注于为重要垂直业务提供应用程序,简称为BDA公司(大数据应用Big Data Applications)。在新兴的大数据创业公司方面,有提供工具系统的,有提供数据存储和销售的,有提供信息咨询算法的,有些提供电影票房预测技术,有些产品优化销售效率,有些产品通过将不同渠道的营销业绩与实际的产品使用数据相关联,为未来营销活动提供建议。
在技术之外,这些小企业还会开发一些产品,追踪记录与健康相关的指标并据此提出改善人们行为的建议。诸如此类的产品有望减少肥胖,提高生活质量,同时降低医疗成本。这类业务令人着迷之处在于,如果没有大量的数据,缺乏有效的数据分析技术,这些公司的业务难以有效开展。与此同时,云计算技术的普及,意味着小公司不必在内部开发或配备所有大数据技术,在很多情况下,它们可以利用基于云端的服务来满足数据分析需求。
PredPol公司通过与洛杉矶和圣克鲁斯的警方以及一群研究人员合作,基于地震预测算法的变体和犯罪数据来预测犯罪发生的几率,可以精确到500平方英尺的范围内。在洛杉矶运用该算法的地区,盗窃罪和暴力犯罪分布下降了33%和21%。
Tipp24 AG针对欧洲博彩业构建的下注和预测平台。该公司用KXEN软件来分析数十亿计的交易以及客户的特性,然后通过预测模型对特定用户进行动态的营销活动。这项举措减少了90%的预测模型构建时间。SAP公司正在试图收购KXEN,“SAP想通过这次收购来扭转其长久以来在预测分析方面的劣势”。
交通的参与者多种多样,是大数据最能发挥价值的领域。交通流量数据公司Inrix依靠分析历史和实时路况数据,能给出及时的路况报告,以帮助司机避开正在堵车的路段,并且帮他们提前规划好行程。汽车制造商、移动应用开发者、运输企业以及各类互联网企业都需要Inrix的路况报告。奥迪、福特、日产、微软等巨头都是Inrix的客户。
消费者追寻意见领袖的生活方式。潘吉瓦公司就是用数据分析来预测流行趋势,以此为基础甚至撬动全球贸易。比如,它们通过41次追踪《暮光之城》的徽章、袜子的运输情况,分析在这部电影中主角的服饰对流行趋势有多大影响率,并将分析结果告知用户,建议他们对自己的行动做出恰当的调整。
美国在线音乐网站潘多拉特别聘请一些音乐专家,让他们每个人平均花上20分钟去分析一首歌曲,并赋予每首歌400种不同的属性。如果你表示喜欢一首歌,程序会自动寻找跟这首歌“基因”相同的歌曲,猜测你也会喜欢并采用推荐引擎技术推荐给你。借助这种人海战术,潘多拉网站已经分析了74万首歌曲。
Futrix Health是一家专注于用通过数据为患者制定医疗解决方案的公司,从安装在智能手机上的个人健康应用,到诊所、医院里医生使用的电子健康记录仪,甚至是革命性的数字化基因组数据,均连接到后端数据仓库上。从而为患者制定最佳的医院选择、医药选择。该如何将采集到医疗保健机构的大量操作信息,分析患者情况或治疗效果,实施任何高效率的措施,使之更具有意义——大数据时代提供的机会,不再是简单地收集这些数据,而是如何运用数据来更好地认知这个世界。
在零售领域,创业公司Retention Science发布了一个为电子商务企业提供增强用户粘性的数据分析及市场策略设计的平台,它的用户建模引擎具备自学习功能,通过使用算法和统计模型来设计优化用户粘性的策略。平台的用户数据分析都是实时进行,以确保用户行为预测总是符合实际用户行为更新;同时,动态的根据这些行为预测来设计一些促销策略。RS目前已获得Baroda Ventures, Mohr Davidow Ventures, Double M Partners及一些著名天使投资人130万美金的投资。
江苏众瀛联合数据科技有限公司构建了这样一个大数据平台——将准备结婚的新人作为目标消费者,并把与结婚购物相关的商家加入其中。一对新人到薇薇新娘婚纱影楼拍了婚纱照,在实名登记了自己的信息后会被上传到大数据平台上。大数据平台能根据新人在婚纱影楼的消费情况和偏好风格,大致分析判断出新人后续消费需求,即时发送奖励和促销短信。比如邀请他们到红星美凯龙购买家具、到红豆家纺选购床上用品、到国美电器选购家用电器、到希尔顿酒店摆酒席……如果新人在红星美凯龙购买了中式家具,说明他们偏好中国传统文化,就推荐他们购买红豆家纺的中式家居用品。
水,向来是个不好管理的东西:自来水公司发现某个水压计出现问题,可能需要花上很长的时间排查共用一个水压计的若干水管。等找到的时侯,大量的水已经被浪费了。以色列一家名为Takadu的水系统预警服务公司解决了这个问题。Takadu把埋在地下的自来水管道水压计、用水量和天气等检测数据搜集起来,通过亚马逊的云服务传回Takadu公司的电脑进行算法分析,如果发现城市某处地下自来水管道出现爆水管、渗水以及水压不足等异常状况,就会用大约10分钟完成分析生成一份报告,发回给这片自来水管道的维修部门。报告中,除了提供异常状况类型以及水管的损坏状况——每秒漏出多少立方米的水,还能相对精确地标出问题水管具体在哪里。检测每千米“水路”,Takadu的月收费是1万美元。
电商行业的现金收入源自数据,而婚恋网站的商业模型更是根植于对数据的研究。比如,作为一家婚恋网站,百合网不仅需要经常做一些研究报告,分析注册用户的年龄、地域、学历、经济收入等数据,即便是每名注册用户小小的头像照片,这背后也大有挖掘的价值。百合网研究规划部李琦曾经对百合网上海量注册用户的头像信息进行分析,发现那些受欢迎头像照片不仅与照片主人的长相有关,同时照片上人物的表情、脸部比例、清晰度等因素也在很大程度上决定了照片主人受欢迎的程度。例如,对于女性会员,微笑的表情、直视前方的眼神和淡淡的妆容能增加自己受欢迎的概率,而那些脸部比例占照片1/2、穿着正式、眼神直视没有多余pose的男性则更可能成为婚恋网站上的宠儿。
Prismatic是一款个性化新闻应用,只有4名创始员工,凭借互联网数据爬虫和社交网络开发平台的数据,依托亚马逊的云计算平台,实现了大数据的精益创业。Prismatic不提供统一的设计精良的新闻订阅或推荐界面,而是根据分析用户的Facebook 或Twitter资料,为用户做一对一的数据分析和推荐。从盈利模式来看,Prismatic不是依靠广告费生存下来,也不是传统的新闻媒介,而是一个披着新闻应用外衣的电子商务公司。名义上为了给用户个性化推荐新闻而得到用户的个人信息进行数据分析,针对性的推出推荐商品,从而从电子商务中盈利。
人类都有和同类对比的天性,例如,一家政府机构收集不同地点从事同类工作的多组员工的数据,仅仅将这些信息公诸于众就促使落后员工提高了绩效。在能源行业,Opower使用数据对比来提高消费用电的能效,并取得了显著的成功。作为一家SaaS的创新公司,Opower与多家电力公司合作,分析美国家庭用电费用并将之与周围的邻居用电情况进行对比,被服务的家庭每个月都会受到一份对比的报告,显示自家用电在整个区域或全美类似家庭所处水平,以鼓励节约用电。Opower的服务以覆盖了美国几百万户居民家庭,预计将为美国消费用电每年节省5亿美元。Opower报告信封,看上去像账单(所以几乎总是打开),它们使用行为技术(笑脸、同行比较)轻轻地说服公用事业客户降低消耗。Opower已经推出了它的大数据平台 Opower4 ,通过分析各种智能电表和用电行为,电力公司等公用事业单位成为Opower的盈利来源。而对一般用户而言,Opower完全是免费的。
使用新的数据技术,诸如美国的Chango公司和中国的Uniqlick公司正在数字广告行业中探索新的商业模式——实时竞拍数字广告。通过了解互联网用户在网络的搜索、浏览等行为,这些公司可以为广告主提供最有可能对其商品感兴趣的用户群,从而进行精准营销;更长期的趋势是,将广告投放给最有可能购买的用户群。这样的做法对于广告主来说,可以获得更高的转换率,而对于发布广告的网站来说,也提高了广告位的价值。
众趣是国内第一家社交媒体数据管理平台, 目前国内主要的社交开放平台在用户数据的开放性方面仍比较保守,身为第三方数据分析公司,能够获得的用户数据还十分有限,要使用这些用户数据需获得用户许可。众趣通过运营统计学等相关数据分析原理对用户数据进行过滤,最终完成的是对一个用户的行为、动作等个体特征的描述。这些描述可以帮助品牌营销者了解消费者的消费习惯及需求;也可以帮助企业的领导增强对自己员工的了解。除了对个体以及群体行为特征的描述外,这些数据分析结果还可用于对用户群体的行为预测,从而为营销者提供一些前瞻性的市场分析。众趣数据分析的结果只能精准到群组而无法达到个人。此类的用户数据研究除在市场营销领域具有一定的参考价之外,目前大多还主要用于配合一些小调研。此外,这些数据还可以实现对用户甚至企业机构的信用评级,在金融领域也有一定程度的使用。
导购电商的拖拉网制作了“明天穿什么”这一应用。在这个应用当中,众多时装圈权威人士输送时装搭配与风格单品,由用户任意打分,根据用户的打分偏好,拖拉网便能猜到明天她们想穿什么,然后为她在数十万件网购时装中推荐单品,并且实现直通购买下单。在获取客户数据后,后台分析也是各显神通。
拖拉网加入了更多变量来考核自己的推荐模式。比如有消费者明天要参加一个聚会,不知道要穿什么风格,也没有看天气预报,希望导购网站能帮她把这些场景和自己的信息组合起来,给出一整套的解决方案。于是日期(天气)、地域、场合、风格,这些都成为穿衣搭配解决方案的变量,经过不断的组合呈现给用户,据拖拉网数据,用户在看到一个比较优质的搭配,并有场景性引导的时候,点击到最后页面完成购买的转化率会比单品推荐高40%。
现在人们有了把人类基因档案序列化的能力,这允许医生和科学家去预测病人对于某些疾病的易感染性和其他不利的条件,可以减少治疗过程的时间和花费。位于旧金山的SeeChange公司创建了一套新的健康保险(放心保)模式。该公司通过分析客户的个人健康记录、医疗报销记录、以及药店的数据,来判断该客户对于慢性病的易感性,并判断该客户是否有可能从一些定制的康复套餐中获利。SeeChange同时设计健康计划,并设立奖励机制鼓励客户主动完成健康行动,全过程都通过其数据分析引擎来监控。
以色列的Given Imaging公司发明了一种胶囊,内置摄像头,患者服用后胶囊能以大约每秒14张照片的频率拍摄消化道内的情况,并同时传回外置的图像接收器,患者病征通过配套的软件被录入数据库,在4至6小时内胶囊相机将通过人体排泄离开体外。一般来说,医生都是在靠自己的个人经验进行病征判断,难免会对一些疑似阴影拿捏不准甚至延误病人治疗。现在通过Given Imaging的数据库,当医生发现一个可疑的肿瘤时,双击当前图像后,过去其他医生拍摄过的类似图像和他们的诊断结果都会悉数被提取出来。可以说,一个病人的问题不再是一个医生在看,而是成千上万个医生在同时给出意见,并由来自大量其他病人的图像给出佐证。这样的数据对比,不但提高了医生诊断的效率,还提升了准确度。
真正的技术人才永远是各大公司的抢手货,绝对不要坐等他们向你投简历,因为在他们还没有机会写简历之前很可能已经被其他公司抢走了。Entelo公司能替企业家们推荐那些才刚刚萌发跳槽动机的高级技术人才,以便先下手为强。
Entelo的数据库里目前有3亿份简历。而如何判断高级人才的跳槽倾向,Entelo有一套正在申请专利的算法。这套算法有70多个指标用于判定跳槽倾向。某公司的股价下跌、高层大换血、刚被另一大公司收购,这些都会被Entelo看作是导致该公司人才跳槽的可能性因素。于是Entelo就会立刻把该公司里的高级人才的信息推送给订阅了自己服务的企业家们。企业家们收到的简历跟一般的简历还不一样。Entelo抓取了这些人才在各大社交网络的信息。这样企业家们可以了解该人提交过哪些代码,在网上都回答了些什么样的问题,在Twitter上都发表的是些什么样的信息。总之,这些准备“挖角”的企业家能够看到一个活生生的目标人才站在面前。
航空业分秒必争,尤其是航班抵达的准确时间。如果一班飞机提前到达,地勤人员还没准备好,乘客和乘务员就会被困在飞机上白白耽误时间;如果一班飞机延误,地勤人员就只能坐着干等,白白消耗成本。美国一家大航空公司从其内部报告中发现,大约10%的航班的实际到达时间与预计到达时间相差10分钟以上,30%的航班相差5分钟以上。FlightCaster是一家提供航班延误信息预测的公司,主要根据航空公司的航班运行情况进行预测。与航空公司所拥有的类似航班运行情况的专有信息一样,该公司拥有大量国内航班飞行和航班实时运行状况的历史数据。Flightcaster的秘诀就是其对大数据分析的有效利用和使用适当的软件工具对产出数据进行实时管理。
Passur Aerospace是专门为航空业提供决策支持的技术公司。通过搜集天气、航班日程表等公开数据,结合自己独立收集的其他影响航班因素的非公开数据,综合预测航班到港时间。时至2012年,Passur公司已经拥有超过155处雷达接收站,每4.6秒就收集一次雷达上每架飞机的一系列信息,这会持续地带来海量数据。不仅如此,经过长期的数据收集,Passur拥有了一个超过十年的巨大的多维信息载体,为透彻的分析和恰当的数据模型提供了可能。Passur公司相信,航空公司依据它们提供的航班到达时间做计划,能为每个机场每年节省数百万美元。
一家名为气候公司(Climate Corporation)的创业企业每天都会对美国境内超过100万个地点、未来两年的天气情况进行超过1万次模拟,其数据量庞大、动态、实时。随后,该公司将根系结构和土壤孔隙度的相关数据,与模拟结果相结合,为成千上万的农民提供农作物保险。 通过遥感获取土壤数据,这和我们过去所熟悉的通过网络服务获取用户网络行为数据不是一回事,数据的概念得以极大的扩充。要想对每块田地提供精准的保险服务,肯定还需要与土地数据相配套的农产品(000061,股吧)期货、气候预测、国际贸易、国际政治和军事安全、国民经济,产业竞争等等各方面的数。在如此庞杂的大数据基础上推出的商业模式是创新的,同现有农作物保险方式相比具备极大竞争力,并且是可持续和规模化的。更妙的是,这家公司基于大数据的运营,完全没有进行高额的网络设施投资,只是租用了亚马逊的公共云服务,一个月几万美元而已。
几乎所有的收费电子书都会提供部分章节让读者试读,其实,出版商需要弄清楚人们读到了哪里、读完后有没有购买,以及其他各种体验,才能卖出更多的电子书。美国创业公司Hiptype开发了一套电子书阅读分析工具,其商业模式就在试图解决这一难题。Hiptype自称为“面向电子书的Google Analytics”,能够提供与电子书有关的丰富数据。它不仅能统计电子书的试读和购买次数,还能绘制出“读者图谱”,包括用户的年龄、收入和地理位置等。此外,它还能告诉出版商读者在看完免费章节后是否进行了购买,有多少读者看完了整本书,以及读者平均看了多少页,读者最喜欢从哪个章节开始看,又在哪个章节半途而废,等等。Hiptype能够与电子书整合在一起,出版商无论选择哪种渠道,总是能够获得用户数据。Hiptype收集的所有数据都是匿名的。用户在下载了内置Hiptype服务的电子书时,会得到一个提示,可以选择将其屏蔽。
网络营销存在一个巨大问题,如何获知在网上使用几个不同名称的人是否是同一个人?安诚客(Acxiom)推出了一种名为“观众操作系统”(“Audience Operating System”,AOS )的技术方案解决了这个问题。它允许市场营销者与你的 “数字人物”绑定 ,即使你由于婚姻换了名字,或者使用昵称,或者偶尔使用中名,它也照样能够解答那个已经换了地址或者电话号码的人是否是同一个人的问题。
AOS 可以汇集不同数据库中的信息,这些数据或离线或在线,是公司可能在不同场合针对个人而收集的。通过使用AbiliTec——一种Acxiom也拥有的数字化“身份识别”技术——AOS将客户信息删繁就简,得到简单单一的结果。AOS帮助安诚客的广告客户使用他们的数据在Facebook上找到广告投放目标用户。
数据分析咨询请扫描二维码
数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21