数据机器人帮你创造大数据商业价值
在大数据概念似乎与每个公司乃至每个人都紧密相关的今日,如果有人问大数据到底是什么?怎样才能让大数据为我创造实实在在的价值?大部分时候,你所得到的答案或者艰涩难懂,或者虚无缥缈,比如说3V(Volume(容量)、Velocity(速度)和Variety(多樣性)),甚至是5V (再加上Veracity(真實性)和Value(價值)),又或者“结构化数据”和“半结构化数据”。上到天体太空,下到海底勘探,大到教育文化,小到细胞DNA,总有一款可以迷惑你。
或许真相是,想在在大数据时代乘风破浪勇夺先机,你根本不需要知道这些。中国有句老话,术业有专攻。从大数据到商业价值,你需要的只是根据业务经验提出需求和目标,其他的一切都可以交给数据机器人来搞定。
听起来像是一个神话?其实这一切已经在发生。
“让天下没有难用的数据,让人人都可以成为数据科学家。”是桃树科技创始人最初的理想。桃树科技起源于2015年,其创始人杨滔和汪秦宇均为海归博士,在美中两国顶级互联网及金融公司具有资深的大数据技术和管理经验,因为看准了大数据领域全自动建模预测这一趋势,毅然放弃稳定高薪的大公司职位,转而投身创业这一荆棘艰险之旅。
如前文提到,大数据似乎可以在各个领域落地,但是能真正产生爆发效应的领域却并不多。根据多年的大数据应用经验,桃树选择了金融和电商大数据应用为公司起步的切入点。在金融领域,数据应用的需求属于刚需。尤其银行对贷款客户信用的评估关系到银行坏账率的比例。在电商领域,大数据应用可以产生规模化效应,形成数据积累的闭环,最终带动流量的获取。
信用风险评估机器人:CAN
“极客看什么不顺眼,就自己动手做一个。”以数据极客自诩的杨滔这样说,“大数据应用的广泛诉求,就是输入数据,输出结果。”于是他创造了第一个数据机器人CAN。CAN是一个专门应用于金融行业的风险评估机器人。在以民生银行为代表的多家知名银行和互联网金融机构中,都已经存在CAN的身影。当你给这台机器输入散落在各个角落的原始数据,它便如同一匹永不疲惫的战马夜以继日地飞奔,输出银行/p2p中申请贷款客户的信用打分及每个客户的风险点。这台机器,可以提早发现这些金融机构贷款业务中90%以上的贷款坏账,并且可以提早预测客户是否逾期归还贷款,预测准确率均在80%以上。传统的银行风险建模一般一个数据团队工作3到6个月,而CAN只需要3天。
无论是数据的清洗整理,还是算法的复杂处理,都是CAN的内在机制。对于银行客户经理,CAN提供的数据结果无比简单——客户经理负责客户的信用风险打分及对应的风险因子。CAN建立了这个数据提炼机制之后,自然把外部大量数据与内部数据动态整合,整合后的风险数据不仅包括客户的基本信息、金融行为、动态还款行为,并且还包括客户以及他的网络关系对应的央行征信数据、法院工商数据、房产资产数据以及在P2P平台上的贷款及表现数据等。从脏乱复杂的大数据到包含丰富预测信息的大数据,正是CAN的输入和输出。
当客户经理负责客户出现风险,他将第一时间获得风险预警,并可以根据CAN输出的风险因子去追踪事实真相。对于银行客户经理,大数据经过CAN的处理,成为在他们日常业务流程中的“决策抓手”。大数据远在天边,也近在眼前。
商品销量预测机器人:BOB
在CAN被多家银行客户高度认可之后,杨滔又带领他的团队开发了桃树机器人工厂的第二个机器人BOB。BOB是一款选品机器人,它可以基于商品的行业、类目、关键字、款式、价格、产地和营销渠道数据,预测商品在一定流量中,不同的场景、时间下,可获得的成交额(或转化率)。
电商运营的第一个环节就是选品。选品包括商品采购、营销活动爆款筛洗、商品排序规则等。B2C选品好坏直接关系库存积压,电商平台选品好坏直接关系流量分配机制,淘宝卖家如果无法打造爆款根本获得不到流量,导购网站其实也就是一个选品系统。传统电商选品主要依赖行业经验,运营人员通过对不同行业的经验来判断什么商品会卖得好。这种运营方式的局限在于难以规模化,并且还有腐败可能性。并且,在互联网上,所有商品信息都不是孤立的,消费者往往会比价,从多个电商平台找到性价比最优的商品。因此,综合电商自身与外部数据的选品,才有可能满足消费者需求。
选品机器人BOB的诞生,直击电商行业发展的基础痛点:1. 商家面对十几亿海量商品,不知如何选则适合自己平台的客群的商品; 2. 除了淘宝京东这样的大型平台,一般的中小电商迷失在海量数据中,缺乏利用数据帮助运营的知识。这些中小电商,在互联网时代依旧依赖传统的人工经验判断来进行决策,效率低下;3. 电商数据应用的技术门槛极高,商家面临大量非结构化文本数据,图像数据,中小卖家却往往没有能力建立数据科学团队,无法充分利用大数据帮助决策。
这一切问题,BOB都可以全自动化的解决。BOB起源于利用机器学习技术建立大规模商品销量预测模型。此模型成功帮助电商巨头淘宝旗下的聚划算平台实现数据化运营,挖掘爆款,提升运营效率80%,提升销售额235%。桃树科技成立的短短数月间,已经与多家电商网站展开洽谈,并与新兴电商网站街蜜以及风趣海淘签署了服务协议。
桃树的梦想,是让天下没有难用的数据,让人人都可以成为数据科学家。
在执着追寻这个梦想的路上,杨滔带领着他的团队不断壮大着他们的机器人工厂,这些机器人个个武艺高超,兼备从数据源自动清洗数据,抽取特征,并自动学习、预测、解释及强化自我的能力。它们内置了世界顶级数据科学家的智慧精华,拥有让数据价值最大化的计算程序,可以模拟数据科学家工作流,肩负着将各行各业的大数据高效率转化为商业价值的使命。
阿姆斯特朗踏上月球时曾经说过:“这是一个人的一小步,却是人类的一大步。”如今,人类凭着对知识无穷尽的渴望与狂热,已经迈出了一步又一步。
数据分析咨询请扫描二维码
数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-26技术技能 - 编程能力: 数据分析师需要掌握至少一门编程语言,如Python、R或SQL。这些语言对于数据处理、建模和分析至关重要。例 ...
2024-11-26数据分析领域涵盖多样性岗位,根据工作职责和技能需求划分。这些角色在企业中扮演关键角色,帮助组织制定战略、优化流程并实现商 ...
2024-11-26数据分析是一种通过收集、处理、解释和展示数据,以获得见解和决策支持的过程。这个领域涉及使用统计学、计算机科学和商业智能等 ...
2024-11-26数据分析领域正日益成为当今商业世界中不可或缺的一环。随着数据量的爆炸式增长,企业越来越需要能够从这些海量信息中提炼出宝贵 ...
2024-11-26数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。在追求这一职业道路上,合适的教育和培训至关重 ...
2024-11-26数据分析师作为当今信息时代中关键的职业之一,扮演着解释、预测和推动决策的重要角色。他们需要多方位技能来处理各种复杂的数据 ...
2024-11-26数据分析师在今天的商业环境中扮演着至关重要的角色。他们需要应对各种复杂的数据分析任务和业务需求,这要求他们具备广泛的技能 ...
2024-11-26在当今快速变化的技术和市场环境中,数字化转型是企业利用数字技术全面重新设计和改造业务的重要过程。这一转型旨在通过整合云计 ...
2024-11-26数字化转型: 是企业在现代技术和市场环境不断变化的背景下,利用数字技术对其业务进行全面的重新设计和改造的过程。其核心目标是 ...
2024-11-26理论基础与高级学习 数学专业理论基础: 学生首先需要掌握数学的基础理论,包括数学分析、高等代数、几何学、常微分方程、实变函 ...
2024-11-26数字化转型:现代企业蜕变的引擎 数字化转型已然成为当今企业持续发展的关键支柱。这一过程并非简单的技术升级,更是涉及企业文 ...
2024-11-26# 数据科学与大数据技术专业学什么?就业前景与行业需求 **数字化转型:引领企业进步的关键** 数字化转型是现代企业发展的必经 ...
2024-11-26理论部分 - 基础数学理论: - 学生首先需要掌握数学的基础理论,包括数学分析、高等代数、几何学、常微分方程等。 - 这些课程 ...
2024-11-26在选择数据科学和大数据技术专业时,了解不同领域的职责和技能需求至关重要。数据治理工程师是这一领域中不可或缺的角色之一,承 ...
2024-11-26基础课程 统计学基础 - 统计学是数据分析的基石,包括概率、假设检验、回归分析等基本知识,有助于理解数据背后的意义。 - ...
2024-11-26数据分析是一门综合性学科,涉及多个领域的知识和技能。要全面掌握数据分析,需要学习以下内容: 基础课程 统计学基础:统计学 ...
2024-11-26数据治理工程师在当今信息时代扮演着至关重要的角色,负责确保组织内数据的质量、安全性和可用性。他们需要具备一系列技能和才能 ...
2024-11-26在当今数字化时代,数据被誉为新的石油,是企业最有价值的资产之一。因此,建立有效的数据战略规划对于企业的成功至关重要。数据 ...
2024-11-26<section id=
2024-11-26