收集航空大数据 靠专利算法推演到秒
当你被困在机场,看着满屏的航班延误信息时,如果有一款手机软件,能为你提供比机场还要详细的航班信息,同时更进一步地帮你查到你的前序航班已经飞到哪里了、航班晚点了多久、航班历史准点率多少……甚至连哪一边的座位更容易晒到太阳都细心告知,这样的软件你会埋单吗?
由于特殊的航路管制等原因,国内航班的准点率并不算高。也正是因为如此,在移动端意外地催生出了一块航班动态信息查询市场。2011年开始,一款叫“飞常准”的软件开始在各类APP榜单、微博上频频现身,到目前已拥有超4000万的客户端下载量及500万的注册客户。
飞常准究竟怎样获取到成千上万条航班实时信息,并迅速向用户通报?它又是如何变成热门软件,乃至于一个成功的商业范本?近日,成都商报记者在飞常准的总部合肥专访了其创始人、飞友科技CEO郑洪峰,为您揭开飞常准的生意经。本组稿件均由成都商报记者 胡沛 采写
飞常准创业如何起步?
主营业务被一封邮件所改变
很少有人知道,作为航空数据业内的“隐形冠军”,飞常准的总部安家在合肥闹市一处普通的写字楼里。进入该总部,在一些门口标注着“商务舱”、“头等舱”等字样的办公室中,桌上摆放了大堆的零食或方便面,显示这一互联网新军并没有那么多条条框框。
让成都商报记者略感意外的是,今年37岁的飞常准创始人郑洪峰并没有一间自己的专属办公室。因为大量时间会用于在外地出差,回到总部后他常常在普通员工的写字间里“打游击”,有时摸出笔记本电脑就直接办公。郑洪峰有着超过10年的民航系统工作经历,为此积攒了大量民航内部人脉以及对数据分析的技能。上周,他刚去了广汉民航飞行学院招聘,为来年数据分析做储备。
“这个网站原先主要用户和访问量来自民航系统内部,注册用户不到100万,主要提供民航新闻。”郑洪峰告诉记者,考虑到未来的发展,自己又创办了合肥飞友网络科技公司,准备打入航空旅客市场。和酷讯、去哪儿等类似,飞友旗下的飞友网原先也打算做一个机票搜索网站,不过网站运营得并不算好,郑洪峰明白,即使自己再努力,也很难将便宜机票搜索引擎快速推广。
“做了两年机票搜索网站之后,感觉做不下去了。之后的路也是被逼出来的。”谈到为何调头做民航数据,郑洪峰告诉记者,曾经有一个投资人给他发来一封邮件,谈到自己坐飞机时遭遇航班严重延误的感受,为此向他建议改做航班动态数据,并坚信这是一个很大市场。这封邮件最终成为郑洪峰事业的转折点。
磨嘴皮近半年 啃下第一家信息源
当时,国外的航班信息提供服务已渐成规模,但国内还没有人开始尝试,唯一能向旅客提供航班动态信息的就只有机场内电子显示屏上滚动的红绿字,以及一些航空公司的官方网站。由于航班信息往往散落在民航各个组成部分,如机场、航空公司、空管部门,这样北京的机场只知道北京的航班信息,上海的机场也只能知道上海的航班信息,这些信息之间基本相互割裂。
“早期业内曾经流传着一个段子,说飞常准派了几十个人,到全国各大机场的候机楼里,盯着大屏幕一个一个抄录数据。”郑洪峰介绍说,实际上自己是拿出上门“磨嘴皮”的绝招,到各家航空公司寻求资源的共享。“好在大家知道我是系统内部人士,做了很多年的民航资源网,不会出格,所以到处拜访的时候没有直接吃闭门羹。”
即使如此,第一家“拿下”的山东航空公司也花去了近半年时间,其间屡挫屡战,直到签下了一份一寸厚的安全“军令状”并保证信息不外泄,才算合作成功。此后后,其他航空公司、机场、空管也陆续向飞常准敞开大门。
航空大数据如何应用?
大看飞机“身份证”
小览配餐、关舱时间
经历起步阶段之后,现在的飞常准不仅能告诉用户所乘的机型是哪种、机龄有多少年,还能给出前面有几架飞机在跑道排队等待起飞这类“神秘”信息。那么飞常准的数据来源有哪些呢?
与想象中炫目的数据研发车间不同,在飞常准合肥总部普普通通的办公室中,数十台电脑联通服务器可以堪称民航数据的集散中心。显示器上翻滚的绿色底层数据处理代码每一秒钟就带来近百个航班的数据更新,而远在千里之外的北京,近两百台服务器正源源不断为合肥总部的数据团队提供全球各地的航班动态原始数据。
郑洪峰为成都商报记者现场演示了“飞常准”如何使用相关数据:一种是从空管局、航空公司、机场等处获得的气象、航班、空域流量等数据。“现在飞机操控都数字化了,航空公司通过飞机通信寻址与报告系统能自动获得实时数据,包含位置、速度、高度以及在高空中的天气状况,这些数据有的是公开发布的,有些则需要购买或交换,交换条件包括为航空公司设计网页、后台运营、做大数据分析报告等。”另一种则是由飞常准自建渠道,在全国20多个机场合作搭建“基站”,监控区域内所有飞机的飞行轨迹,这也作为前一种数据的补充。
郑洪峰用笔记本电脑里的后台运行系统向记者演示,核心的数据主要有三大系统:其一是每天从航空公司、机场、空管三方获取的最新航班时刻表,包括航班号、出发地、目的地、计划起飞、计划到达、实际起飞、实际到达、行李转盘、到达口、气象、航路等近20个报文数据;其二是国内飞机的编号库,就像每一个汽车有牌照一样,民航飞机都有自己的身份证;其三也是飞常准最核心的技能———航班动态的数据分析。“飞常准从航空公司那里拿到哪一个飞机执飞的信息,我们就要将飞机匹配到执行的航班。”这样,大到飞机编号,小到最后飞机配餐或关舱门的时间,飞常准都能获得相关数据。
20个进程精确到秒
登机前测准起飞时间
有了这些原始数据还远远不够,如何加工才是飞常准的核心技能所在。目前,飞友科技团队数据处理部门有近20人,他们要专门对未加工原始数据和自己计算的数据等进行再加工,以生产出更多符合市场需要的数据产品。按照郑洪峰的说法,目前飞常准的精准度高于航空公司公布的数据,精准度在92%以上,而这套算法目前已获得了专利。
“对旅客而言,重要的是知道最新的预计起飞时间。”郑洪峰以一套计算延误时间以及新预计起飞时间的操作过程举例:首先,要知道执飞该航班的飞机是否已到达起飞机场,如果已抵达,那么需要考虑起飞机场和目的地机场的天气和流量状况,还要考虑飞机加油、配餐、打扫卫生等多个因素;如果前段航班未抵达,则要根据飞机的关联航班来判断前序航班对后续航班的影响。如果天气和流控因素都正常,那么只需考虑机场当前的出港率(平均每架飞机的起飞时间)和排队等候起飞的飞机数量,将两者相乘,大致就能计算出目标航班的起飞时间了。
在后台保障系统中,飞常准技术总监朱睿随手打开一个11月27日的航班动态,成都经停昆明飞芒市的航班进程保障系统一目了然:该航班中午11:50在昆明落地后,到达机位、上轮档、靠桥、开客舱、开货舱、保洁开始至结束总共花去8分46秒,算上加清水、排污、机组到位、加油完成,总共花去11分30秒,截至配餐完成共花去31分52秒,随后关客舱门、关货舱门、离桥、撤轮档、起飞等数据陆续滚动,共20个进程一一呈现,最终这架飞机在12:53关上舱门。而此前经过系列计算,飞常准在旅客登机之前,就预计起飞时间在12:53左右,差距基本不超过两分钟。“这套算法是长期经验累积的结果。”
不过即使在这样精细的“数据加工车间”中,面对海量的数据,因为数据很多不透明,信息共享不完善,有些还需要人工处理。比如某一航班预计起飞时间是6:50,但因为当地大雾,直到上午10:34才起飞。飞常准数据团队提前从系统中获得了机场天气异常的告警信息,预测前序航班要晚到3个多小时,后续航班的计划起飞时间可能延迟。“一份航班数据,至少要通过两个以上的渠道确认才敢用,然后再用一套数学模型去计算航班的预计起飞和到达时间。我们有专门的15人的人工数据团队,当数据出现冲突时,比如机场和航空公司同一个报文不一样,这时需要人工介入去校验,并通过信息通报群或者电话来进行确认。”
航班信息APP市场三国杀
目前在航班动态查询APP(应用软件)可谓三分天下,除了“飞常准”外,号称拥有4000万用户的“航班管家”和带有官方背景的“航旅纵横”也加入了市场争夺。
记者注意到,航班管家、飞常准、航旅纵横三款APP应用的核心业务虽然都是为用户提供即时的航班信息,但三家各有侧重:航班管家提供机票搜索、预订以及详细机场攻略,意在通过综合的航班、机场信息帮助用户做出航旅决策;飞常准从“准”字切入,强调信息的及时和准确;航旅纵横则依靠中航信的优势掌握着用户行程信息,旅客只要输入身份证号,全部行程就会呈现在手机上,并可在APP上选座,甚至通过手机二维码登机。不过,后者最大的优势也引发业界对旅客信息隐私权的担忧。
“飞常准”创始人郑洪峰在接受记者采访时表示,飞常准的优势在于航班动态数据分析,飞常准的预计起飞时间预测的准确率高于航空公司的准确率。他坦言,在交互性上还落后于对手,不过他认为,中航信的数据只局限于在中国的航空公司,而从去年开始,飞常准已经在筹划全球的航班动态数据了,目前每天更新全球超过98万个航班信息,可以提供接近全球总计航班近8成的数据。
而航班管家目前也已“转型”,两年前就加入航空公司的直销票资源,而保险、旅行、酒店、租车等业务也被整合到服务体系中去。航班管家一位负责人表示,动态数据主要来自于国家空管局的授权,还有一部分和航空公司和航空类企业合作,但航班动态数据仅是其业务的一部分。“机票和酒店销售收入基本能占公司收入的95%以上,未来的利润增长点在与出行有关的服务中。”
手握数据为王的利器,郑洪峰说,从飞常准诞生至今,他最简单的愿望就是让老百姓能知道自己航班的时间,并由此促成民航数据的开放。这一成就已经让飞常准有了足够的收益。“我并不追求让飞常准拥有十八般武艺,但要查询航班动态信息,或者遇到航班延误时,想到我们就好。”郑洪峰告诉成都商报记者,“现在飞常准是盈利的,大概一年能翻一番。今年有投资机构找我们想上新三板,飞常准所有的条件都已经符合,但我认为这个市场不足够大,而且飞常准的核心业务肯定不是资本运作,还是要安心把数据业务做好。”
郑洪峰表示,飞常准主要针对B客户,像携程网、招行、淘宝等,有上千家客户正使用其航班动态大数据和数据分析服务,这是主要的收入来源。另外还有C客户,也就是普通的软件使用者。“我们在尝试广告模式,另外通过租车、保险等增值服务拓宽盈利模式。”
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30能源企业在全球经济和环境保护双重压力下,正面临前所未有的挑战与机遇。数字化转型作为应对这些挑战的关键手段,正在深刻变革传 ...
2024-10-30近年来,随着数据科学的逐步发展,Python语言的使用率也越来越高,不仅可以做数据处理,网页开发,更是数据科学、机器学习、深度 ...
2024-10-30大数据分析师证书 针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。 ...
2024-10-30《Python数据分析极简入门》 附:Anaconda安装教程 注:分Windows系统下安装和MacOS系统安装 1. Windows系统下安装 第一步清华大 ...
2024-10-29拥抱数据分析的世界 - 成为一名数据分析工程师是一个充满挑战和机遇的职业选择。要成功地进入这个领域,你需要掌握一系列关键技 ...
2024-10-28降本增效:管理战略的关键 企业管理中的降本增效不仅是一项重要的战略举措,更是激发竞争力、提高盈利能力的关键。这一理念在当 ...
2024-10-28企业数字化是指利用数字技术和信息化手段,对企业的各个方面进行改造和优化,以提升生产效率、服务质量和市场竞争力的过程。实现 ...
2024-10-28数据科学专业毕业后,毕业生可以选择从事多种不同的岗位和领域。数据科学是一个快速发展且广泛应用的领域,毕业生在企业、学术界 ...
2024-10-28学习数据科学与大数据技术是当今职业发展中至关重要的一环。从基础到高级,以下是一些建议的课程路径: 基础课程: Python编程 ...
2024-10-28在信息技术和数据科学领域,数据架构师扮演着至关重要的角色。他们负责设计和管理企业中复杂的数据基础设施,以支持数据驱动的决 ...
2024-10-28进入21世纪以来,随着信息技术的迅猛发展,大数据已经成为全球最具影响力的技术之一,并成为企业数字化转型的核心驱动力。大数据 ...
2024-10-28随着科技的迅猛发展,数字化转型已成为现代企业保持竞争力和推动增长的关键战略之一。数字化不仅仅是技术的应用,它代表着一种全 ...
2024-10-28银行业正处于一个前所未有的数字化转型时期。在数字经济的驱动下,金融科技如大数据、人工智能、生物识别、物联网和云计算等技术 ...
2024-10-28数据分析可视化是一门艺术与科学相结合的技术,其主要目标是将复杂的数据变得更易于理解和分析。通过将数据以图表的形式呈现,我 ...
2024-10-28数据分析师在现代信息密集型的商业世界中扮演着至关重要的角色。他们通过专业的技能和敏锐的商业洞察力,帮助企业从大量数据中提 ...
2024-10-28