民机客服工程的大数据应用
大数据技术正深刻影响着民机产业链的上下游,工业大数据缘起国外,在民机领域大数据应用发展较快,而在国内民机客服工程领域也有所突破。
大数据属于数量大 (Volume)、输入和处理速度快 (Velocity)、数据多样性 (Variety)和价值密度低 (Value) 的复杂、海量信息,无法用传统工具处理分析。大数据可分为三类:一是社交类数据,记录用户行为、反馈数据等;二是商业类数据,包括消费者数据、ERP数据、库存数据以及账目数据等;三是工业类数据,又称机器和传感器数据,包括智能仪表、工业设备传感器、呼叫记录、设备日志等。
目前工业大数据形成了以“工业互联网”为代表的美国模式、“工业4.0”为代表的德国模式和“两化融合”、“互联网 ”为代表的中国模式。
工业大数据作为大数据体系的分支,与其既有共通性,又有特殊性。在共通性方面,都是基于海量数据、分析技术和大数据思维三要素,"数据分析师"以预测为核心,以模型和算法为关键。
客服工程数字化的内在驱动是大数据
当前的民用客机研制不但在传统工程技术体系内追求突破创新,更注重从服务客户角度对产品设计方案实施再开发,即“民机客服工程”。客服工程是对产品定义的开发补充,是对产品使用性能的技术创意,它把产品操作和维修等固有特性转化为外在表现,从而构建起产品全生命周期持续安全健康运行的基础。从技术角度看,民机客服工程更多地使用数理统计和逻辑判断工具,更注重大数据在飞行效率、健康管理等领域的应用。
大数据应用的关键技术分析
数据分析师从数据源获取到产生最终价值,一般经过数据的采集准备、存储管理、计算处理、数据分析和知识展现等五个主要环节。相对于传统挖掘技术,大数据分析的技术突破主要集中在存储管理、计算处理和数据分析三个核心环节。在民机应用方面,又涉及工业物联网、航空电信网等关键技术。
"数据分析师"面对海量数据,传统存储技术一方面是存储和计算物理分离、易受I/O瓶颈制约,另一方面是数据数据冗余、扩展、容错和并发读写能力不足。谷歌文件系统(GFS)和Hadoop分布式文件系统(HDFS)在物理上将计算和存储节点结合在一起,避免了数据密集计算时的I/O堵塞;采取分布式存储架构,以提高并发访问能力,在大文件存储上的表现优异。随着应用和需求的发展,内存型数据库在提高随机、海量小文件频繁读写方面表现优异。
传统关系型数据库采取结构化数据管理方式,优点是数据一致性强,缺点是容差性、并发性较弱。谷歌Big Table和HadoopHBase等新型非关系数据库(NoSQL)通过“键-值”(Key-Value)对、文件等非二维表,提供了处理多源多类非结构化数据的解决方案,由于只关注结果一致性,不追求过程一致性,效率也充分提升。谷歌推出Spanner数据库,可在全球部署100万~1000万台服务器的超大存储系统,通过原子钟进行全局精确同步,在非关系型数据库基础上实现一致性,同时还支持SQL接口,体现两种数据管理技术融合发展的方向。
并行计算关键技术
传统高性能计算的特点是“数据简单、算法复杂”,大数据是典型的数据密集型计算,更重视计算单元和存储单元间的吞吐率。谷歌的MapReduce并行计算技术,通过廉价通用服务器组建系统、添加服务器节点线性扩展系统处理能力,成为应用最为广泛的大数据计算平台。基于MapReduce,业界又发展出多种并行计算技术:一是“边到达边计算”的流计算,如Yahoo的S4和Twitter的Storm;二是针对大规模图数据进行优化的图计算,如谷歌的Pregel;三是将MapReduce内存化以提高实时性的内存批计算, Spark;四是可秒级处理PB级数据的快速交互分析,如谷歌的Dremel。2013年,Hadoop社区推出的将任务调度和资源管理分离、适合多种计算模型的通用MapReduce架构YARN,现已发展成为大数据计算平台的公认标准。
大数据分析技术路线先凭借先验知识人工建立数学模型分析、而后通过大量样本数据进行机器学习。2006 年,谷歌等公司提出增加人工神经网络层数和神经元节点数量,构建深度神经网络以提高训练效果,并在后续试验中得到证实。基于深度神经网络的机器学习技术在语音识别和图像识别等方面取得了较好效果。
工业物联网
工业大数据离不开工业物联网的支撑。第一代工业物联网以模拟信号单向传递为主,布线复杂、抗干扰性差。第二代工业物联网以数字分布式控制系统为代表,信号精度提高但网络实时性和稳定性不足。第三代工业物联网突出现场总线控制,采用全数字、开放式双向通信网络将各控制器与设备互连,而更为便捷、低廉的工业以太网已开始取代现场总线技术。第四代工业物联网的特点是无线传感和通信,突破传统分层控制体系,形成制造、管理、分析、服务的全网一体化架构,同时还具备现场设备感知、实时微处理微计算、微秒级快速响应和复杂环境下稳定传输等能力。
航空电信网
航空电信网(ATN )是基于国际标准公共接口服务和协议,集成地面、地空和航空等多种数据子网,以实现统一数据传输服务的全球空地一体化航空专用通信网络。ATN最大的转变是从面向字符传输到面向比特传输,是未来实现航空大数据实时分析的基础通信保障。ATN主要由通信子网、ATN路由器和终端系统组成。其中ATN通信子网一般由机上子网、空地子网(如甚高频地空数据链、二次雷达S模式、 卫星通信、高频地空数据链等)和地面子网三种形式的数据通信网络组成。而ATN异质网际间的数据传输,则由ATN路由器实现。cda数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11随着数字化转型的加速,企业积累了海量数据,如何从这些数据中挖掘有价值的信息,成为企业提升竞争力的关键。CDA认证考试体系应 ...
2025-03-10