民机客服工程的大数据应用
大数据技术正深刻影响着民机产业链的上下游,工业大数据缘起国外,在民机领域大数据应用发展较快,而在国内民机客服工程领域也有所突破。
大数据属于数量大 (Volume)、输入和处理速度快 (Velocity)、数据多样性 (Variety)和价值密度低 (Value) 的复杂、海量信息,无法用传统工具处理分析。大数据可分为三类:一是社交类数据,记录用户行为、反馈数据等;二是商业类数据,包括消费者数据、ERP数据、库存数据以及账目数据等;三是工业类数据,又称机器和传感器数据,包括智能仪表、工业设备传感器、呼叫记录、设备日志等。
目前工业大数据形成了以“工业互联网”为代表的美国模式、“工业4.0”为代表的德国模式和“两化融合”、“互联网 ”为代表的中国模式。
工业大数据作为大数据体系的分支,与其既有共通性,又有特殊性。在共通性方面,都是基于海量数据、分析技术和大数据思维三要素,"数据分析师"以预测为核心,以模型和算法为关键。
客服工程数字化的内在驱动是大数据
当前的民用客机研制不但在传统工程技术体系内追求突破创新,更注重从服务客户角度对产品设计方案实施再开发,即“民机客服工程”。客服工程是对产品定义的开发补充,是对产品使用性能的技术创意,它把产品操作和维修等固有特性转化为外在表现,从而构建起产品全生命周期持续安全健康运行的基础。从技术角度看,民机客服工程更多地使用数理统计和逻辑判断工具,更注重大数据在飞行效率、健康管理等领域的应用。
大数据应用的关键技术分析
数据分析师从数据源获取到产生最终价值,一般经过数据的采集准备、存储管理、计算处理、数据分析和知识展现等五个主要环节。相对于传统挖掘技术,大数据分析的技术突破主要集中在存储管理、计算处理和数据分析三个核心环节。在民机应用方面,又涉及工业物联网、航空电信网等关键技术。
"数据分析师"面对海量数据,传统存储技术一方面是存储和计算物理分离、易受I/O瓶颈制约,另一方面是数据数据冗余、扩展、容错和并发读写能力不足。谷歌文件系统(GFS)和Hadoop分布式文件系统(HDFS)在物理上将计算和存储节点结合在一起,避免了数据密集计算时的I/O堵塞;采取分布式存储架构,以提高并发访问能力,在大文件存储上的表现优异。随着应用和需求的发展,内存型数据库在提高随机、海量小文件频繁读写方面表现优异。
传统关系型数据库采取结构化数据管理方式,优点是数据一致性强,缺点是容差性、并发性较弱。谷歌Big Table和HadoopHBase等新型非关系数据库(NoSQL)通过“键-值”(Key-Value)对、文件等非二维表,提供了处理多源多类非结构化数据的解决方案,由于只关注结果一致性,不追求过程一致性,效率也充分提升。谷歌推出Spanner数据库,可在全球部署100万~1000万台服务器的超大存储系统,通过原子钟进行全局精确同步,在非关系型数据库基础上实现一致性,同时还支持SQL接口,体现两种数据管理技术融合发展的方向。
并行计算关键技术
传统高性能计算的特点是“数据简单、算法复杂”,大数据是典型的数据密集型计算,更重视计算单元和存储单元间的吞吐率。谷歌的MapReduce并行计算技术,通过廉价通用服务器组建系统、添加服务器节点线性扩展系统处理能力,成为应用最为广泛的大数据计算平台。基于MapReduce,业界又发展出多种并行计算技术:一是“边到达边计算”的流计算,如Yahoo的S4和Twitter的Storm;二是针对大规模图数据进行优化的图计算,如谷歌的Pregel;三是将MapReduce内存化以提高实时性的内存批计算, Spark;四是可秒级处理PB级数据的快速交互分析,如谷歌的Dremel。2013年,Hadoop社区推出的将任务调度和资源管理分离、适合多种计算模型的通用MapReduce架构YARN,现已发展成为大数据计算平台的公认标准。
大数据分析技术路线先凭借先验知识人工建立数学模型分析、而后通过大量样本数据进行机器学习。2006 年,谷歌等公司提出增加人工神经网络层数和神经元节点数量,构建深度神经网络以提高训练效果,并在后续试验中得到证实。基于深度神经网络的机器学习技术在语音识别和图像识别等方面取得了较好效果。
工业物联网
工业大数据离不开工业物联网的支撑。第一代工业物联网以模拟信号单向传递为主,布线复杂、抗干扰性差。第二代工业物联网以数字分布式控制系统为代表,信号精度提高但网络实时性和稳定性不足。第三代工业物联网突出现场总线控制,采用全数字、开放式双向通信网络将各控制器与设备互连,而更为便捷、低廉的工业以太网已开始取代现场总线技术。第四代工业物联网的特点是无线传感和通信,突破传统分层控制体系,形成制造、管理、分析、服务的全网一体化架构,同时还具备现场设备感知、实时微处理微计算、微秒级快速响应和复杂环境下稳定传输等能力。
航空电信网
航空电信网(ATN )是基于国际标准公共接口服务和协议,集成地面、地空和航空等多种数据子网,以实现统一数据传输服务的全球空地一体化航空专用通信网络。ATN最大的转变是从面向字符传输到面向比特传输,是未来实现航空大数据实时分析的基础通信保障。ATN主要由通信子网、ATN路由器和终端系统组成。其中ATN通信子网一般由机上子网、空地子网(如甚高频地空数据链、二次雷达S模式、 卫星通信、高频地空数据链等)和地面子网三种形式的数据通信网络组成。而ATN异质网际间的数据传输,则由ATN路由器实现。cda数据分析师培训
数据分析咨询请扫描二维码
需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21数据分析作为一个备受追捧的职业领域,吸引着越来越多的女性加入其中。对于女生而言,在选择成为一名数据分析师时,行业选择至关 ...
2024-11-21大数据技术专业主要学习计算机科学、数学、统计学和信息技术等领域的基础理论和技能,旨在培养具备大数据处理、分析和应用能力的 ...
2024-11-21《Python数据分析极简入门》 第2节 3 Pandas数据查看 这里我们创建一个DataFrame命名为df: importnumpyasnpi ...
2024-11-21越老越吃香的行业主要集中在需要长时间经验积累和专业知识的领域。这些行业通常知识更新换代较慢,因此随着年龄的增长,从业者能 ...
2024-11-20数据导入 使用pandas库的read_csv()函数读取CSV文件或使用read_excel()函数读取Excel文件。 支持处理不同格式数据,可指定分隔 ...
2024-11-20大数据与会计专业是一门结合了大数据分析技术和会计财务理论知识的新型复合型学科,旨在培养能够适应现代会计业务新特征的高层次 ...
2024-11-20要成为一名数据分析师,需要掌握一系列硬技能和软技能。以下是成为数据分析师所需的关键技能: 统计学基础 理解基本的统计概念 ...
2024-11-20是的,Python可以用于数据分析。Python在数据分析领域非常流行,因为它拥有丰富的库和工具,能够高效地处理从数据清洗到可视化的 ...
2024-11-20在这个数据驱动的时代,数据分析师的角色变得愈发不可或缺。他们承担着帮助企业从数据中提取有价值信息的责任,而这些信息可以大 ...
2024-11-20数据分析作为现代信息时代的支柱之一,已经成为各行业不可或缺的工具。无论是在商业、科研还是日常决策中,数据分析都扮演着至关 ...
2024-11-20数字化转型已成为当今商业世界的热点话题。它不仅代表着技术的提升,还涉及企业业务流程、组织结构和文化的深层次变革。理解数字 ...
2024-11-20