工业制造中的大数据分析
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,是人们设法收集并弄清楚不断变化的数据类型。如果只是大量采集同一类型的数据,再大的数据量都不能称之为大数据。
如何实现智能制造是大家都关心的问题。从哈佛商学院的迈克尔·波特到宾夕法尼亚大学沃顿商学院,有一个普遍的共识,即数字化转型是智能制造实现的途径。重要的是,这个共识也来自于众多的世界级制造业企业与企业家们。
这一共识是基于无数技术趋势的融合,例如,物联网、赛博系统(CPS)、工业物联网、移动技术、人工智能、云计算、虚拟/虚拟增强现实(VR/AR),以及大数据分析等。我们一定要保持清醒,不要简单地认为有了这些技术,未来五年就是制造业的黄金时期。道理很简单,这个新制造业文化的变革进程是相当复杂和艰难的,没有行业、企业与用户的融合推进,无法实现这次变革。数字化转型不仅仅意味着企业简单的数字化,而是把数字作为智能制造的核心驱动力,利用数据去整合产业链和价值链。
自工业革命以来,为了改进运营,制造商一直以来都在有意地采集并存储数据。随着时间的推移,数据在制造业分析的需求将越来越大。然而在过去的许多年间,利用数据的根本动因并没有改变,数据的复杂性增强,数据转化为情报的能力越来越大。
2012年高德纳给出大数据定义,其中特别强调大数据是多样化信息资产,不仅关注实际数据,更关注大数据处理方法。数据量大小本身并不是判断大数据价值的核心指标,而数据的实时性和多元性对大数据的定义和价值更具直接的影响。
在讨论工业大数据分析的时候,我注意到两种不同的观点:
第一种观点认为,制造业向来都有大数据。几十年来我们的企业一直在通过历史记录、MES、ERP、EAM等各种应用系统采集数据。在部分产业链环节,特别在市场营销方面,大数据算是一个新的热词。
第二种观点认为,从工业大数据角度看,制造业是一个尚未打开的市场或刚刚开启的市场。存在大量不同类型的数据,但如今它们还未被应用到分析之中。
考虑到这些观点,面对任何新的市场提法,包括名词解释、定义或分析框架,我们始终都应该保持适当的怀疑精神。这里我更多倾向于第二个观点。我们的制造业的确有“大量数据”,但这并不是我们大多数人从市场上所理解的“大数据”涵义。在搞清楚工业大数据分析之前,我们应该如何定义制造业的大数据?这里可以通过大数据的三个特性,进一步了解大数据的特性。
数据来源
工业大数据的主要来源有两个,第一是智能设备。普适计算有很大的空间,现代工人可以带一个普适感应器等设备来参加生产和管理。 所以工业数据源是280亿左右大量设备之间的关联,这个是我们未来需要去采集的数据源之一。
第二个数据来源于人类轨迹产生的数据,包括在现代工业制造链中,从采购、生产、物流与销售内部流程以及外部互联网信息等。通过行为轨迹数据与设备数据的结合,大数据可以帮助我们实现对客户的分析和挖掘,它的应用场景包括了实时核心交易、服务、后台服务等。
数据关系
数据必须要放到相应的环境中分析,才能了解数据之间的关系。譬如,每一款新机型在交付给航空公司之前都会接受一系列残酷的飞行测试。极端天气测试就是测试之一。该测试的目的是为了确保飞机的发动机、材料和控制系统能在极端天气条件下正常运行。
问题的处理关键在于找到可能产生问题的根源,消除已知错误,并确保解决方案的可靠有效。一旦找到并确定了根本原因,同时具备了可接受的应急措施,就可把问题当成一个已知错误来处理。问题调查的过程一定需要收集所有可用、与事件相关的信息,以确定并消除引起事件和问题的根本原因。数据采集与分析必须要事件/问题发生的环境数据结合。
数据价值
对于数字化转型,大数据不仅要关注实际数据量的多少,最重要的是关注大数据的处理方法在特定场合的应用,让数据产生巨大的创新价值。如果离开了收益考虑或投资回报(ROI)的设计,一味寻求大数据,则大数据分析既无法落地也无法为企业创造价值。
工业大数据分析的定义
发动机是飞机的心脏,也是关乎航空安全,生命安全的重中之重。为了实时监控发动机的状况,现代民航大多安装了飞机发动机健康管理系统。通过传感器、发射系统、信号接收系统、信号分析系统等方式采集到的数据,会经由飞机通信寻址与报告系统,通过甚高频或者卫星通信传输出来,这就是为何GE的发动机监控系统每天会获取超过1PB数据的原因。
生产执行系统(MES)与飞机发动机健康管理系统如出一辙。我们可以从工厂的生产中,实时采集到海量的流程变量、测量结果等数据。基于大量数据集而生成的报表,或是基础统计的分析并不足以称为制造业的大数据分析。
数据类型的多样性是工业大数据分析的重要属性
大数据不仅仅是大量的数据的堆积。大数据的重要属性之一,是人们设法收集并弄清楚不断变化的数据类型。如果只是大量采集同一类型的数据,再大的数据量都不能称之为大数据。
例如,生产环境中收集的时间序列模拟流程变量,数据的类型是单一的,很容易建立索引,即使存在千千万万,也不足以成为大数据。
数据必须包括高度可变性和种类多样性。制造工厂中存在无数的大数据应用,但并不包括简单地分类和展示一连串的流程测量结果,对这些工作,基本的统计展现就可以完成。一些大数据的数据库或数据湖的构成部分也是文本信息、图像数据、地理或地质信息和非结构信息,例如,通过社交媒体或其他协作平台获得的数据类型。
制造业信息结构概括起来分为两层,一个是管理层,一个是自动化层。从经营管理、生产执行与控制三个纬度来实现决策支持、管理、生产执行、过程控制以及设备的连接与传感。制造业中大数据分析是指利用通用的数据模型, 将管理层与自动化层的结构性系统数据与非结构性数据结合,进而通过先进的分析工具发现新的洞见。
大数据分析对企业生产智能的意义
制造业创新的核心就是要依托大量的前沿科技。先进的技术是创新的手段。在新技术的支持下,可以通过一体化的制造运作管理系统MOM将企业管理应用系统,例如ERP、EAM等系统与工业自动化的相关系统整合为一体。在一体化制造运作管理的基础上,我们可以实现集IT+MOM+MES+BI的一体化制造企业信息系统解决方案。
从两化融合的角度来看,信息系统供应商要从企业的主信息系统提供商(MIV,Main Information systems Vendor
)定位来做好规划、标准、功能设计、实施策略的统一性工作。 协助企业做好风险控制,降低投资,降低操作维护成本,实现企业信息系统全集成。
特别需要注意的是,企业管理信息平台被普遍认为是制造企业管理的集成和仪表板工具。 许多供应商既大量投资其与ERP和自动化系统专有的集成,也投资开放式集成,还投资仪表板和移动技术,希望随时随地为需要正确信息的决策者提供衡量标准。
制造业大数据分析的三种途径
途径一,利用开放技术与平台,将任何系统的数据移动到任何其他地方。
制造运作管理系统建设项目是系统工程,不仅仅是一套我们理解的传统软件系统,更多的是项目执行和服务的平台。 这需要在项目管理与制造企业的策略“客户服务”上,体现出制造企业的综合管理能力与软实力。
整个平台要从前期、工程实施以及售后服务这三个大的阶段来架构。在前期规划中,要重视标准、设计与实施,特别是与管理一体化的信息系统形成统一的对接。有了前期统一规划的制定,工程实施的环节可把行业的经验、集成能力、实施能力、软件开发能力等融合。特别需要在组织上建立和形成超级团队的制度。而持续服务、长期经营,将物联网应用融入与“软件+云服务”的互联网+战略是后续服务的考虑重点。
在制造业大数据分析工作中,必须要加强通过物联网科技的应用对后续持续服务的支撑作业。通过工业物联网,实现的及时响应客户、物联网软硬件系统定期巡检、提供应急备件、提供易耗品、完善应用等功能来加强和锁定与企业的供应链企业之间的长期合作。通过管理平台与物联网数据,可以持续为客户提供有价值的服务。
途径二,投资工厂内外系统架构堆栈中能够处理结构性和非结构性数据的数据模型。
新技术是创新革命的核心,其中很重要一个特点就是集成,即制造运作管理系统MOM与ERP、EAM、OA、商业分析的集成,包括一键登录、界面集成、消息推送、工作流集成、主数据、应用集成总线与平台。
由于这些系统之间主数据全部统一,所有系统之间的数据交互依靠应用系统总线进行数据交互,整合了跨系统的业务流程、工作流、服务流程等之后即实现无缝集成和分析。对于企业管理者来说,一键登录后,可以根据不同的岗位,个性化制定并且显示与管理最相关的必要信息。这就是互联网所带给我们的分享思路。
途径三,通过时间序列、图像、视频、机器学习、地理空间、预测模型、优化、模拟和统计过程控制等先进的分析工具与制造业企业内的大数据平台结合分析,从而洞见尚未显现的情况。通过传感器、感应器、传输网络和应用软件等物联网数据,与管理应用软件结合起来,将是今后制造业大数据分析的一大方向。
培养企业内部大数据分析专家
作为一个行业,我们需要有机地发展行业特定的大数据分析工具集,这样才能让现在的行业专家,从足够的数据科学中实现数字化转型。为了推动转型,我们需要一大批优秀的企业利用这种方法,并向其他人或同行证明其价值。
正如六西格玛管理技能不是由技术和咨询公司出售给该行业的,而是由领先的公司(GE)开发并向全球进行推广的。提倡工业大数据分析应用的发展也可以借鉴并采用类似的方法。
美国硅谷的Cisco (思科)是网络设备与解决方案的巨头,仅仅在供应链环节,现在就拥有近80名数据科学家。而这些数据科学家都是通过两年的内部训练项目成长起来的。类似Cisco的做法现在越来越成为趋势,其主要的原因是因为团队已开始提供强大的投资回报。
中国的制造业企业为了成功实践智能制造,要通过组织培养自己的数据科学团队,行业领先的企业需要扩大合作,努力做到以下四点:
参与并为大数据分析专门术语建立通用的行业语言,包括:工具、方法等。
为已证实的行业大数据分析工具建立工业特定框架与理论,以映射各个使用案例。
为确定使用案例、预估潜在的经济效益和追踪实际的经济效益建立通用的方法。
利用互联网科技,建立通用的培训和认证项目,帮助发展和创造新的人力资本。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21