 京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
 京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		大数据与装备体系的概念关联机理和模型结构
大数据带来了数据采集、存储和信息检索等方面信息技术的重大变化,触发人类从海量信息中获取与个人或组织活动、动作相关知识的应用理论技术的变革性思考。2012年美国提出“大数据研发计划”,国内召开大数据为主题的香山科学工作会议,将大数据推向学术和科技战略前沿。大数据中的数据一般指数字化数据,模拟化数据通过数字化转化而被利用,主要可以归纳为人类自身社会性活动产生的行为交互等应用记录数据和机器本身产生的诸如点击流、应用记录、传感器探测数据等机器数据。多领域多学科对大数据概念的热议难以形成一致性定义描述。对于不能够被清晰定义的事物,通常很难被实证研究,大数据尤为如此,越来越多的学者认为利用大数据重在创新数据思维。目前被普遍认可的大数据概念基本内涵是由IBM,IDC,Gartner等权威机构形成的基本观点,“大数据”蕴含以下五个维度特征:①DataVolume,描述数据存储单位的测度;②Datavariety,描述数字化数据存在形式的多样性,大数据的核心是半结构化和非结构化形式数据类型;③Datavelocity,描述数据产生或更新的速度与对数据的处理速度效率;④Datavariability,描述随时间变化而产生的数据流的不一致性;⑤DataComplexity,描述相同事物的数据存在多种来源而导致相互之间的关联,匹配,清洗,跨系统的转换等问题困难,已经成为大数据的核心特征和焦点。大数据也同时内在地蕴含Hadoop、NoSQL等新型数据管理和处理工具。上述大数据特征逐渐引导人们思考数据的可用性、可靠性、可描述表示和可计算等大数据问题,文献[4]指出大数据的价值需要依赖上下文应用环境和数据描述表示手段来释放,应该不断理解利用新的数据源可以做什么,并归纳为3种主要类型:①可追溯性的数据分析过程,利用历史积累的数据和具体的量化工具理解数据中的模式和结果,提供推断或推论;②可预测性的数据分析过程,利用历史数据和仿真模型手段来产生对未来情境的理解;③规定性的数据分析过程,利用时刻有可能触发事件的实时数据和规定的量化分析方法,产生推荐动作建议。
大数据研究大致存在两种技术层次:一种是云计算环境下以网络信息技术和数据存储管理与数据密集型高性能处理分析为核心技术特征,不断应对新数据源特性的数据有效管理为目标,解决系统综合集成与性能优化问题,例如杨小牛提出的大数据概念应用于构造下一代信号情报侦察体系的系统架构,云环境下大规模图数据处理等;另一种是利用人工智能的海量数据挖掘延伸视角下以模式信息智能处理和知识发现为核心技术特征,以利用数据价值为目标,解决网络化复杂巨系统的价值提升和运行机理认知问题,例如位置大数据应用,基于互联网的社会网络大数据对社会认知研究范式的思考等。显然,上述两种层次存在递进、相互融合和转换,第一种立足于大数据概念的海量数据实体面向数据工程化建设,第二种立足于大数据概念深化复杂系统理论方法及实践应用,两种层次在微观和宏观范畴之间相互转换并且技术互相贯通支撑,如下图所示。
图1大数据概念与大规模网络化信息系统研究的结合模式
事实上,以数据密集型计算技术为核心要素的大数据第四范式的涌现与建模仿真第三范式存在紧密联系,大数据将对建模与仿真带来挑战和机遇。应用大数据概念首先要清楚哪些数据源能够被利用,应该清楚预期应用目标。结合上述对大数据应用分析,大数据概念在装备体系领域可能存在如下三种应用场景:①考虑真实作战环境中装备体系数据流特性的大数据概念应用,对应上述第一种技术层次,主要以解决系统级大数据处理面临的困难为目标,例如对侦察卫星持续获取的侦察情报数据的快速有效处理;②考虑装备体系模型仿真或演习产生的大数据应用,在相似数据的基础上依赖数据挖掘发现体系性质规律;③综合上述两种应用场景,大数据概念框架下潜在的动态数据驱动的体系仿真应用范型。例如,在非对称性、对抗性、极恶劣作战环境中,由于信息获取节点遭受攻击,决策或控制环节失误导致战场态势由优势转为劣势等危机情境,如何利用有限获取的稀疏战场动态信息,全面掌握战场装备体系的整体性状态,以支持高层次的战役或战略判断等方面的可能问题情景,能否借鉴数据驱动的复杂网络的识别与控制方面前沿学术思想。
既有研究工作集中在前两种大数据概念应用场景,均不能正面反映装备体系的机制机理和概念原理。鉴于此,本文深入梳理如何建立大数据与装备体系研究之间的理论桥梁,探讨一种基于大数据建模的装备体系模型表达和体系演化问题研究理论架构。希望为进一步厘清大数据概念与装备体系研究方法原理提供启发。
1应用大数据概念的装备体系研究理论方法桥梁
体系的系统概念原理和建模仿真研究经验表明,复杂网络理论尤其是超网络理念与体系模型在认识论上具有较强契合性。大数据时代,网络与数据的产生、采集、存储、管理和处理分析一系列信息活动密切不可分离,学术和实践领域也产生了借鉴复杂网络理论和数据挖掘方面智能计算理论指导大数据建模与分析的大量研究成果。本文认为,基于复杂网络或超网络理论的网络化大数据描述与建模是构建装备体系与大数据概念的重要理论方法桥梁,而基于大数据的人工智能理论发展为体系模型分析和大数据分析方法构建了理论方法桥梁。即形成两“桥”研究理论架构。体系大数据产生于体系,反映了体系网络化大系统的特征和规律,应用大数据概念的基本立场可以理解为数据化和信息化,透视“数据迷雾”,形成支持感知战争态势的认知信息,主要解决战争数据化问题;基于数据优势,发挥多维多元信息认知优势,有效快速形成决策和控制流程,主要解决实现作战信息化问题。
	 
图2应用大数据概念的装备体系研究认识机制
1.1语义超网络——基于大数据的体系结构描述框架模型
目前利用大数据概念研究复杂系统主要以网络大数据为载体,数据挖掘为基本手段,发现新洞察和决策支持为基本目标。相比传统挖掘理论,大数据引导人们更为关注模式之间的关联,复杂网络与数据挖掘的交叉研究取得阶段性进展,主要包括两个方面:一是在信息领域关注网络结构,统计物理方法和系统动力学分析方法结合,例如,基于元路径的异质信息网络中相似性搜索与聚类、链路关系预测等;二是复杂网络领域关注智能信息处理,推广改进学习算法,促进有效获取网络结构模式。数据与网络存在密切联系,20世纪末期建立的小世界网络模型和无标度网络模型就是在网络数据更容易被捕捉的历史条件下提出来的,吸引并促进了复杂网络理论与系统科学、信息科学、社会科学、生命科学等多学科的融合交叉。可以说,数据是网络科学发展的原动力,网络科学是数据科学研究的重要工具。大数据时代给复杂网络的研究范式带来了机遇。周涛讨论了大数据时代复杂网络研究面临的机遇与挑战,例如,面向网络大数据存储管理的图数据库优化设计,基于海量数据的数据采样,网络信息可视化等共性问题,网络动力学与网络结构分析、链路预测,网络控制和动态网络模式挖掘等特殊应用问题。图数据快速处理算法在社会网络演化模式挖掘方面也是典型的大数据与复杂网络交叉研究课题。本文初步思考了大数据概念应用目标驱动下,系统科学与体系工程、网络科学与网络工程相互之间的理论联系,如图3所示。
	 
图3大数据与复杂网络的方法论联系
统计分析、聚类、深度神经网络学习等主流数据分析模型具有的“知其然而不知其所以然”特性,结构拓扑分析、结构模式挖掘、链路预测等经典网络分析模型方法在基于海量数据的模式发现应用方面取得重要研究进展,而面向装备体系研究的大数据建模与分析决策注重数据科学优势与体系机理认知与推理建模密切结合为基本思维主线,需要兼顾复杂巨系统建模理论方法。大数据与网络科学的结合成为体系建模的新理论和技术增长点,而语义网思想正是解决描述数据之间关系的一种有效手段,因此,大数据模型基础上的体系情景推演应用应该建立在语义超网络架构之上,即语义的统一视角下,建立描述体系的大数据的超网络模型。
1.2认知粒计算——装备体系问题建模的系统工程新途径
大数据给数据挖掘及应用带来挑战的同时,也为复杂巨系统的机理认知带来了机遇。在现有体系研究成果基础上,以全新的视角发展基于大数据的体系建模新理论方法,推动体系科学研究变革。粒计算基于粒结构的思维方式,为结构化问题求解和信息处理模式创造了新的计算范式。从人工智能角度看,粒计算模拟人类思考和解决大规模复杂问题的自然智能模式,可以实现以人为中心的认知,立足于实际问题需求,采取可行的满意近似解替代精确解,提供效率。从数据分析与处理层面看,通过信息粒化手段,采取粒元的整体代替复杂数据样本,以粒为中心进行计算。从体系的层面看,通过对系统的粒化处理,可以采取合适粒度的粒结构刻画大规模的体系组成部分及复杂性的体系结构,提高体系的认识水平和问题求解效率。
粒计算的应用基础立足于数据,通常包括数据粒化、多粒度模式发现与融合、多粒度、跨粒度推理等核心内容,以数据为中心的体系结构描述思想为引入粒计算方法论指导体系建模具有显然的契合性。当前,在指控组织结构优化设计、体系需求描述和作战体系结构分析方面已经存在部分研究利用了粒度计算策略,但仅仅是关于体系某一方面的微观上针对复杂问题求解,立足于大数据概念正面讨论装备体系的粒计算建模和体系不确定性研究还十分稀缺。本文认为,基于大数据建模的装备体系复杂问题描述与粒计算求解存在理论和技术上的契合性,粒计算构建起大数据与装备体系的第二座理论桥梁。本节具体梳理为以下3个方面理论要素。
(1)大数据和装备体系的多层次/多粒度特性
从体系原理上讲,体系的基本要义是由系统组成的系统,显然,将系统视为基本构成对象,则体系在系统构成观察维度上客观具备关于系统对象的粒度性和层次性。装备体系是体系原理下的武器装备复杂巨系统,其组成部分本身是集成的,独立运行和管理的,地理上分布存在的复杂系统,复杂系统又具有特定的层次结构。
	 
图4装备体系中多尺度概念示意
(2)大数据和体系问题的不确定性特性
体系的不确定性可以归纳为两大类:一种是体系的客观环境不确定性,表现为目标威胁出现、指控组织(人因决策)自适应演化、随机偶然性的装备故障、气象等自然环境预测困难或复杂电磁环境等因素;另一种是体系的主观认知不确定性,表现为人类特有的感觉直觉等非理性因素对战略使命判断、目标威胁程度评估、体系作战能力或体系效能概念定位等构成的不确定性现象。当前,很多研究机构和学者就单个武器装备(系统)层次上讨论不确定性,基于不确定性信息处理手段研究特定型号装备作战效能评估与预测。但是少有研究正面讨论体系的不确定性问题。上述体系不确定性可能贯穿体系建设规划计划和体系运行控制优化等不同阶段模式,而且现有研究很少考虑装备体系复杂性、对抗性和动态性在不同阶段中的综合建模,而数据化模型描述为不确定性信息刻画和不确定性问题处理提供了很好的基础,建立在大数据建模基础上的装备体系描述模型为进一步采取粒计算与其它认知理论结合途径研究体系不确定性现象提供了条件。例如,关于体系作战能力顶层概念及体系作战支撑能力和体系中系统要素能力或任务能力等下位概念的模糊不确定性推理问题。
(3)大数据分析和体系问题求解算法要求具有高效近似求解性
应用大数据概念原理适应数据科学思维观点研究装备体系的方法核心在于基于大数据的复杂体系问题建模和基于数据的智能推理,就是在以人为中心观察视角下依托数据化问题描述模型,推理发现隐含信息或知识。模糊是人类认知的重要本质特性,从该角度讲,基于大数据分析方法的装备体系问题求解应该具备近似求解特性。首先,装备体系结构的复杂性必然导致采用合适有效的大数据建模手段生成的体系描述模型具有及其复杂的结构,不仅需要将多领域、多来源异构的数据集成与融合,而且要求算法能够按照体系问题特性自动或人机交互地从大数据中抽取与组织出具有多层次、多粒度、多视角、多局部特征的结构;其次,对抗性装备体系动态演化问题需要综合考虑实时战场数据信息的客观事实以反映体系问题框架的理论完整性,必然面临在海量数据中存在大量模糊、不完备信息特征环境下进行推理。基于大数据的信息不确定性认识反映了体系的客观不确定性和主观认知不确定性,现有的粗糙集、模糊集等不确定性问题求解模型或不确定性信息计算模型多数采取近似逼近思想,同时,对于体系问题而言,重点在于评估其建设水平或发展趋势,目的在于支撑决策,无需一味追求问题最优解。
2结束语
综合上述讨论,笔者认为基于“存在”观点思维分析把握大数据和装备体系两者概念之间的联系,可以发现,大数据概念在装备体系范畴内可以存在多种应用模式,既可以在微观系统层面讨论复杂系统的优化集成,也可以在宏观层面讨论基于数据思维视角的装备体系这种复杂巨系统的机理机制研究。由此,催生了一系列不同层次的理论方法和技术体系。本文重点在面向装备体系建模与体系复杂问题研究,讨论可行的大数据建模、分析与决策支持分析方法。创新性地提出语义超网络和认知粒计算的两桥理论架构,将能够有效建立基于大数据的装备体系模型研究方法和实现技术。希冀本文内容能够促进该领域朝着更深更远方向深化发展,有效解决现实体系问题研究困境。
	
 
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22