生成式人工智能在美军指挥控制领域的发展现状研究

发布时间:2024-06-19

2023年以来,以大语言模型为代表的生成式人工智能技术取得突破性进展,新产品、新技术陆续亮相,引发新一轮人工智能发展热潮。随着生成式人工智能系统在商用领域的成功应用,美军意识到生成式人工智能在指挥控制、情报分析、作战规划、辅助决策等军事领域具有巨大的应用潜力,因此已经开始推进生成式人工智能技术的军事化应用。

1

生成式人工智能在指挥控制领域的作用意义

生成式人工智能可以为用户提供涵盖广泛领域的问题解答,帮助用户撰写文章、邮件等各种文本内容,根据用户输入为长篇文章生成简洁摘要、帮助用户快速了解关键信息,进行多语言间的机器翻译,多种编程语言按需自动生成代码,实时在线客户服务等。美国防部认为,大型语言模型等生成式人工智能技术在情报分析、战场环境支持、通信和网络安全、态势感知和数据融合、军事数据管理、军事建模与作战模拟仿真等军事领域均有巨大应用潜力,因此美军迫切需要提高生成式人工智能模型的速度和交互能力等优势来提高任务效率。根据生成式人工智能系统的主要能力,将其应用到作战指挥中主要具有以下几方面意义:

一是可使作战数据保障更加精准。根据具体作战任务,通过生成式人工智能系统式服务准确理解指挥员意图,在海量的各类作战信息数据中快速精准查询,并定位作战指挥筹划需要的数据。

二是可缩短指挥信息和数据的迭代周期。作战人员可以通过生成式人工智能系统提供的交互式服务模式,高效查询装备、资源、人员分布等基础信息,快速迭代各类作战活动信息,及时引接作战、训练和科研等关联信息,分析评估作战态势,缩短OODA环中指挥信息的流转和更新周期。

三是可优化行动方案。生成式人工智能系统根据具体行动任务,在用户输入基本任务行动框架的基础上,通过对历史方案计划和行动规则的学习训练,结合当前兵力、装备和战场环境,自动拟制详细的行动方案,供指挥员参考。

2

生成式人工智能技术在美军的发展现状

2023年1月,美国防信息系统局(DISA)将生成式人工智能技术列入“技术观察清单”。同年8月,美国国防部成立“利马”(Lima)生成式人工智能工作组,由国防部首席数字和人工智能办公室领导,开始推进、评估和监督生成式人工智能计划的实施工作,收集生成式人工智能使用案例,挖掘其在改善情报分析、作战规划等任务方面的潜力,同时推进国防部、情报界和其他政府机构间合作,加强资源共享。该工作组提出了联合开发“多模态”生成式人工智能模型计划,并发布了生成式人工智能临时指南。

目前,美军正在开展生成式人工智能系统的测试工作,生成式人工智能在军事领域具有应用潜力的领域是指挥控制领域,生成式人工智能模型有助于综合和总结大量信息,回答广泛和具体问题,撰写初步作战方案,并提出建议。这些都是可以帮助提升军事用户的认知能力,使其能够更明智、更快地做出决策,并拟制敌人难以预测的行动方案。美国陆军和空军在演习中已经利用生成式人工智能系统大幅缩短了指挥官决策时间,对于解决指挥官决策过程中的关键信息需求发挥了较好的辅助作用。目前已知的是,包括Scale AI公司、帕兰提尔公司和安杜瑞尔工业公司在内的数十家公司都在为五角大楼开发基于人工智能的决策平台,微软公司也已经宣布Azure政府云计算机服务的用户可以访问OpenAI的人工智能模型。

2.1 陆军发展情况

2023年5月,美国陆军选择将Scale AI公司的大语言模型Donovan系统用于第18空降师的加密网络,用于该空降师部队的决策制定。Donovan系统是该公司的联邦人工智能平台,可帮助作战人员、分析人员和决策者加速战场态势的理解、计划和行动速度,Donovan系统使用了基于人类反馈的强化学习算法来持续微调系统模型,以便在任务目标发生变化时不断适应新任务。

军事计划人员面临的关键挑战之一是存在大量可支持决策制定的信息,而这些信息的格式不统一。在Donovan系统的帮助下,决策人员不需要增加参谋人员的数量就能在快速变化的战场环境中更快、更好地做出有依据的决策。Donovan系统获取了超过10万页实战数据,如任务命令、态势报告、情报报告等,帮助没有编程或训练经验的参谋人员在几分钟之内理解和管理不断增长的数据。Donovan系统还支持联合全域指挥控制,可加速计划速度,保证国防部开展跨战区作战司令部之间的协同。例如,空中任务指令周期目前需要三天,而Donovan平台能够将该计划周期缩短到几个小时。

在美军举行的红龙演习中,第18空降师将Donovan系统用于以下战场场景:

(1)通过接收实时数据来实时理解友军和敌军部队的作战行动,这些实时数据包括命令、态势报告和情报报告。Donovan系统能够帮助指挥官更好地发挥参谋人员作用,更便捷地确定新型解决方案,并评估快速变化的态势。

(2)通过接收战场报告、部队观测信息,实现对情报融合的背景理解,从而减少作战计划周期。

(3)通过接收有关潜在冲突区域的开源数据来支持危机计划制定,提供有关战场的态势洞察,支持战场情报准备工作,从而为指挥官提供决策优势。

2.2 海军发展情况

2023年9月,美国海军部签发了《生成式人工智能和大语言模型使用指南》,以指导海军内部对这类技术的发展和应用方向。

目前,美国海军将生成式人工智能定位为减轻人员工作压力,提高效率的虚拟助手。2023年8月,海军与通用动力资讯科技公司(GDIT)合作,推出人工智能助手Amelia,旨在提升海军体系服务台应答效率,解放人类操作员,以便其进行更复杂、更重要的事项。Amelia属于海军企业服务台(NESD)项目,采用与ChatGPT相同的生成式人工智能技术,将超过90个海军网络服务整合到单一平台中,利用政府授权的数据资源为超过100万名海军、海军陆战队作战人员和文职人员提供一站式的咨询服务,据海军官员表示Amelia可在45秒内响应数千个服务请求。

目前Amelia使用的主要为人力资源、培训和教育等非军事信息系统的数据库,但海军与GDIT正努力扩大Amelia的训练和资料库规模,预期未来让系统可拥有更高的机密权限,处理更复杂的指令要求,成为士官长的得力助手。

2.3 空军发展情况

美国空军对于生成式人工智能在军事领域的应用前景持相对谨慎的态度,美空军部长弗兰克‧肯德尔在美国安全中心举办活动上公开表示,尽管生成式人工智能在某些领域已经取得重大突破,但他认为由于可靠性等原因,生成式人工智能所产生的内容可能存在虚假信息,所以在功能和应用场景方面还有很长路的要走,目前在军事领域的应用前景相对受限。为此,他已责成科学顾问委员会开展相关调查和评估工作,以尽快弄清如何合理地引入生成式人工智能。

即便如此,空军仍然开展了一系列针对生成式人工智能的测试工作。2023年7月,美国空军在第6次全球信息优势演习(GIDE)中首次测试使用大语言模型执行军事任务,对5种大模型系统进行了测试,希望利用人工智能系统生成的数据来辅助决策、获取目标信息并支持火力打击任务。在测试中,美国空军通过电话向美军某支部队查询信息,测试期间使用的人工智能工具仅用10分钟就完成了查询,而传统方式下该查询过程可能需花费数小时,甚至数天时间。测试中,美国空军向模型提供了秘密级作战信息,国防部未透露正在测试的语言模型型号,但美国Scale AI公司称,该公司的Donovan系统是正在测试的平台之一。

同年7月,美空军快速战勤保障办公室也引入一款名为“战备”的大语言模型智能应用程序,用于提升战勤保障能力。“战备”可以融合多种程序处理结果,包括表单、文本、脚本、代码、传感器数据以及日志文件等多源信息,通过深度学习模型实现知识嵌入。通过该应用程序,美空军可以进行人机对话、资料检索、敏感数据访问等操作,进而优化空军机队战勤保障流程,大幅缩减飞机停飞检修时间,为提升作战飞机完备率和出勤率提供支持。

2.4 海军陆战队发展情况

2023年4月,美国Scale AI公司与美国海军陆战队大学的教授合作开发了Hermes大语言模型,用于测试该模型在战役级作战规划方面的能力。学生们通过使用“Hermes军事规划大型语言模型”来理解对手治国方略的各个方面内容,从而塑造作战策略,大语言模型有助于军事规划者在多个维度上观察战场。

由于设计团队将对手的理论和条令数据加载到语料库中,学生们可以提出“什么是联合封锁?”、“X国如何使用柴油潜艇?”等问题。Hermes大语言模型在帮助学生回答与条令相关的问题方面表现出色,这些问题有助于制定敌方的行动方案。学生团队还使用该模型来理解各地区经济间的联系、特定国家的政治时间表(如选举)、特定国家的主要基础设施投资(如中国的“一带一路”倡议)。通过不同层次的分析,学生团体可熟悉作战环境中的各种环节,以更好地开发对抗性作战概念。除了事实问题之外,学生们还在对抗环境中使用“Hermes军事规划大型语言模型”生成关于时间优势和位置优势的假想状况,通过分析这些假想状况,学生团体完善了他们的行动方案。

在大型语言模型的帮助下,学生团体通过提出和获取问题答案的形式,能够更好地了解作战环境、时间、空间和作战部队之间的关系,这个实验表明,有必要开始将大型语言模型集成到军事规划过程中。

3

存在问题

目前,生成式人工智能技术的军事化应用仍处在探索和起步阶段,主要在于以下三方面风险。

3.1 机器幻觉问题

海军部的《生成式人工智能指南》指出这类人工智能工具目前缺乏足够的可靠性,因为其会出现机器幻觉问题,即向用户提供看似真实但其实是完全错误和虚构的反馈内容。此外,模型产生的认知偏差、机器幻觉,训练人工智能模型的数据如果受到人为影响使得训练结果产生偏差,这也是美军成立利马工作组目前正致力于解决的问题。

美国国防部首席数字和人工智能官Margie Palmieri也在公开场合表示,目前生成式人工智能的评价标准仍然不明确,只能通过使用案例来判断生成式人工智能技术的应用效果,并且生成式人工智能技术存在提供错误信息的缺点,这对美军的战场应用来说是一个重大缺陷,因此需要通过军事演习对不同模型进行测试,并在此基础上对系统进行不断地调整和修正。

美国国防部负责关键技术的副首席技术官Maynard Holliday表示,国防部不会在当前实例中部署像生成式人工智能系统这样的商用现货技术,未来可能会与业界和学术界合作对相应的技术进行裁剪,以满足军事需求。国防部还寻求能够综合语言、视觉和信号信息的多模态生成式人工智能算法,来响应联合全域指挥控制(JADC2)概念中对联合作战的要求。

3.2 训练数据不足

数据是生成式人工智能类应用的底层驱动力。生成式人工智能主要依靠大量数据训练出一个巨大的神经元网络转化器,生成与人类交互的内容,通过足够的数据“喂食”、依靠海量的数据“训练”,才能实现人工智能各项功能。以ChatGPT为例,从2018年发布1.0版本到2022年底的4.0版本,ChatGPT的模型参数量由亿级增长至千亿级,训练数据量由GB级增长至百TB级。通过足够的数据“喂食”、依靠海量的数据“训练”,才能实现各项功能。

然而,当前军事领域存在信息壁垒和数据难提取的问题。部队的各类信息系统“烟囱”现象仍然比较突出,大多基础数据如一片片分散的“洼地”,散落在部队各类信息平台中,生成式人工智能系统调用“大数据”的难度较大,多数情况下依靠人工逐级采集汇总,工作量大,数据更新慢,准确性低。同时,由于ChatGPT等主要生成式人工智能产品源于美国的科技公司,其训练文本以英语为主,缺乏其他语言的优质军事数据作为学习素材,导致这类产品在涉及国际或者美国以外国家议题时提供的输出缺乏可信度。

3.3 泄密风险

在数据隐私安全方面,由于生成式人工智能的应用需要输入大量敏感信息和数据进行持续训练和学习,因此存在泄露的风险。数据在政府、军事部门以及第三方机构之间的存储和流动过程中,网络攻击、设备毁坏、人员操作不当等都容易造成数据泄露,会给部队带来严重的安全风险,从客观上对数据安全提出了更高的要求。

在军事人员隐私和安全方面,大模型可以分析和解析个人数据和照片,以获取大量敏感信息,包括个人身份、位置和移动轨迹。这些信息可被用来跟踪、追踪和监视军事人员,从而导致隐私侵犯和人身安全威胁。此外,先进的生成式人工智能技术可以通过生成真实的假人和虚假信息来欺骗和提取高级军官和高级官员的敏感数据,也会提高军事安全风险。

鉴于这类数据安全风险,美太空军已于2023年9月29日起暂停了在编人员在政府电脑上使用ChatGPT等基于网络的生成人工智能工具,除非得到太空部队首席技术与创新官的正式批准。

4

结语

生成式人工智能在国防领域已经表现出极具应用潜力的态势。虽然该技术仍然不完善,但美军已经开始积极探索和推动生成式人工智能在信息掌控、军事战略、情报分析、无人技术等方面的应用,以提升军事能力和任务效率。从长远来看,美国希望人工智能能够增强军事规划、传感器分析和火力决策的能力。因此,与大语言模型的对话只是他们未来十年更广泛的人工智能目标的第一步。面对生成式人工智能系统带来的改变世界、改变未来的影响和冲击,必须站在打赢未来战争的高度,认清其时代意义,用以促进和牵引作战指挥的发展。

来源:防务快讯