生成式人工智能在美军的应用动向分析

2024/02/05

导读:大语言模型接受海量数据的训练,以帮助人工智能预测用户提示并生成类似人类的响应。它们为OpenAI的ChatGPT和Google的Bard等生成式AI工具提供了动力。在几个典型的大语言模型中,有五个项目正作为美国国防部一系列更广泛实验的一部分进行测试,这些测试实验的目标是开发应用于整个美军的数据集成和数字平台。这些演习由五角大楼的数字和人工智能办公室以及各军种高层统一组织进行。

3793dbe234fc4f2945c9ed10c5b25c95_640_wx_fmt=png&from=appmsg&wxfrom=5&wx_lazy=1&wx_co=1.png


2023年7月,美国空军人员在第六次全球信息优势演习(GIDE)中首次测试使用大语言模型执行军事任务。


大语言模型的使用将代表军队的重大转变,因为军队的数字化或互联程度非常低,信息流转速度慢。目前,向军队的特定部门提出信息请求可能需要几名工作人员几个小时甚至数天才能完成,因为他们会打电话到处找资料或急于制作幻灯片。而在一项测试中,其中一个人工智能工具在10分钟内完成了一项请求。


测试中,美国空军还向模型提供了秘密级操作信息,以解决敏感军事问题。


全球信息优势实验(GIDE)联合演习的前四次迭代由NORAD和北方司令部运行,但自GIDE V开始由五角大楼的首席数字和人工智能办公室(CDAO)与参谋长联席会议合作领导。GIDE V旨在测试军方的数据共享和集成,评估其对人工智能系统的使用,并提供对联合全域指挥和控制(JADC2)实施的见解。而最近的这次GIDE军事演习(第六次)中,美军向大语言模型寻求帮助来规划军方应对不断升级的全球危机的实验,假设这场危机从小规模开始,然后转移到印度-太平洋地区。还测试了军事指挥官是否可以利用大语言模型来产生他们从未考虑过的全新选择。


美国国防部未透露正在测试的语言模型型号,但美国Scale AI公司称该公司的Donovan系统是正在测试的平台之一。Donovan是第一个在政府机密网络上部署的大语言模型,开发商将其定位为“人工智能决策平台”,可以处理来自不同来源的情报数据,并向人类官员提供建议。其发展值得重点关注。


包括Scale AI的Donovan平台在内的五个LLM在为期八周的练习中接受了测试。其他四个模型来源未知,目前已知的是,包括Palantir Technologies Inc.和Anduril Industries Inc.在内的数十家公司都正在为五角大楼开发基于人工智能的决策平台。微软公司也已经宣布Azure政府云计算机服务的用户可以访问OpenAI的人工智能模型。美国国防部是 Azure Government的客户之一。


我们无法获知美国空军的具体测试内容。但据外媒彭博社报道,媒体出于测试目的也进行了试验,在给Scale AI的Donovan模型提供60000页开源数据(包括美国和C国的军事文件)的演示后,向Donovan询问美国是否可以阻止T海冲突,以及如果战争爆发谁会获胜。一系列带有解释的要点在几秒钟内就返回了。Donovan系统在一份答复中表示,“美国可能有必要对地面、空中和海军进行直接干预”,并在另一份答复中警告称,美国将很难迅速瘫痪C国的军事力量。该系统最后的说明是:“对于C国和美国在某岛问题上的潜在军事冲突的结果,在军事界几乎没有达成共识”。


据另外一个由外媒报道的案例描述,Donovan在某岛附近识别出一艘可疑的C国船只,然后为军事指挥官提供选项以找到更多信息,例如派遣一架飞机进行飞越或调出最近的卫星图像。一旦图像可用,图像识别算法就会识别出大量辐射,促使官员将信息向上传递到指挥链,并派遣无人机调查船只。


随着各类演习的进行,美军已发现机器幻觉现象越来越多的出现,生成式人工智能可能会加剧偏见并且信心十足地传递错误信息。这些人工智能还会遭到黑客多种方式的攻击,比如“毒害”那些输入模型中的数据源。这些担忧正是五角大楼进行这项演习实验的原因之一,他们已经强调要“深入了解”信息来源。美国国防部已经与科技安全公司合作,帮助测试和评估他们对人工智能系统的信任程度。


生成式人工智能在国防领域已经表现出极具应用潜力的态势。虽然该技术仍然不完善,但美军已经开始积极探索和推动生成式人工智能在信息掌控、军事战略、情报分析、无人技术等方面的应用,以提升军事能力和任务效率。从长远来看,美国希望人工智能能够增强军事规划、传感器分析和火力决策的能力。因此,与大语言模型的对话只是他们未来十年更广泛的人工智能目标的第一步。


网站已关闭

您的网站已到期,请及时续费
联系电话:400-606-1198