美国Scale AI公司Defense Llama大语言模型
军工资源网 2025年04月30日一、Defense Llama大语言模型应用环境
Defense Llama仅通过Scale AI公司的Donovan平台在受控的美国政府环境中使用,通过该模型可协助执行关键任务,包括军事行动规划、威胁评估和响应策略制定。
Schale AI公司于2023年5月推出了Donovan平台,这是一种基于大语言模型的生成式人工智能系统,旨在增强分析人员和作战人员对作战环境的理解,并提出行动方案建议。作战人员和情报分析人员通过与Donovan系统进行聊天交互,快速生成各种指令、可视化共同作战图、任务报告,并自动为外部作战系统生成空中任务分派命令(ATO)建议。Donovan系统最早在第六次“猩红之龙绿洲”演习中被美国陆军选择,用于第十八空降师的加密网络,用于该空降师部队的决策制定。Donovan系统在演习中表现出了较高的准确性和可靠性,为指挥官提供了有价值的数据和内容,缩短了决策时间,提高了目标打击效率。此外,Donovan系统还在美国空军“全球信息优势演习”联合演习中进行了多次测试。
Donovan平台分为三层架构:数据获取层、模型管理层和应用执行层。对于模型管理层来说,Donovan平台的大模型主要通过与第三方合作开发,包括Cohere、Claude、OpenAI以及如今的Meta公司。Donovan平台提供模型择优功能,用户可以根据具体任务选择最适合的模型。
二、Defense Llama基础模型、数据引擎与数据集
Defense Llama基于Meta的Llama 3构建的大语言模型,经过了专门定制和微调。Meta公司于2024年4月18日推出了Llama 3模型,Llama 3采用了128K token的分词器,训练数据超过15T Token的公开数据预训练,其数据量是Llama 2的七倍,训练效率比Llama 2提升了三倍。Llama 3已经开放了80亿(8B)和700亿(70B)两个小参数版本。Llama 3 8B在多项基准测试中性能超过了其他7B模型,而70B模型则超越了闭源的Claude 3 Sonnet,与谷歌的Gemini Pro 1.5不相上下。
Scale AI公司使用来自其数据引擎的经过微调的数据来配置Defense Llama 的参数,从而使它能够响应与国防相关的问题和场景。具体包括:
数据注释。注释文本、视频、地理空间、图像等各种数据类型。借助人工智能辅助注释工具和专家团队快速生成高质量数据。
数据管理。通过自然语言搜索探索数据集。对数据切片进行优先排序以进行注释并解决模型漏洞。
模型评估。将模型预测与真实数据进行比较,测量模型随时间的表现,在精细对象分类中找出模型的弱点。
Defense Llama接受了海量数据集的训练,其中包括军事理论、国际人道主义法以及旨在符合美国防部(DoD)武装冲突准则以及美国防部人工智能道德原则的相关政策,这使得该模型能够提供准确、有意义且相关的响应。此外,Defense Llama首次采用了由美国防部制定的评估基准进行测试,以确保模型理解相关领域知识和政府术语。
三、Defense Llama大语言模型应用情况
Defense Llama可集成到各种美军国防系统中,包括指挥和控制平台、情报分析工具和决策支持系统。Scale AI表示将持续与国防界合作,确保该模型是美国军事和情报行动的可靠资产。
在情报分析领域,Defense Llama能够自动从海量的公开和机密数据源中提取有价值的信息,无论是新闻报道、社交媒体动态,还是卫星图像和传感器数据,Defense Llama都能迅速筛选出关键情报,并进行初步的分类和整理。在情报分析与预测方面,Defense Llama能够通过对历史数据和实时数据的深度分析,识别出潜在的安全威胁和敌方的行动意图。例如,Defense Llama可以通过分析敌方的通信模式和部队调动情况,预测其可能的进攻路线和时间。这种预测能力为军事决策提供了重要的参考依据,有助于提前制定应对策略。此外,Defense Llama的多语言处理能力对于跨国情报合作和多语言情报分析具有重要意义。
在决策支持领域,Defense Llama能够通过分析当前的战场态势和历史数据,生成多种可能的作战方案,并评估每种方案的优劣和风险,为指挥员提供科学的决策建议。