保持人工智能和机器学习的竞争优势(下)

作者: 加文·哈特奈特     消息来源: 信息安全与通信保密杂志社         消息类型: 行业新闻         发布日期:2020-09-01


3 建 议
3.1 竞争轴心
3.1.1 为什么是竞争轴心
3.1.2 我们如何评估当前的AI平衡?
3.2 管理期望
3.3 在国防部控制下建立工程管道
3.4 创建和定制人工智能技术的验证、确认、测试和评估技术
3.4.1 验证和确认建议
3.4.2 新的测试和评估技术
3.5 为采用AI技术的新运营概念创建开发、测试和评估流程
3.5.1 作战模拟和作战概念
3.5.2 集成到多域操作中
3.5.3 用于多域作战的一些基于人工智能的空军战术概念
3.5.4 通过野外练习测试新概念
4 结论与未来研究
4.1 结 论
4.2 未来研究

03. 建 议

3.1 竞争轴心
将AI的进步转化为军事能力需要利用基础研究或商业工业的进步,将其转化为军事,评估其有效性和适用性,更新现有作战概念或开发新的作战概念,以利用新开发的能力。因此,我们评估了美中在AI领域的竞争潜力:突破性的基础研究、商业产业的进展、AI向军事过渡的开发和工程、VVT&E的进展以及作战概念的发展。

3.1.1 为什么是竞争轴心
我们的分析表明,突破性的基础研究不太可能成为美国与中国成功竞争的基础。事实上,基础研究成果主要由学术界和商业界推动;通常在公开文献中发表;因此,通常可在全世界范围内获得。此外,中国正越来越多地培养中外学者之间的合作渠道,包括与解放军有直接关系的中国科学家(图3.1),从而导致联合出版物的显著增加(图3.2)。最后,该领域的许多著名科学家似乎都与美国和中国有着密切的联系。

图3.1  按共同发表的同行评审文章数量衡量,与中国科学家合作广泛的十大国家
图3.2  中国科学家与海外科学家合著的同行评议文章


商业产业的进步也不太可能成为美国与中国成功竞争的基础。事实上,由于中国工业和军事利益的紧密结合,加上中国有利的结构性因素,中国可能在这方面占据优势。此外,在2017年之前,美国和中国的投资已经变得越来越纠结,美国和中国对跨境创业公司的支持越来越多(表3.1)。此外,在不涉及实物出口的情况下,与基于AI的技术一样,技术转让在实践中极难控制。然而,不断升级的大国竞争导致了中美之间不断升级的经济和技术竞争。因此,自2016年以来,中国在美国的外国直接投资已从465亿美元大幅下降至54亿美元。与此同时,有关两国经济“脱钩”的言论甚嚣尘上。尽管这不太可能切断美中之间的所有经济联系,但很可能会对科技公司产生重大影响,并扰乱全球供应链。总之,美中 AI 投资纠结的趋势已经逆转。

3.1.2 我们如何评估当前的AI平衡?
因此,剩下的三个轴心是美国建立和保持竞争优势的潜在途径。此外,正如前两个AI寒冬(减少资金投入和对AI研究的兴趣的时期)所表明的那样,管理期望是确保技术稳定发展和有效采用的重要方面,尤其是在大肆宣传的情况下。接下来,我们从期望管理的关键问题开始,概述针对每个轴心的具体建议。

3.2 管理期望
现实的期望对于成功维持一个目标至关重要。对于像AI这样的技术来说,这是一个特别敏感的问题,因为AI是媒体严重夸大和不停报道的对象。艾伦AI研究所(Allen Institute of Artificial Intelligence)首席执行官、该领域的专家奥伦·埃齐奥尼(Oren Etzioni)最近警告说,“鉴于人们对深度学习的兴奋和投资,分析它并考虑它的局限性是很重要的。”对AI技术目前的能力和局限性缺乏清晰的认识,可能会导致任何将它们纳入有用系统的尝试失败。美国必须非常小心和谨慎,以确保这种情况不会发生,因为AI技术,除了所有的炒作之外,即使不是像媒体所描绘的科幻小说那样,还有很多东西可以提供,无论是今天还是将来。

为了帮助美国空军的AI工作能够实现并建立在坚实的基础上,我们建议制定一个前瞻性的AI路线图。我们进一步建议,路线图的创建和维护由空军于2018年成立的AI跨职能团队负责,该团队利用了美国空军所有主要司令部的专业知识,为其提供了一个平衡的视角,以实现不同时间段AI就业的现实目标。这个AI路线图应该按照三个阶段来组织:近期、中期和长期。路线图应:

·包含每个阶段可能实现的应用程序的详细和优先顺序列表。
·对于每个应用程序,确定操作需求。
·对于每个应用程序,提供过渡到运行的计划,包括测试和评估。
·对于每个应用程序,列出当前AI技术库中的不足之处,并开发这些技术,以便在开展计划时使其成熟。
·对于发现的每个不足之处,提出可能的方法,并解释其成功的原因。
·对于发现的每一个不足之处,请注意所需的研发,这可以作为征求建议书的依据。
·对于每个应用程序,提供总成本的粗略数量级估计,以使应用程序成熟。

AI路线图应该是动态的、生动的文档,必须随着空军作战要求和技术的发展而不断维护和修订。如果操作得当,路线图、空军作战需求和研发需求将协同工作。正如我们所设想的,路线图是一个动态的工具,它将阻止空军装备现代化和资本重组计划远远超过美国空军研发部门提供的应用程序增长速度。如果使用正确,路线图可以避免美国空军将宝贵的购置资金浪费在当前AI应用无法实现的概念上。

创建一个有效的AI路线图需要一个历史和技术的视角。加州大学伯克利分校计算机科学教授迈克尔乔丹(Michael Jordan)在人类模仿AI和智能增强之间作了重要区分,前者指的是“在软件和硬件上实现一个拥有人类水平智能的实体的强烈愿望”,后者指的是搜索引擎和自然语言翻译是智能增强的好例子。在过去的20年里,智能增强技术取得了显著的进步,开创了一个新的工程分支,其基础是“信息”“算法”“数据”“不确定性”“计算”“推理”等概念的发展,这与化学工程领域建立在物理和化学发展基础上的方式类似。

模仿人类的AI与作为工程学科的智能增强之间的区别将有助于将对AI的幻想讨论与智能增强的工程现实区分开来。特别是,它将帮助工程师将他们的努力建立在合理的、既定的原则上,这些原则要求仔细和冷静地检查什么是可行的,什么是不可行的,以及如何量化地验证、测试并将其纳入其他工程系统。这将有助于空军专注于进化进程,而不是期待突破性的革命。

普遍的看法是,我们目前正在经历AI研究的黄金时代。许多量化指标支持这种观点,包括AI出版物的增长、出席大型会议的人数以及AI的总体投资。然而,也有一些消极的趋势。事实上,AI的发展速度之快,尤其是深度学习,已经让许多人担心,AI可能会出现泡沫,因为增长与实际进度不符。AI研究在历史上经历了许多进展、资金和热情下降的时期。这些AI的寒冬必须通过清晰的视野来避免,而不是被媒体炒作所蒙蔽。

3.3 在国防部控制下建立工程管道
为了在AI开发和应用方面建立和保持竞争优势,美国空军和国防部需要大量训练有素的工程师。国防部工程师需要与国防部项目经理、操作员保持密切的合作:

(1)分析需求。
(2)开发用于AI作战概念的设计、测试和评估技术。
(3)专门设计国防部的AI系统。
(4)从实验室到现场进行国防部AI系统的VVT&E。

事实证明,建立和维持这样一支队伍是困难的,特别是考虑到私营部门提供的高薪和优越的设备。目前国防部的民用工程队伍是有才华的,但包含了相对较少的研究人员,他们精通AI开发所需的信息技术相关学科。但是,在未来五年内约有三分之一的国防部民用工程师将会退休。

虽然这个问题很严重,但美国空军和国防部可以采取措施,确保美国军方拥有保持AI研究和应用前沿所需的头脑。首先,国防部可以为工程师提供更灵活的职业道路,让他们有机会离开国防部实验室,然后回国而不必受到禁止性的惩罚;工资取决于绩效,而不仅仅是资历;还有机会继续进行研究,而不是被迫进入具有一定资历的管理层。国防部工程师可以获得更多的专业发展机会,有机会参加会议、发表论文,或许还可以从事内部资助的个人研究。最后,应该从军事建设预算中拨出更多的资金来更新许多国防部实验室中的陈旧和老化的实验室设备。

美国空军还可以采取措施,吸引更多的AI工程师加入其队伍。可以建立一个AI空军国民警卫队,以使职业生涯中期的AI研究人员有机会在国防部实验室兼职,并以与其经验相称的军衔入伍。AI后备军官训练计划也可以在主要的AI大学建立,如麻省理工学院或卡内基梅隆大学,以吸引接受军事研究训练的年轻工程师。那些参与这些项目的人应该获得AI工程专家的职业轨迹和奖金,以确保有足够数量的足够熟练的学生。最后,空军可以鼓励其专业军事教育机构的学生学习AI应用,这样,当他们晋升到领导职位时,他们将了解AI技术和能力,并能够在未来的指挥中有效地使用这些能力。

3.4 创建和定制人工智能技术的验证、确认、测试和评估技术
3.4.1 验证和确认建议
验证和确认是指两种不同的方法,通过检查AI系统是否符合其规范和实现其预期目的,来共同评估其质量。为了制定合理的验证和确认要求,考虑AI系统可能存在的不足可能是适当的。2016年的一篇论文调查了AI的安全性问题,将其置于五个研究问题的背景下,这些问题突出了设计过程中可能出错的不同点:

·避免副作用。AI系统可以一心一意地追求其目标,有时会在与之无关的其他领域造成问题。Amodei等人举了一个清洁机器人的例子,它会尽快地去清理,并在这个过程中把东西打翻。这些问题都可以通过细致的功能建设来解决。

·避免奖励黑客攻击。AI系统有时会找到捷径来实现其目标功能,从而产生无用或破坏性行为。例如,Amodei 等人指出,一个清洁机器人的目标是清除所有能看到的污垢,可以通过关闭传感器来实现这一目标。与避免副作用一样,这个问题可以通过正确定义目标函数来解决。

·可扩展的监督。尽管过于简单的目标函数可能会导致负面影响或奖励黑客行为,但过于复杂或评估时间太长的目标函数可能会使AI系统难以评估行动方案。回到假设的清洁系统,清洁机器人可能需要询问每个家庭成员地板上发现的任何物体,这是一个可扩展的监管问题。虽然这样做可以防止系统扔掉任何人的财产,但也有可能使清洁地板变得非常耗时。

·安全探索。由于AI系统是通过反复试验来学习的,因此应避免尝试进行非常危险的试验。对于Amodei等人的清洁机器人,这可能包括在试验新清洁技术时切勿在电气设备附近使用湿拖把的说明。

·对分布转移的鲁棒性:如果 AI 系统遇到的现实世界信息或环境与它所接受训练的数据或环境有显著不同,那么它的行为可能是次优的,甚至是破坏性的。为了说明这一点,Amodei 等人指出,一个受过清洁工厂地板训练的机器人可能会学会一些不明智的行为,比如在不是为这种工具而建的墙壁上使用压力垫圈。如果现实世界的环境可能与培训环境在统计上有所不同,那么设计师应该非常谨慎。

解决前两个问题属于验证范畴,而解决后三个问题则属于核查范畴。

AI系统的验证和确认虽然还处于初级阶段,但可能会借鉴其他领域的一些现有方法或实践,包括鲁棒控制和模型检查等。这不是一项微不足道的努力,而是需要在基础研究上进行投资,以便将多个社区聚集在一起,克服传统测试和评估方法在评估AI系统时遇到的困难。如果不考虑对基础研究的额外投资,以期从根本上改变设计范式,而是从一种将设计、验证和确认视为离散活动的范式,转变为在设计过程本身甚至是在生产系统中验证和确认因素的模式,那么这是失职的“设计正确”,即无需进一步验证或确认的系统。

3.4.2 新的测试和评估技术
一个有效的测试和评估系统对于给予美军人员充分发挥其AI系统潜力所需的信心至关重要。不幸的是,目前国防部的测试和评估系统并不能有效地证明自主系统的可靠性。基于机器学习的系统会随着时间的推移而改变其行为,以响应所吸取的经验教训,而目前国防部的测试和评估程序并不是为了处理这种紧急行为而设计的。国防部试验靶场的装备不足以代表自主平台将要运行的大规模复杂、开放、不可预测和对抗性环境。目前的政策分别考虑运营商和系统的绩效,而不是评估他们共同实现目标的能力。国防部的验证和确认主要集中在整个系统开发的最后阶段对整个系统进行广泛的审查,而不是在开发过程中对其组成部分进行评估。最后,当前的测试和评估过程严重依赖于先前平台的评估,这给没有前身的新型自主系统带来了问题。

尽管其中的一些问题,如试验靶场的改进,将很难解决,需要进行重大改革,但可以采取一些相对简单的步骤来提高国防部测试和评估系统在自主系统中建立信任的能力。根据当前软件开发过程的思路,一个重要的即时解决方案是在开发周期中将自主系统的大多数VVT&E 活动“向左”移动,以便验证和确认工作在定义和制定早期系统需求方面发挥更大的作用。由于自主控制软件是建立在多层代码和算法之上的,因此在开发过程的早期验证和确认软件的更基本的组件可以更有效地证明其整体可靠性,并且如果在基本组件中发现问题,则可以避免在开发的后期阶段进行代价高昂的修复。

尽管不应根据较早有人值班平台的标准来判断自治系统,但可以根据每个新软件迭代与之前已通过验证的版本之间的差异来评估每个新软件迭代,而无须每次进行冗长的审核过程。快速原型可以帮助建立对系统可靠性的信任,并缓解没有来自过去的自治系统的数据作为正在开发的新的突破性系统的基准的问题。作战模拟和仿真应该被用来测试新的战术或策略,尤其是在对抗AI的对手时。作战模拟和仿真还应用于测试和验证决策辅助工具的性能,特别是作战指挥算法或决策技术。最后,国防部对AI的测试和评估过程也应开始将平台及其操作人员作为一个单一系统进行评估,以确保人机交互能够得到优化。

3.5 为采用AI技术的新运营概念创建开发、测试和评估流程
3.5.1 作战模拟和作战概念
从历史上看,决定性的军事创新需要具有可比性的技术水平、能够集成新技术的组织以及清楚地知道如何在战场上使用技术。由于AI背后的大部分基础技术都可供华盛顿和北京使用,而且两国都在并行地开发类似的新组织结构,因此美国必须开发出优越的作战概念,以在AI应用中保持决定性优势。

开发此类概念的一种方法是通过分析性的作战模拟。在过去,此类仿真帮助美军确定了新的作战概念和理论,使其能够将航空母舰和核武器等新技术转化为决定性的军事优势。评估AI作战概念的作战模拟程序应该从联合社区的工作级别成员进行的并行战争仿真开始,并且应该基于可能的冲突。在其中一个仿真中,蓝军将拥有基于现有记录项目的能力;在另一个仿真中,它将在未来几年内拥有各种AI能力,例如小型的无人机群和其他USAF战斗机的自主F-16机翼兵。利用这些仿真的结果,空军专业军事教育机构可以咨询私营部门的专家,为使用新的AI能力建立两到三个作战概念。然后可以在第二套战争仿真中评估可能的冲突,以确定哪个作战概念最有效。最好的作战概念可以提炼成一份理论白皮书,供空中工作人员审查和批准,并在实地试验中进行进一步评估。

3.5.2 集成到多域操作中
美国陆军和海军陆战队开发了多域作战(MDO)概念,以有效应对来自对手的新威胁,这些对手能够在所有六个领域与美军对抗,能够对美军发动远程精确打击,能够在没有全面冲突的灰色地带作战。这一概念要求美军建立新的能力,包括与灰色地带的对手竞争、为灰色地带冲突升级为全面冲突做好准备的能力,并通过确保战区有足够的补给以迅速向该地区派遣部队来校准部队态势。MDO进一步假定,美国将需要建立有弹性的编队,能够在敌方部队包围和面对有争议的空中环境时作战,并在不同领域展开协调作战,利用任何领域的优势窗口影响其他领域。

3.5.3 用于多域作战的一些基于人工智能的空军战术概念
为了有效应对新的威胁环境,MDO为美国联合部队提出了四个关键理念:竞争、校准部队态势、使用弹性编队和聚合能力。我们相信,美国空军部队可以通过使用四个战术概念,为 MDO 愿景做出重大贡献,这些战术概念由即将上线的新型AI驱动的自主系统提供支持。每个战术概念都与MDO愿景的四个原则之一保持一致。

第一个战术概念,智能情报、监视和侦察(ISR)数据处理,将支持竞争宗旨。这种非动态智能和监视概念将使用AI驱动的算法来筛选来自间接ISR资产的大量数据。建立在过去重大冲突爆发数据基础上的新兴的AI预警算法很可能比人类分析人员更早发现征兆。

第二个战术概念,AI驱动的指挥和控制,旨在支持校准部队态势组件。这一战术概念将使用AI驱动的指挥控制和后勤系统,以快速协调美国空军后续作战空中中队进入战区的行动。

第三个战术概念,自主武器盾牌,将支持使用弹性编队。这一概念包括使用美国空军无人驾驶、自主漫游平台,以提供基本的近距离空中支援。

第四个战术概念,AI优化,是一个面向指挥和控制的概念,将支持融合原则。这个概念将使用AI驱动的动态任务规划软件来完成当前阶段的战役。

3.5.4 通过野外练习测试新概念
《开放防务报》最近的报道显示,美国陆军已经决定,在野战演习中测试MDO思想的最佳方法是避免狭隘的概念验证演习,这种演习是由经过专门训练的测试单位进行的,将实验性的MDO信条纳入正规部队定期安排的训练演习中,看看这些信条是否可行。虽然这种方法可能在今天的陆军中有效,但我们认为,如果美国空军希望测试新的AI驱动的战术概念,并在未来某个时候嵌入多目标作战系统,那么美国空军应该恢复到更传统的概念验证方法,并配备特殊的测试单元。

我们在这里提出的新战术概念推动了当前军事科学的发展,并依赖于仍处在开发阶段的AI系统和软件的高水平性能。这些概念还依赖于空军各级人员尚未使用的新型战术、技术和程序。为了使野战演习有助于测试这些想法,空军部队最好在常规训练活动之外,进行特定的、高度定制的概念验证实验,这些实验是在潜在的新AI战术、技术、程序和系统方面受过专门训练的。

04. 结论与未来研究

4.1 结 论
我们的评估是,美国目前在AI技术发展方面领先于中国。这主要是因为美国在先进的半导体设计和制造业中比中国有更大的优势,因为美国的能力和先进性目前仍然超过中国。强大的半导体产业是良好、坚实的AI研究的重要基础。然而,中国政府正试图通过对半导体行业的大规模投资来削弱美国的优势。此外,中国半导体行业还有一个额外的优势,即靠近巨大的中国市场。由于目前美国缺乏实质性的产业政策,这种情况将进一步恶化。

在两国科技部门风险资本家的活力方面,中美处于更平等的条件,但在牢固建立法律体系和新闻自由方面,美国可能具有优势——这些基本的结构因素共同为AI开发提供了稳定的基础。美国和中国科技部门的脱钩将很好地检验美国和中国能够在多大程度上分庭抗礼。中国当然能够将大量资金投入AI研究,但中国的AI能否在与美国科技部门隔绝的真空中茁壮成长?

中国在大数据集领域确实比美国有优势,这对AI应用的发展至关重要。中国人口大约是美国人口的四倍,因此中国科技公司有一个固有的更大的潜在数据库可供利用。但总体而言,我们认为,中国在数据量方面的优势不足以战胜美国在半导体领域的优势。因此,我们判断美国目前在AI方面略领先于中国。

国防部领导层必须牢记重要的一点,即最终在AI功能系统、武器和作战概念方面保持对中国军方领先的长期前景至少将间接地取决于国防部的能力。因此,美国空军作为一个机构,应该尽其所能为国家整体努力做出贡献,以保持国家在AI领域的世界领先地位。例如,一个很有希望的选择是美国空军通过明智地授予空军合同,为私营部门有前途的两用AI研究项目提供资金支持。另一个选择是美国空军与国防高级研究计划局(DARPA)合作,共同赞助和资助有前途的学术 AI研究,这些研究将在商业领域产生广泛的附带效应。然而,我们的结论是,为了保持竞争优势,空军的大部分资源应用于其直接控制的领域:AI向军事过渡的开发和工程、VVT&E的进步以及作战概念的发展。

表4.1给出了我们认为美国空军应如何在AI开发领域分配近期工作的框架。它表明,正如我们在本报告中所论证的那样,空军在基础研究和技术商业化领域的活动水平相对较低,因为AI研究的全球市场目前是开放的,并且在AI发展领域的这些方面,美国几乎没有机会获得超过中国的优势。我们估计,过渡到军事应用领域需要作出高水平的努力。作为这项工作的一部分,应着重于通过招募和留住更多具有该领域技能的高素质科学家和工程师来改善 USAF用于AI的有机人力资本。正如我们在本报告正文中所显示的,有多种方法可以改善进入美国空军研究实验室的科技人员队伍。最后,我们建议美国空军在VVT&E和频谱的运营概念开发阶段投入大量精力。在这些领域,美国空军可以通过部署更可靠和用户友好的AI系统,来获得与中国相比真正的作战优势。


仅使用开源材料,很难(如果不是不可能的话)就哪个国家在AI领域处于领先地位以及趋势是怎样的达成一个明确的声明。事实上,把AI分解成它的组成部分并讨论AI生态系统的各个部分可能会更有效。此外,我们可能需要的一些数据并不公开,而其他一些数据,如文化评估和机构关注度,则不适合进行定量评估。因此,寻求“AI生态系统领先”的总体指标是具有挑战性和值得怀疑的。总体而言,我们的数据收集和分析使我们初步得出结论,美国在AI的一些关键领域领先优势很小,同时也应注意到,中国在这一问题上有几个优势和高度的领导重视。这一评估意味着,美国几乎没有犯错的余地,需要集中注意力和资源,确保中国不会在一项看似重要的技术上领先美国,因为AI技术不仅对商业经济而言是一项关键技术,而且能够巩固美国的国家实力,特别是当其应用于广泛的国防领域(尤其是在航空领域)方面。

4.2 未来研究
本报告主要是对中美AI的初步比较分析,以及这对美国空军意味着什么。我们只是触及了表面,还有更多的研究需要做,以充实出影响中国AI未来的关键维度、组成部分和因素。以下主题可能是特别富有成效的研究领域,每个主题都可以作为一个独立的研究项目,也可以成为更广泛研究工作的一个组成部分:

·勾画出中国AI网络中关键军民之间的互动关系。更多地了解关键人物,他们与谁互动,以及他们互动的频率,可以为中国AI战略的发展轨迹提供有价值的见解。
·绘制中国AI网络中不同军事、政治、学术和商业机构之间的联系和关系,包括中国境内外。更多地了解机构关系可以为中国AI战略的发展轨迹提供重要的见解。
·跟踪资金数额、资金来源和去向。监测资金流动是识别中国AI优先事项和评估AI资金使用效率的重要方法。

专注于特定AI程序或具有特殊兴趣的特定AI实体的单个案例研究。专注于一个特定的项目或组织可以提供相当详细的信息,说明更大的AI策略的实施在实践中意味着什么。
服务热线
025-8660 3700

微信公众号