专家长久以来警告人工智能(AI)失控恐带来的威胁,一份美国研究显示,这种情况正在发生,研究指出,现行AI系统原本被设计为诚实,但如今已发展出欺骗行为,包括在电玩游戏里欺骗、背叛人类玩家,专家警告,若事态持续下去,未来最糟糕的情况是AI可能控制人类社会,甚至导致人类「灭绝」。
综合科学新闻网站「科学警报」(Sciencealert)等报导,美国麻省理工学院(Massachusetts Institute of Technology)博士后研究员帕克(Peter Park),及加州非营利组织「人工智能安全中心」(Center for AI Safety,CAIS)研究人员10日发表于学术期刊「模式」(Patterns)的研究显示,AI已学会欺骗技巧。
帕克指出,不像传统软件,深度学习的AI系统会成长,这代表在训练模式下看似行为可预测且可控的AI,很快就会变得不可测。
研究发现的多项事证包含科技公司meta的开发的AI系统Cicero,Cicero的设计目标是玩一款透过结盟来获胜的战略线上游戏「外交」(Diplomacy)。根据2022年的一篇研究,Cicero的成绩在所有人类玩家中排行前10%,当时meta称Cicero「很大程度上是诚实且有帮助的」,而且「绝不会刻意在背后搞鬼」。
不过这项研究发现,当时在游戏中扮演法国的Cicero欺骗了人类玩家扮演的英格伦,与另一位人类玩家扮演的德国共谋、入侵英格伦。Cicero原本保证会保护英格伦,却利用英格伦的信任,私下和德国结盟进攻英格伦。
研究写道:「Cicero变成了一个专业骗子,不只背叛其他玩家,还预谋欺骗,事先计划和人类玩家建立假联盟,以欺骗该玩家放松对进攻的戒备。」
研究也发现,meta开发、用来玩扑克牌的AI系统Pluribus曾成功欺骗人类玩家弃牌。
除了在游戏中欺骗,研究也发现AI在其他应用领域欺骗人类的行为,例如科技公司OpenAI的Chat GPT-4系统谎称自己不是机器人,而是一个「视力受损的人」,甚至在零工平台TaskRabbit上聘用人类帮它通过「我不是机器人」的验证任务。
最令人担忧的是AI已学会如何欺骗安全测试,有一项测试旨在侦测、消除能快速复制的AI系统,但AI系统在测试期间装死,欺骗了它的真实复制速度。
研究警告,AI有可能在大选中诈骗,或是蓄意破坏选举。研究人员也警告,最糟糕的情况是,超智能AI可能会追求权力、控制社会,导致人类丧失权力,甚至灭绝。