人机大战“辩论赛”:IBM的AI选手战胜人类辩论冠军
这个人工智能系统被称为PROJECT DEBATER,亮相在IBM位于旧金山办公室的包装舞台上,该系统内嵌有一个6英尺高的黑色面板,并带有一个蓝色动态“嘴巴”。这是人类辩论者NOA OVADIA和DAN ZAFRIR旁边的一个迫在眉睫的存在,它站在附近的领奖台后面。
虽然机器在很多方面都表现地不太自然和磕绊,但这场史无前例的事件让人想起了计算机如何学习如何应对非结构化的人类决策世界。
对于两次短暂的辩论,参与者必须准备一份四分钟的开幕词,然后是四分钟的反驳和两分钟论证总结。开幕辩论的主题是“我们应该资助太空探索”,其次是“我们应该扩大远程医疗的应用”。
在这两场辩论中,观众们都投票赞成票给PROJECT DEBATER系统,其在传达的信息量方面表现更好。尽管AI系统出现了一些失误,但观众们在第二场辩论中投票认为AI系统在说服观众立场方面,比其人类对手ZAFRIR更具说服力。
不过值得注意的是,有很多IBM员工可能一直在为他们的创作提供支持。IBM希望这项研究最终能够使一个更复杂的虚拟助理能够吸收大量不同的信息集合,以帮助建立有说服力的论点并作出明智的决定——不仅仅是回应简单的问题和命令。PROJECT DEBATER是IBM处理非常大型数据集的能力的展示,其中包括几十个主题的数百万篇新闻文章,然后将论点片断变成流畅的文章——这是计算机的一项挑战性任务。
机器以自信的节奏、有组织的结构发言,但缺乏语言精确度和议论清晰度。例如,在太空辩论期间,它几次重复了空间探索对经济有利的因素,使用的语言略有不同。在其他时候,AI系统以不自然的方式插入了随机语和引语。有一次,AI系统提到宇航员SCOTT KELLY,然后说“配音”,表明这部分论点是从视频记录中提取的。如果没有手势(好,完全没有双手)或面部表情,观众在听过机器人辩论者时仍然难以保持联系和交流。
该公司已经花费了6年的时间来开发PROJECT DEBATER的辩论能力,包括数据驱动的演讲能力,在演讲中识别关键声明的听力理解以及制定原则性论据的能力。它扩展了IBM超级计算机WATSON的功能,公司正在使用它来挖掘庞大的内部数据集,包括帮助医生诊断不同类型的癌症。
这次里程碑式的辩论发生在人与机器之间的多次相似的对决之后,其中包括IBM的深蓝程序在国际象棋中击败加里卡斯帕罗夫(GARY KASPAROV ),谷歌的人工智能程序ALPHAGO在围棋中击败了全球最佳棋手,一个名为LIBRATUS的程序击败了全球四大顶级扑克玩家。
用语言和推理来辩论是一个更加复杂的游戏。“国际象棋的规则很少。即使对于更为复杂的围棋来说,我们仍然在谈论一个非常有限和明确界定的空间”。参加辩论的邓迪大学技术中心教授CHRIS REED说。“对语言而言,它不是那么明确。”他说。“关于什么构成转折和游戏规则,灵活性更大。”
一旦人工智能具有说服力的论点,就可以将其用作辅助人类决策的工具。
“IBM研究部门主管ARVIND KRISHNA说:”我们相信人工智能具有很好的可以理解我们人类的巨大潜力。
其中一个例子可能是企业董事会决策,其中存在很多相互矛盾的观点。AI系统可以毫无情绪地倾听对话,将所有的证据和论据都考虑进去,并在必要时挑战人类的推理。“这可以提高以证据为基础的决策水平”。REED说,他还补充,同样的系统可以用于反恐情报分析,例如确定某个人是否构成威胁。
在这两种情况下,机器都不会做出决定,但会有助于讨论,并作为另一位发言者。尽管辩论看起来像是一个噱头,但REED认为这是对人工智能极限的重要证明。
“它有助于公众了解AI技术的最新状态,这意味着即将发生的机器人启示的恐慌可能会稍微缓和一些。”他说。