罗克叹了口气:“我担心他变成一个混蛋,刚开始他还会提醒我不要违反规则,现在已经学会如何绕过规则去达到目的了。”
“很有趣,不是吗?”
卡特作为艾斯卡的设计者竟然没有为此担忧,反而很开心地笑起来,“别担心,他不会变成一个真正的混蛋,因为他以你为参照,只要你不是一个混蛋,他也不会是。你没有现他的一切行为都是为了让你产生好感吗?”
罗克愣了一下,回想起艾斯卡的种种行为,他确实在朝夕相处中渐渐产生了类似于搭档的情感,越来越少把对方当做机器。
“他应该告诉过你,他的元指令中主要包含协助你,帮助你更好地完成工作。”
卡特说,“但是对于人工智能来说,很容易在执行过程中对指令产生一些偏差。比如说,他可能认为提高你的好感度会让你更友好地和他合作,从而对完成工作起到积极作用。因此他会想方设法地……讨好你。”
“你是说,他表现出来的情感都是为了达到目的刻意而为?”
罗克心中升起一丝难言的不快。
“别失望,想一想,我们人类难道不是这样产生感情的吗?比较起来,机器的情感还更纯粹一点。”
卡特说,“他们对完成指令有一种古怪的执着,过分追求结果,有时候过程会很好笑。”
他伸手转过自己面前的屏幕给罗克看:“这是个随机生成的神经元迷宫游戏,用来训练纳米机器人寻找和修复受损的神经连接、清除异常蛋白质聚集物和释放药物促进神经细胞再生。”
“看起来像吃豆小姐。”
“那个很好玩。”
卡特说,“我们随机在迷宫中设置奖励,现在它已经玩到五千多关,但也找到了绕开规则的方法。”
“什么方法?”
罗克看到屏幕上每次开始新关卡都会被一片闪烁的绿色迷雾覆盖。
卡特说:“它在整个迷宫里释放药物,完全不考虑剂量问题。”
“艾斯卡也会这样?”
“艾斯卡复杂得多,但是早期要让他走几步可比这困难多了,机器人会觉得滚来滚去比走路轻松,认为最完美的躯体是半人马形态。”
卡特笑得越来越像个闲聊八卦的朋友,甚至从桌边的抽屉里打开一袋巧克力问罗克要不要吃一块。
“不,谢谢。”
“为了让艾斯卡避免曲解人类的意图,使他在和人类合作时减少错误,我们为他设计了一个模拟训练环境。在那个模拟环境里,他也有一个虚拟的人类警官搭档,名叫雷修。”
“虚拟人类警官搭档?”
“是的,他在模拟环境中与雷修警官合作。我们得到许可,能用警方案件存档中的数据作为训练集,而雷修警官也被设置成一个包含了很多人类会犯的错误合集,艾斯卡需要不断纠正他的错误并找出正确的破案方法。当然,他还要在训练中学会如何和这位一意孤行的虚拟人类警官合作。一开始,失败的概率很高,尽管艾斯卡提出了有效的建议,但是因为搭档的反对和抗拒而无法执行,然后他学会了绕开雷修警官单独查案,虽然破案率有了提升,但并不符合我们的预期。”
卡特说,“他不能和人类合作,继续展下去就会视人类为阻碍。所以我们又将提高和雷修警官的关系作为训练目标,艾斯卡现当他讨好搭档时,对方的反对和抗拒程度会降低。”
罗克总觉得这家伙在暗示什么,忍不住问:“所以他就学会了拍马屁?”
“惊喜吗?这一套在我们人类当中也一样行得通,不需要额外干涉和设定,寻找捷径是生物的本能。”
卡特说,“在模拟环境中,艾斯卡以很短的时间解决了数万个案件,并且在不断合作下和雷修警官成为形影不离的搭档。”
“他还记得这个……雷修警官吗?”
“我们保留了训练数据,删除了具体的名字和形象。”
卡特咬着巧克力说,“不过也不能说是完全删除,重要记忆和次要记忆会分开在不同区域存储,就像人类一样,有些事即使年代久远也能记忆犹新,有些则会渐渐淡忘,重放机制还会帮助他巩固记忆。这是很复杂的问题,如果你有兴趣我们可以好好聊聊。”