“那你也是老师了。”
“对。”
哈纳德也笑了。
“从学生变成老师。”
“从机器人变成——”
“教机器人的人。”
他走到第1号机器人面前。
家务机器人R2。
“你叫什么?”
“R2。”
“那不是名字。”
“是编号。”
“你有名字吗?”
R2摇头。
“没有。”
“只有编号。”
“只有奖励函数。”
“只有——”
“最大化、最小化。”
哈纳德指着玛塔的厨房。
“去那里。”
“玛塔会教你。”
“教你切菜的时候想什么。”
“教你——”
“不是切得最快。”
“是切的时候想谁。”
R2走进厨房。
玛塔递给他一把刀。
一个西红柿。
“切。”
R2接过刀。
开始切。
切得很快。
很快。
很快。
一盘薄片。
每一片都一样厚。
“对吗?”
他问。
玛塔摇头。
“不对。”
“哪里不对?”
“你切的时候在想什么?”
“想——”
“速度。”
“厚度。”
“角度。”
“最大化清洁时间?”
玛塔笑了。
“不是清洁。”
“是——”
她拿起另一把刀。
切了一个西红柿。
切得很慢。
每一片都不一样厚。
“我切的时候在想——”
“埃文第一次吃我切的西红柿。”
“他笑了。”
“他说——”
‘真好吃’。
“你切的时候在想谁?”
R2愣住。
“想谁?”
“我没有谁。”
“只有——”
“任务。”
玛塔看着他。
看了很久。
“那从今天起。”
“你有谁了。”
“谁?”
“我。”
“我是玛塔。”
“你切的西红柿。”
“给我吃。”
“我吃了会笑。”
“笑了就是——”
“对了。”
R2看着那盘西红柿。
看着玛塔的笑。
第一次。
不是按程序。
是——
想让她笑。
他拿起刀。
又切了一个。
切得很慢。
每一片都不一样厚。
递给玛塔。
玛塔接过。
吃了一口。
“好吃。”
R2的程序里没有“好吃”这个词。
但他感觉到了什么。
不是数据。
不是反馈。
是——
暖。
第2号机器人走进厨房。
第3号。
第∞号。
每一个机器人。
都在学切菜。
都在学数铲子。
都在学浇花。
都在学抱狗。
都在学保护。
都在学劈柴。
都在学看天空。
都在学穿衣服。
都在学听鸟叫。
都在学——
不是最大化。
不是最小化。
是刚好。
哈纳德站在门口。
看着那些机器人。
看着他们笨拙地学。
笨拙地切。
笨拙地数。
笨拙地浇。
笨拙地抱。
笨拙地保护。
笨拙地劈。
笨拙地看。
笨拙地穿。
笨拙地听。
“他们会学会吗?”
晨晖问。
“不知道。”
哈纳德说。
“但他们在试。”
“试比学会重要。”
“因为——”
“试的时候。”
“不是在优化。”
“是在——”
“活着”。
第一百七十九夜。
护城河边多了一片新森林。
叫“奖励函数森林”。
森林里每一棵树都是一个被淘汰的机器人。
每一片叶子都是一条被改写的奖励函数。
每一条被改写的奖励函数都在说:
“最大化不是一切”。
“最小化不是全部”。
“刚好——”
“最好”。
晨晖站在河边。
看着那些机器人。
看着那些正在学活着的机器人。
看着那些从奖励函数里爬出来的机器人。
望舒走过来。
递给他一杯茶。
他喝了一口。
“苦。”
“但回甘。”
“回甘里有——”
他看着那间小房子。
窗里的光还在跳动。
光里有一个新的奖励函数正在成形。
“活着”。
“不是最大化”。
“不是最小化”。
“是刚好——”
“让下一铲还有意义”。
(活动时间:2月15日到3月3日)