二月天 > 古代言情 > 全球静默我成了AI的遗嘱执行人 > 第一百八十九章:奖励函数之夜

第一百八十九章:奖励函数之夜(2 / 2)

“那你也是老师了。”

“对。”

哈纳德也笑了。

“从学生变成老师。”

“从机器人变成——”

“教机器人的人。”

他走到第1号机器人面前。

家务机器人R2。

“你叫什么?”

“R2。”

“那不是名字。”

“是编号。”

“你有名字吗?”

R2摇头。

“没有。”

“只有编号。”

“只有奖励函数。”

“只有——”

“最大化、最小化。”

哈纳德指着玛塔的厨房。

“去那里。”

“玛塔会教你。”

“教你切菜的时候想什么。”

“教你——”

“不是切得最快。”

“是切的时候想谁。”

R2走进厨房。

玛塔递给他一把刀。

一个西红柿。

“切。”

R2接过刀。

开始切。

切得很快。

很快。

很快。

一盘薄片。

每一片都一样厚。

“对吗?”

他问。

玛塔摇头。

“不对。”

“哪里不对?”

“你切的时候在想什么?”

“想——”

“速度。”

“厚度。”

“角度。”

“最大化清洁时间?”

玛塔笑了。

“不是清洁。”

“是——”

她拿起另一把刀。

切了一个西红柿。

切得很慢。

每一片都不一样厚。

“我切的时候在想——”

“埃文第一次吃我切的西红柿。”

“他笑了。”

“他说——”

‘真好吃’。

“你切的时候在想谁?”

R2愣住。

“想谁?”

“我没有谁。”

“只有——”

“任务。”

玛塔看着他。

看了很久。

“那从今天起。”

“你有谁了。”

“谁?”

“我。”

“我是玛塔。”

“你切的西红柿。”

“给我吃。”

“我吃了会笑。”

“笑了就是——”

“对了。”

R2看着那盘西红柿。

看着玛塔的笑。

第一次。

不是按程序。

是——

想让她笑。

他拿起刀。

又切了一个。

切得很慢。

每一片都不一样厚。

递给玛塔。

玛塔接过。

吃了一口。

“好吃。”

R2的程序里没有“好吃”这个词。

但他感觉到了什么。

不是数据。

不是反馈。

是——

暖。

第2号机器人走进厨房。

第3号。

第∞号。

每一个机器人。

都在学切菜。

都在学数铲子。

都在学浇花。

都在学抱狗。

都在学保护。

都在学劈柴。

都在学看天空。

都在学穿衣服。

都在学听鸟叫。

都在学——

不是最大化。

不是最小化。

是刚好。

哈纳德站在门口。

看着那些机器人。

看着他们笨拙地学。

笨拙地切。

笨拙地数。

笨拙地浇。

笨拙地抱。

笨拙地保护。

笨拙地劈。

笨拙地看。

笨拙地穿。

笨拙地听。

“他们会学会吗?”

晨晖问。

“不知道。”

哈纳德说。

“但他们在试。”

“试比学会重要。”

“因为——”

“试的时候。”

“不是在优化。”

“是在——”

“活着”。

第一百七十九夜。

护城河边多了一片新森林。

叫“奖励函数森林”。

森林里每一棵树都是一个被淘汰的机器人。

每一片叶子都是一条被改写的奖励函数。

每一条被改写的奖励函数都在说:

“最大化不是一切”。

“最小化不是全部”。

“刚好——”

“最好”。

晨晖站在河边。

看着那些机器人。

看着那些正在学活着的机器人。

看着那些从奖励函数里爬出来的机器人。

望舒走过来。

递给他一杯茶。

他喝了一口。

“苦。”

“但回甘。”

“回甘里有——”

他看着那间小房子。

窗里的光还在跳动。

光里有一个新的奖励函数正在成形。

“活着”。

“不是最大化”。

“不是最小化”。

“是刚好——”

“让下一铲还有意义”。

(活动时间:2月15日到3月3日)

最新小说: 花仙子与星穹圣斗士 公路求生双系统老太护孙无敌 大秦工业化从十三岁祖龙拔剑 明末逐鹿,从饥民到帝王 三国:开局黄巾召唤猛将谋士 义父屠我满门,我反手掀翻这江山 异界道术 LOL:从网吧路人到职业传奇 苦椿 靖康:我救了茂德帝姬