第15章 深奥的豆腐馅饺子 木也马
余弦夹起一个凉透的饺子,咬了一口,豆腐馅的口感有些新奇。
「离散」,就像这碗饺子,这一只是豆腐馅,那一只是三鲜馅,另一只是猪肉馅。
它们是界限分明的类别。
你不可能吃到一个「30猪肉馅,70豆腐馅」的混合态饺子——
在离散的定义里,即使是混合馅,那它也会被定义成一个新的、独立的「猪肉豆腐馅」类别。
这意味着什么?
余弦还没想清楚,但父母把人的「人格特质」,当成了一种类似积木的形式,是有限的,可穷举的。
继续看论文。
第二个概念,是「向量化映射」。
这是2016年的论文,也是父母出事的那年。
那时候,有个叫lpgo的围棋i,刚刚击败了曾经的围棋世界冠军李世石,i和「深度学习」的概念,开始出现在大众视野里。
而在现如今的2025年,「大语言模型」已经占据了整个世界,豆包、cgp、gro、gei、千问、元宝都是大语言模型的代表。
余弦虽然不是研究i方向的,但他知道,大语言模型的基石,就是把文字转化为「向量」。
也就是这个标题里的「向量化映射」。
爸爸妈妈竟然在十年前,就已经在对「向量化」做研究了?
一上午的学习,余弦还只能浅显的理解这个概念。
简单来说,就是在计算机眼里,所有的文字,都是以「坐标」的形式存在的。
拿这个领域里,一个很出名的公式来举例:
国王-男人+女人=皇后。
国王向量,减去男人特质,加上女人特质,等于皇后向量。
这个公式里的每一个词,都是可以转化为「坐标」,比如国王是[08, 06,-01,],王后是[08, 09,-01,]。
通过这种方式,这些文字就可以被计算了。
余弦看着碗里的饺子,脑子里也冒出了一个比喻,来帮助他理解。
如果把「猪肉水饺」看做一个向量,把「猪肉」看做一个特征向量,把「韭菜」看做另一个。
那么在这个理论里,就应该可以存在这样一个等式:
猪肉水饺-猪肉+韭菜=韭菜水饺。
猪肉水饺向量,减去猪肉特质,加上韭菜特质,等于韭菜水饺。
这听起来很魔幻,但在向量空间里,这就是成立的数学运算。
而父母的这篇论文,竟然是想要把这个方法,应用在人的身上?
余弦感觉背后的寒毛竖了起来。
他们打算把「人格」这种玄之又玄的东西,映射到一个高维的数学空间里,变成一组组坐标?
一种荒诞感袭来。
如果人格可以被「向量化」运算,那是否意味着,就不存在什么「江山易改、本性难移」了。
只要找到对应的那个特征向量,在数学层面,做一次简单的减法,或者一次加法。
一个人,就可以瞬间变成另一个人。
余弦脑子里嗡的一下,感觉最近遇到的各种事情,像是散落的珍珠,一下子被穿成了
章节内容不完整,请退出阅读模式查看完整内容!