第258章划时代的意义_天才之上

学习如何指挥交通，学习自动驾驶，学习人脸生物识别，等等，还有很多东西。

等到这些都学会了一一智慧城市的概念你应该知道吧？到时候你也许就能体验到真正的智慧城市是什么样了。反正肯定不是公交车站多几个无线充电装置；酒店里用滚轮机器人送货；酒吧里装几个机械臂那么简单的。如果按照我的构想，未来的教育、交通、大众医疗、购物、公共安全、反诈、吃喝玩乐，都可以有个小管家去服务，不然多浪费小贝恩的拳拳报国之心啊。”简从义再次无话可说了。

他的想象力过于贫瘩，实在想象不出乔贝恩深入融入人类社会会是什么样。

应该能比现在更好吧？

“好了，不说了，回家睡觉。我有预感这几天我会很忙的。你也没什么时间休息！”

“这是一种将知识图谱编码为张量的压缩方法。从理论上说并不算特别创新，都是图表示学习加张量压缩方面的东西。根据谷歌公开的相关研究数据显示，将搜索知识图谱张量化后，存储成本能下降百分之六十三，推理延迟降低百分之三十九。ta也有相关研究。23年他们将知识图谱张量化，模型体积缩小41。我们有为的盘古大模型知识模块压缩方案核心同样是拓扑张量编码，我们还专门申请过专利。但之所以没有大规模推广这种压缩技术，主要是还有几大技术难点。

第一就是这种方法的动态更新成本过高。要知道知识图谱每天都在新增，而每次张量分解需要全量重训，导致计算成本激增。其次，这种压缩方法的语义保真度一直没有得到有效的提高。在高压缩率下，长尾实体跟稀疏关系很容易导致嵌入失真。再有就是张量模型在垂直领域的泛化能力极弱。比如ta公司的-kg压缩方案在通用语料很有效，但如果迁移到医疗图谱，就需要重新标注十万多个三元组微调，成本极高。

乔博士所设计的智能体所做的就是针对这些缺陷做了改良。具体采用的数学方法，目前我们还不得而知。但从后智能体相关后日志的分析结果来看，智能体乔贝恩在记忆库更新时，只需要重编受影响的片段。也就是说当数据库新增三元组时，乔贝恩可以仅对受影响的核心张量切片做低秩更新。这就完美解决了张量压缩技术瓶颈的第一个技术难题。其次我们发现，智能体乔贝恩应该是通过某种算法实现了层次化的语义保真技术。具体就是智能体乔贝恩将知识图谱按它认定的标准，做重要性的分层压缩。对不同的层级采用了不同的张量秩。文字内容中的核心实体采用低压缩率保留细节，对于长尾实体则用高压缩率做聚合表示。并在这些不同层级之间设计了一种残差连接，这样就能让边缘层的语义通过核心层的推理来还原语义细节。其效果就是在整体压缩率不变的情况下，长尾实体语义保真度提升了百分之七十以上。

另外，乔贝恩同样解决了可迁移的领域自适应问题。目前我们只知道它用了一种极为巧妙的方式。这样在跨领域记忆的时候，就无需重训张量分解。只需要对数据进行微调，就能完美对齐相应的实体类型。”一周后，之前来过一次的保密会议室里，徐哲正在给专家组成员做着报告。

针对乔贝恩数据库的算法提取申请被专家组团队批准了，但也有要求。

有为在逆向提取了算法特征之后，需要把

章节内容不完整，请退出阅读模式查看完整内容！

『加入书签，方便阅读』