返回第258章 划时代的意义  一桶布丁首页

关灯 护眼     字体:

上一页 目录 下一页

学习如何指挥交通,学习自动驾驶,学习人脸生物识别,等等,还有很多东西。

等到这些都学会了一一智慧城市的概念你应该知道吧?到时候你也许就能体验到真正的智慧城市是什么样了。反正肯定不是公交车站多几个无线充电装置;酒店里用滚轮机器人送货;酒吧里装几个机械臂那么简单的。如果按照我的构想,未来的教育、交通、大众医疗、购物、公共安全、反诈、吃喝玩乐,都可以有个小管家去服务,不然多浪费小贝恩的拳拳报国之心啊。”简从义再次无话可说了。

他的想象力过于贫瘩,实在想象不出乔贝恩深入融入人类社会会是什么样。

应该能比现在更好吧?

“好了,不说了,回家睡觉。我有预感这几天我会很忙的。你也没什么时间休息!”

“这是一种将知识图谱编码为张量的压缩方法。从理论上说并不算特别创新,都是图表示学习加张量压缩方面的东西。根据谷歌公开的相关研究数据显示,将搜索知识图谱张量化后,存储成本能下降百分之六十三,推理延迟降低百分之三十九。ta也有相关研究。23年他们将知识图谱张量化,模型体积缩小41。我们有为的盘古大模型知识模块压缩方案核心同样是拓扑张量编码,我们还专门申请过专利。但之所以没有大规模推广这种压缩技术,主要是还有几大技术难点。

第一就是这种方法的动态更新成本过高。要知道知识图谱每天都在新增,而每次张量分解需要全量重训,导致计算成本激增。其次,这种压缩方法的语义保真度一直没有得到有效的提高。在高压缩率下,长尾实体跟稀疏关系很容易导致嵌入失真。再有就是张量模型在垂直领域的泛化能力极弱。比如ta公司的-kg压缩方案在通用语料很有效,但如果迁移到医疗图谱,就需要重新标注十万多个三元组微调,成本极高。

乔博士所设计的智能体所做的就是针对这些缺陷做了改良。具体采用的数学方法,目前我们还不得而知。但从后智能体相关后日志的分析结果来看,智能体乔贝恩在记忆库更新时,只需要重编受影响的片段。也就是说当数据库新增三元组时,乔贝恩可以仅对受影响的核心张量切片做低秩更新。这就完美解决了张量压缩技术瓶颈的第一个技术难题。其次我们发现,智能体乔贝恩应该是通过某种算法实现了层次化的语义保真技术。具体就是智能体乔贝恩将知识图谱按它认定的标准,做重要性的分层压缩。对不同的层级采用了不同的张量秩。文字内容中的核心实体采用低压缩率保留细节,对于长尾实体则用高压缩率做聚合表示。并在这些不同层级之间设计了一种残差连接,这样就能让边缘层的语义通过核心层的推理来还原语义细节。其效果就是在整体压缩率不变的情况下,长尾实体语义保真度提升了百分之七十以上。

另外,乔贝恩同样解决了可迁移的领域自适应问题。目前我们只知道它用了一种极为巧妙的方式。这样在跨领域记忆的时候,就无需重训张量分解。只需要对数据进行微调,就能完美对齐相应的实体类型。”一周后,之前来过一次的保密会议室里,徐哲正在给专家组成员做着报告。

针对乔贝恩数据库的算法提取申请被专家组团队批准了,但也有要求。

有为在逆向提取了算法特征之后,需要把

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一页 目录 下一页