返回第514章 里面是谁我不知道,反正院士也只能在外边  摸鱼新手首页

关灯 护眼     字体:

上一章 目录 下一页

第514章 里面是谁我不知道,反正院士也只能在外边

他之所以愿意接过来看看,主要是听说潘伟当初也是这样。

搞个电影模型,惊动了军方,好傢伙,好几架直升机轰隆隆降临魔都大学,直接把人给带走了。

听说是参与到军方绝密任务里面去了,他不知道內情,但猜也能猜出来,跟潘伟有关,军方参与,不是火箭卫星啊就是战斗机那些东西。

据说潘伟也因此得到了上面的嘉奖。

许清风作为主导者,前途属於是瞎眼可见,轿子眾人抬,吴恩铭不介意给这棵正在成长的树浇一点水。

不然他堂堂院长、中科院院士就算跟许清风关係好,也不可能这么上心。

“《transforr架构+混合专家模型(oe)=人工智慧的新时代》”

嚯!

这口气可真够大的,吴恩铭內涵地看了一眼许清风。

狂,这是吴恩铭第一次直观地感受到年轻人的狂妄。

科幻小说中一直都有提过ai,人类从计算机诞生以来也一直在思考研究怎么创作出真正的人工智慧。

但直到现在,所谓的人工智慧更像是个智能客服机器人,只能回答指定的问题给出固定的答案,无非就是这个程序知道的答案很多,代码更复杂一些,仅此而已。

就连魔都大学研究的人工智慧,在他看来也不过是徒有其表。

吴恩铭心底摇了摇头,不过却没表现出来,他翻开资料看了起来。

“天机基於经典的transforr架构构建,继承了其核心组件和机制,天机採用標准的transforr编码器—解码器设计,其中编码器负责理解输入语义,解码器负责生成输出序列。每个编码器层包含多头自注意力机制和前馈神经网络————

这种机制通过门控网络实时调整注意力分布,在长文本生成任务中使语义连贯性指標(bleu—4)从032提升至045————”

上来就是一连串的专业术语,让不以为然的吴恩铭表情一下子就凝重起来。

继续往下看。

“经典的transforr稠密架构,採用纯解码器(deder—only)设计,参数量至少万亿,並且需要全量参数参与计算,不仅耗时耗力,而且成本剧增————”

吴恩铭已经有点忍不住了,这是成本的问题吗?这是有没有的问题,在他看来,如果真的有一个许清风描述的这样一个人工智慧,哪怕成本再高,也是值得的!

而这,许清风却觉得不够好,嫌弃它成本太高!

吴恩铭看许清风眼神那叫一个恨铁不成钢,现在是挑挑拣拣的时候吗?

先解决有没有,再解决好不好,这才是正常思路。

“本產品採用混合专家系统(oe)架构,其核心由128个专家子网络组成,通过动態路由机制在推理时激活2—4个专家,这种设计参数量达到18万亿,但实际计算成本仅相当於500亿参数的稠密模型。

本架构的特点:

稀疏激活:仅激活部分参数(如10),在保持大规模参数的同时大幅降低计算开销————”

吴恩铭

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一章 目录 下一页