返回第一百一十七章 平台期  路大头首页

关灯 护眼     字体:

上一页 目录 下一章

oe,ixtureofexperts,混合专家模型。不是把一个模型训得什么都会,而是训一群各有专长的小模型,遇到问题再决定派谁上。像一家公司,与其要求每个员工全能,不如让专业的人做专业的事。

“这个主要是架构层面的改变。不改基座,不改训练方法,改调用方式、推理方式。把一个大模型拆成多个专精的子模型——一个擅长python、一个擅长前端、一个擅长数据库。推理时根据任务类型自动路由到最合适的专家,同算力下效果更好,应该也能提三到五个点。”赵文渊接着说。

“成本?”韩路一问道。

“一千到两千万,架构要重写,模型要重训,时间四到八个月。”赵文渊说,“技术上挑战不算太大,成本主要是要调的模型多。但是需要补人,我们现在的团队在oe方面没有经验,至少要招两到三个做过类似架构的人。”

“最后说第三条。”赵文渊又翻了一页,语气中有点儿兴奋——是他作为科学家的兴奋。

“这个主要是架构层面的改变。不改基座,不改训练方法,改调用方式、推理方式。把一个大模型拆成多个专精的子模型——一个擅长python、一个擅长前端、一个擅长数据库。推理时根据任务类型自动路由到最合适的专家,同算力下效果更好,应该也能提三到五个点。”赵文渊接着说。

“成本?”韩路一问道。

“一千到两千万,架构要重写,模型要重训,时间四到八个月。”赵文渊说,“技术上挑战不算太大,成本主要是要调的模型多。但是需要补人,我们现在的团队在oe方面没有经验,至少要招两到三个做过类似架构的人。”

“最后说第三条。”赵文渊又翻了一页,语气中有点儿兴奋——是他作为科学家的兴奋。

『加入书签,方便阅读』

上一页 目录 下一章