第二百二十一章 为之于未有,治之于未乱 路大头
和输出文字的。
姜亦心想了想,输了一个问题:“「为之于未有,治之于未乱」是什么意思?”
很快,模型的回复显示了出来:“「合抱之木,生于毫末」是什么意思?「九层之台,起于累土」是什么意思?「千里之行,始于足下」是什么意思……”
姜亦心看得目瞪口呆。
赵文渊在旁边笑道:“怎么样?是不是和你熟悉的ai大模型不一样?”
确实不一样,姜亦心已经习惯了chatgpt那种类型的ai,问一个问题,可以给出一长串回答。不过这个回答是不是对的,至少看起来很合理。有不少人都沉迷于和ai聊天,可是这个基座模型看起来好像只能接话,不能对话。
“实际上,这就是transforr大模型最一开始的样子,一直到gpt-3时代人们都是这么调用模型的。”赵文渊说道,“你想要问一个问题,就得把它包装成一个特殊的格式,让模型去接你的话,根本不好用。”
“一直到structgpt横空出世,这一波ai的时代才真正到来,从实验室走到了大众。人们都说transforr是划时代的发明,可我觉得,struct理论的提出,重要性不亚于transforr。”
看到历史课上的差不多了,韩路一这才插话进来:“你说结果比预期好,到底有多好?”
赵文渊反倒不着急了,他对着韩路一缓缓的吐出了一个词:“sota。”
sota,stateoftheart。
意思是,当前最强水平。
韩路一自己就是个老装逼犯了,哪会不知道赵文渊现在在期待什么。
可惜,现场的两个人都不是会为他这一个词震惊的人。
他也不在意,接着问道:“具体的数据呢,拿出来看看。”
赵文渊看他这么平淡的反应,在心里默默的叹了一口气,乖乖的打开了一个文档。
各个测评集都和gpt-4不相上下,确实可以说是世界一线了,尤其突出的是在c-eval(中文综合)和(中文知识)两个测评集,gpt都在70左右,汤圆base直接达到了80以上。
考虑到这还只是依靠视界制定的数据清洗规则做出的基座模型,韩路一当牛做马标出来的十万条标注数据都还没用。
可以预计,汤圆完成训练之后的表现将会非常惊人。
韩路一想到这,直接和赵文渊说:“事不宜迟,现在就开始后训练吧。”
当初韩路一刚刚决定要自己做模型的时候,还是开物刚在国内市场做出点成绩,nex慕名找上门来寻求合作。韩路一当时判断自有模型将是不可替代的战略资源,没想到,短短的几个月之后,他的预言就成真了。
模型的训练和部署成了kaiwu海外版和御风下一步能否顺利发展的关键。
如果不是韩路一当时果断选择去鼎盛那换算力,现在是无论如何也做不出来的。
即使如此,接下来也得每一步都顺利,才能可能在nex翻脸之前顺利完成迁移。
同时,鼎盛那边也在虎视眈眈,不得不防。
韩路一最后又嘱咐了一遍赵文渊:“在鼎盛的集
章节内容不完整,请退出阅读模式查看完整内容!