返回第二百二十二章 这个数据不太对  路大头首页

关灯 护眼     字体:

上一页 目录 下一页

博士反而比较奇怪。

但是至少在这个组,能叫刘博士的,就只有刘大海,其他人都是直接名字相称。

这自然是因为刘大海的地位最高,鼎盛人工智能首席科学家。

刘大海看了看组员,指着屏幕上的一条标注问他:“你看这个,觉得怎么样?”

组员一头雾水,看了看,说:“挺好的啊。”

刘大海又指着另一条,问:“那你看这个呢?”

组员仔细地读了一遍,又说:“这个也挺好的……吧?”

他已经被刘大海问的有点儿不自信了。

刘大海接着问:“那你看这两条标注,有什么共同点?”

组员想了想,然后试探地说:“质量高?”

刘大海一愣,这倒是说对了,但是明显是没用的信息:“你不觉得,这些标注的语义里,对数据合规的引导太重了?”

啊?组员愣了愣,标注数据引导的是模型的行为模式,或者说,人格。

对合规有要求是很正常的吧,对齐训练不就是干这个的吗?

组员看着刘大海的样子,觉得他有点儿杞人忧天。

这批标注的质量是高,高得惊人。

你要是出去跟别人说,我现在有一批高质量的标注数据,质量太高了,还包含了合规引导。

那不会被当成是抱怨,只会被当成是炫耀。

欠打的那种炫耀。

要知道,鼎盛研究院做大模型的几个组,这段时间最苦恼的就是没有足够的高质量标注数据。

不管是外面外包的标注团队,还是鼎盛内部的标注团队,量是有的,但是质量就一眼难进,有的时候把标注加进去,模型的能力和理解力反而还下降了。

这些科学家们花在挑标注里的时间,可能比标注员花在标注上的时间都多。

组员没再搭话,接着去干自己的活儿了。

数据到位,大家都兴奋,忙的是连轴转。

刘大海看自己的怀疑没有人响应,摇了摇头,还是决定找上级汇报一下。

大模型这个事,马虎不得。

“你们先把下轮的训练停一下,等我回来再继续。”刘大海喊了一声,出了实验室,直奔林绍峰的办公室。

林绍峰是鼎盛研究院的vp,刘大海的直属领导。

两人虽然职级相同,但刘大海是ic,不管人,林绍峰却是管理岗,刘大海的考评都要林绍峰定,那自然还是有高低之分的。

刘大海是临时来的,在门口和秘书说了一声,过了一会,秘书请他进去。

“林总。”一进屋,刘大海就开门见山,“前天来的那批数据,我觉得有点儿问题,我建议训练先停一下。”

“哦?”林绍峰挑了挑眉,“你昨天不是还跟我说数据的质量很高,训练的效果也很好吗?怎么一天就变卦了。”

“不,没变。”刘大海说,“我不是说质量问题,我是觉得,里面的逻辑引导好像有点儿重。”

“有什么影响呢?”林绍峰问道。

“这个还说不好,我还得再琢磨琢磨。”刘大海实话实说。

林绍峰皱了皱眉头,坤元可是现在全集团的重点,他的

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一页 目录 下一页