第一百四十三章 把他的数据供应商,挖过来 路大头
百美金往上。他们说的是不到一万条数据,就算一万条,光数据成本就是一百万美金。”
“这种精度的标注不可能是一两个人手工做的。要么有专业的标注团队,要么有独家数据源,要么是和哪个大型研究机构合作。”
郑晓波看向程远,下了命令:
“让商务情报团队去查,源码科技的工商变更、公开的合作披露,看看他们最近半年有没有和标注公司或数据机构打过交道。再查查他们的招聘岗位,有没有招过标注相关的人。”
程远点头,在文件夹内页空白处快速记了几笔。
“找到他的数据供应商,”郑晓波说,“直接挖过来。”
刘大海补了一句:“如果能找到标注规范文档,那比数据本身还值钱。有了规范至少知道方向在哪,咱们可以试试自己做。”
郑晓波看了他一眼,微微点了点头。
“第二件事,”他的视线回到程远身上,“算力合作可以先谈着。”
程远抬头,好像自己没想通:“谈合作。”
“但是有条件。合作框架里必须包含一条——共享训练数据。”
“如果韩路一不同意呢?”程远问。
“先谈着,但别把姿态摆太高。”郑晓波的声音中气很足,“算力他能找别人要,这个数据我们暂时还找不到第二家。”
“等找到他的供应商,就不用谈了。”
程远露出恍然大悟的神色,赶紧把这句话也记下了。
刘大海在旁边全程看着,觉得这俩人聊天跟演双簧似的。这拍马屁的功夫,比机器学习还难学哦。
郑晓波把转椅一转,面向落地窗。
黄浦江在下面拐了个弯,对岸的写字楼群在冬天的薄雾里若隐若现。
他背对着两个人,说了最后一个问题。
“大海,你跟我说句实话。”
刘大海看着他的背影。
“如果拿到他们的数据,坤元能提高多少?”
刘大海没有立刻回答。
他想了几秒钟。
作为一个在机器学习行业泡了十几年的人,他太清楚852意味着什么。坤元的意图理解是78,已经是国内第一梯队。换句话说,从78到85,这七个点,鼎盛模型组两百多人干了半年也没摸到门。
而那俩人,哦对,韩路一,用一万条数据就做到了。
关键不是他的模型有多好,关键是那一万条数据有多好。
他越想越是兴奋。
“郑总,如果咱们能拿到他那种精度的标注数据,哪怕只给我五万条——”
他停了一下。
“坤元能把这个行业的天花板,给捅个窟窿出来。到时候就是咱们鼎盛的模型在全球第一。”
郑晓波转过身来,窗外灰白色的天光勾出他的轮廓,脸上带着淡淡的笑意。
“那我就拭目以待了。”
“程远,你去办吧。”郑晓波拿起桌上的矿泉水喝了一口,“算力合作的事,先别给韩路一回复,让他等两天。”
程远愣了一下:“郑总,这是……”
“记住,在谈判桌上,先开口的人,输。”
……
章节内容不完整,请退出阅读模式查看完整内容!