第二百五十章 硅谷的晚上 路大头
詹森·黄还坐在办公室里,这个时间办公楼里的人已经走得差不多了,但他的秘书知道,只要有事,他可以工作到任何时候。
他的办公室里还坐着两个人。
一个是负责数据中心业务的副总裁菲利普,另一个是战略研究部门的负责人特拉维斯。
特拉维斯把一份刚整理出来的简报放到了詹森面前的桌上。
“今天中国有一家叫源智科技的初创公司发布了一个大模型。”特拉维斯说,“叫tangyuan,09版本。发布的方式很低调,就是一场线上直播,没有专门的发布会,但是数据放出来之后,现在第三方榜单上排第一。”
詹森没有去拿那份简报,他静静的坐在椅子上。
tangyuan这个名字,对欧美人来说没什么意义,但是詹森知道那是什么,他小时候就爱吃,黑芝麻馅的、红豆馅的。
没想到有人拿小吃来命名模型,真有意思。
“他们的算力是哪儿来的?”詹森问出了他最关心的问题。
榜单这种事情不重要,今天在硅谷,英伟达的两家客户刚打了一架,打的就是榜单排名。
对英伟达来说,这种竞争是好事,只要他们用的都是英伟达的gpu。
模型越大,竞争越激烈,算力需求就越高。
不管最后是谁赢,都需要更多gpu,这是英伟达最喜欢看到的局面。
但是一个从没听说过的中国公司突然发布一个大模型,能力还超过了openai和nexai的模型,那它背后肯定有一个巨大的训练集群。
那这个集群有多少卡?什么型号?在哪里?谁提供的?
最关键的是,有没有绕开英伟达的生态?
这才是詹森真正需要知道的事情。
菲利普接过了这个问题,他在来之前已经做过了功课。
“从我们掌握的信息来看,他们采购的是中国另外一家初创企业刚刚量产的gpu,规格比我们的h100还要低,只买了五百张。”
詹森原本靠在椅背上,听到这句话的时候,突然坐直了身子,动作大的吓了两个下属一跳。
“不可能!”詹森脱口而出。
才五百张?训练sota大模型?这不符合他的认知。
“没有人能用这个规模训练超大模型。”詹森肯定地说。
特拉维斯在旁边清了清嗓子。
“我这边还有一些别的信息,是我从特殊渠道收集到的。”他说,“这个源智科技,应该用的是鼎盛的算力。”
“鼎盛采购了多少?”詹森问道。
菲利普打开电脑迅速的查阅了一下,鼎盛是中国市场最大的客户之一,各个渠道的汇总数据随时在更新。
“各个渠道加起来,最少有三万张a100,八万张a800和h800,至于h100——”
菲利普手头没有数据,因为h100在禁令上是严格禁止的,所有向鼎盛的流通都通过一些灰色渠道。
詹森知道他的顾虑,也没追问。他知道大概数就足够了。
如果用的是鼎盛的算力资源,那就说得通了。
至少还在英伟达的生态体系里。这让詹森松
章节内容不完整,请退出阅读模式查看完整内容!