第二百四十八章 世界第一的宝座 路大头
nexai的休息室里,迈克尔低声骂了一句:“该死。”
山姆侧过身,看向旁边的一位研究员。
“接下来,是我们今天非常兴奋的一部分。我们认为未来的人机交互不应该被文本框限制,所以我们带来了gpt-voni。”
旁边的电视连上了山姆手机的投屏,显示出他的手机画面。
山姆在chatgpt的app里面点了一个键,对话框消失,变成了一个实时视频画面,视频中出现的是手机前置摄像头的画面——山姆,两个研究员,他们背后的沙发和背景。
研究员接过手机,举起来扫了一圈。
“你现在能看到什么?”
电视里响起了一个略显呆板的女声。
“我看到一个发布会舞台。沙发上坐着三个人,中间的人是山姆奥特曼。桌上有一杯水,旁边还有一台电视正在显示我的实时画面。台下应该有观众,因为我能听到环境声和偶尔的说话声。”
现场起了一阵巨大的骚动。
实时互动,这是从没出现过的交互方式。
研究员把摄像头对准山姆。
“他现在的表情怎么样?”
chatgpt毫无停顿地说道:“他看起来有点儿紧张,可能在期待什么评价,根据我们现在的场景,也许他在等观众的反应。”
台下笑了起来,山姆也笑了。
瑞恩看着屏幕上的直播画面,已经很久没有说话了,他的手指在椅子上一下一下的、有节奏的敲击着。
发布会现场,山姆等掌声结束后,再次开口。
“gpt-voni可以实时理解文本、语音、图像和视频,它不是把多个系统拼在一起,而是世界上第一个端到端的多模态模型。”
现场和线上的观众们已经理解了oni的含义,它是一个源自拉丁语的前缀,代表“全”、“总”的意思。这个模型,是一个全能模型。
“gpt-voni将在未来几周逐步向开发者和企业用户开放。我们也会把它的部分能力集成到chatgpt里,让更多用户能够体验自然的多模态交互。”
最后,电视的画面定格在两个模型的名字上。
gpt-v
gpt-voni
一个旗舰通用模型。
一个原生多模态模型。
两个模型并排出现的时候,发布会现场的氛围已经彻底被openai掌控。
山姆这才轻描淡写地说出了总结语:“我们尊重所有同行在ai能力上的探索,但我们也认为,只是专注于刷新榜单,并不能有助于实现agi的到来。”
这句话没有指名道姓,但是所有人都听得出来是在针对谁。
nexai的金星模型专注刷榜,还刷不过gpt-v,而openai还带来了世界首个原生多模态。
openai不愧是openai,你爸爸还是你爸爸。
这场发布会比nexai的那场还要短,很快就进入了媒体提问环节。
第一个站起来的记者来自theverge。
“山姆,两个小时前nexai宣布ven模型在多个榜
章节内容不完整,请退出阅读模式查看完整内容!