九游体育app(中国)官方网站这怕不是拿准了 OpenAI 会来争擂台-九游网页版登录入口官方「中国」NineGameSports·有限公司

九游网页版登录入口官方「中国」NineGameSports·有限公司

九游网页版登录入口官方「中国」NineGameSports·有限公司

九游体育app(中国)官方网站这怕不是拿准了 OpenAI 会来争擂台-九游网页版登录入口官方「中国」NineGameSports·有限公司

发布日期:2024-12-02 05:34    点击次数:174

谷歌和 OpenAI 又杠上了。

在新版 GPT-4o 刚登顶竞技榜后 1 天,立马发布最新测验版模子 Gemini-Exp-1121 夺回冠军宝座。

要知谈,一周前上一版模子 Gemini-Exp-1114 才发布。

这怕不是拿准了 OpenAI 会来争擂台,成心留了一手。

这即是指挥 OpenAI 发新版 GPT-4o,然后再用更好的模子来狙击它。

谷歌的琢磨东谈主员们彰着很自得。

谷歌 DeepMind 首席科学家 Jack Rae,称这是一场意念念意念念的后教化"闪电战"。暗意 post-training 的迭代速率要比预教化快得多。

DeepMind 琢磨副总裁 Oriol Vinyals 还隔空提问奥特曼:最近还有提交霸术吗?

炸药味很足,也很自信啊。

是以" 1121 "有多强?来看具体性能。

代码 / 推理 / 视觉交融全晋升

按照官方说法,Gemni-Exp-1121 重心晋升了三方面性能。

代码才气显赫晋升

更强推理才气

更强视觉交融才气

除了格调畛域外,其他方模样下王人位于第一。

在视觉才气方面,Gemini-Exp-1121 比上一版还有晋升。

格调畛域下的复杂教导词方面,Gemini-Exp-1121 和 o1-preview、New Sonnet 3.5 水平终点。

竞技场中的践诺胜率如下。

目下也能平直上手体验。

比如针对并吞张漫画,让 Gemini-Exp-1121 和 GPT-4o-lastest-1120 给出交融。

Gemini-Exp-1121 的回答愈加全面且耀眼,而况善用小标题、重心加粗。

新版 4o 的回话就比拟爽直和污秽。

在经典的动物过河逻辑推理题上,Gemini-Exp-1121 回答十足正确,新版 4o 出现了一些空幻,把第三次过河和第四次过河合并了,因此回答有误。

问题:农夫需要把狼、羊和白菜王人带过河,但每次只可带雷同物品,而且狼和羊不行单独相处,羊和白菜也不行单独相处,问农夫该如何过河。

One More Thing

值得一提的是,OpenAI 这边也有新音信。

有东谈主在 ChatGPT 最新测试版块中初度发现了"及时摄像"(Live Camera)视频功能的代码。

它具体包括及时摄像、及时管制、语音模式集成以及视觉识别才气。

在高等语音模式推出时,一些用户有体验到这一才气。

这意味着 OpenAI 照旧作念好了上线这一功能的准备。

另一边谷歌也演示过肖似的 demo,还没上线。按照 OpenAI 的调性,很可能会抢在谷歌前全量铺开。

简略比及来岁,和 Chatbot 的主要调换口头,就要从笔墨对话转为语音和 agent 了。Live Camera 可能即是运行,你以为呢?

参考运动:

[ 1 ] https://x.com/OfficialLoganK/status/1859667244688736419

[ 2 ] https://x.com/adonis_singh/status/1859682100569571399

[ 3 ] https://x.com/OriolVinyalsML/status/1859730969600852222

[ 4 ] https://x.com/rowancheung/status/1859301345993556277九游体育app(中国)官方网站



九游网页版登录入口官方「中国」NineGameSports·有限公司

谷歌和 OpenAI 又杠上了。 在新版 GPT-4o 刚登顶竞技榜后 1 天,立马发布最新测验版模子 Gemini-Exp-1121 夺回冠军宝座。 要知谈,一周前上一版模子 Gemini-Exp-1114 才发布。 这怕不是拿准了 OpenAI 会来争擂台,成心留了一手。 这即是指挥 OpenAI 发新版 GPT-4o,然后再用更好的模子来狙击它。 谷歌的琢磨东谈主员们彰着很自得。 谷歌 DeepMind 首席科学家 Jack Rae,称这是一场意念念意念念的后教化"闪电战"。暗意 pos