刚刚,OpenAI深夜直播,GPT-4o的原生图像生成大升级!奥特曼亲自上阵组队,演示了自拍变梗图、相对论漫画等功能,不过相对隔壁谷歌发布的新模型,OpenAI的这波动作着实有点不够看。
就在谷歌刚刚扔出地表最强模型Gemini 2.5 Pro不久,OpenAI也有动作了。
奥特曼亲自带队,展示了GPT-4o图像生成技术的各种大升级,比如制作梗图、文本渲染、多轮交互生成和指令遵循等。
整个直播中最亮的演示,莫过于这张官方玩梗的表情包了。
目前,这项功能已经在ChatGPT和Sora中,向所有Plus、Pro、Team和免费用户推出。
当然,新版Sora生图的时间,也比以往更长了。但OpenAI看来,生图的质量和其具备的世界知识,让用户值得等待那多出的几秒。
GPT-4o原生图像生成来了!
在直播中,奥特曼介绍道,从今天起,ChatGPT中的原生图像生成功能正式推出!
GPT-4o的全模态能力,从此也融合进了Sora中。
OpenAI多模态研究的负责人Gabe介绍说,两年前刚开始这个项目时,他对于GPT-4这个强大的模型会怎样原生支持图像模型非常好奇。
一年后,当模型完成训练时,他看到了令人兴奋的迹象。从GPT-2以来,他已经很久没有这种感觉——这是一个疯狂时刻。
给出以下prompt,GPT-4o就生成了符合要求的图像,完全还原了要求。
接下来,三个人用手机来了张自拍,GPT-4o立刻把三人自拍转换成了动漫风格的版本。
甚至他们开始官方玩梗,让模型添加一段「Feel The AGI」在图片上,一张表情包就此诞生。
这个过程,就体现了4o作为全能模型的强大能力。
因为它不仅仅是一个语言模型,还包括图像、音频,所有输入和输出的模态。它可以理解、生成这些模态,并且无缝地在它们之间工作。
用OpenAI的话说,「我们终于迈向了这种真正集成的多模态模型」。 |
|