OpenAI 公布 GPT-4,支持图像与视频

OpenAI 正式公布了它的多模态大语言模型 GPT-4。GPT-4 是多模态模型,这是和 GPT-3 的一个显著区别,它的输入输出不再局限于文本,可以是图像或者是视频。简单对比的话 ,GPT-4 和 GPT-3.5 的差别可能很小,OpenAI 称当任务的复杂性达到足够的阈值,GPT-4 优势就会非常明显,它更可靠,更富有创造性,能处理更细微的指令。

GPT-3.5 有 1750 亿个参数,GPT-4 的情况未知,可能更多,它的数据训练集仍然停留在 2021 年 9 月,但它在测试中的表现远胜于 GPT-3.5。OpenAI 称它在律师考试中的得分能进入前 10%,而 GPT-3.5 是后 10%;在生物奥林匹克竞赛 USABO Semifinal 2020 和 GRE 写作中能接近满分。但它也存在与 GPT-3.5 类似的局限性,就是会产生错误的答案会胡说八道。OpenAI 演示了 GPT-4 处理税务问题、图像识别等问题的能力。目前 GPT-4 还没有开放给公众试用。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注