OpenAI 公布 GPT-4，支持图像与视频 - FinalSee

OpenAI 公布 GPT-4，支持图像与视频

OpenAI 正式公布了它的多模态大语言模型 GPT-4。GPT-4 是多模态模型，这是和 GPT-3 的一个显著区别，它的输入输出不再局限于文本，可以是图像或者是视频。简单对比的话，GPT-4 和 GPT-3.5 的差别可能很小，OpenAI 称当任务的复杂性达到足够的阈值，GPT-4 优势就会非常明显，它更可靠，更富有创造性，能处理更细微的指令。

GPT-3.5 有 1750 亿个参数，GPT-4 的情况未知，可能更多，它的数据训练集仍然停留在 2021 年 9 月，但它在测试中的表现远胜于 GPT-3.5。OpenAI 称它在律师考试中的得分能进入前 10%，而 GPT-3.5 是后 10%；在生物奥林匹克竞赛 USABO Semifinal 2020 和 GRE 写作中能接近满分。但它也存在与 GPT-3.5 类似的局限性，就是会产生错误的答案会胡说八道。OpenAI 演示了 GPT-4 处理税务问题、图像识别等问题的能力。目前 GPT-4 还没有开放给公众试用。

发表回复取消回复