延续多个月前ChatGPT的爆火，OpenAI公司于今日推出了新的里程碑——GPT-4。或许用社交媒体上刷屏的一张图，能快速看懂它的强大实力：尽管先前的ChatGPT已能通过律师资格考试，但分数只能说是勉强合格。而如今，GPT-4的得分已能超越90%的人类，可谓彻底进化出了精英的水平。即便申请顶尖名校，它的成绩也完全够格。

▲在一些标准化考试中，GPT-4的成绩已达到顶尖人类水平（图片来源：参考资料[1]）

在新闻中，OpenAI自豪地说道，GPT-4“在多种职业和学术标准上”，表现已经达到了人类水平。他们尤其强调，越是复杂的任务，越能彰显出GPT-4的实力。如果只是普通的对话，ChatGPT先前使用的GPT-3.5模型与之相差不大。但在更为进阶的领域，我们可以看到两者的巨大区别。比如在一些标准化的考试中，GPT-4的水平有着极大提升，成绩位于最顶尖的20%之列。

▲有人感叹，GPT-4或许带来了应试教育的终结（图片来源：参考资料[1]）

它在语言上也有极大的突破。先前，许多类似的人工智能工具都有些偏科，在使用英文时表现很好，使用其他语言时则表现大打折扣。在GPT-4中，这一瓶颈得到了很好的突破。OpenAI一共测试了26种不同的语言，GPT-4在其中24种语言上的表现要优于GPT-3.5在英语上的表现。换句话说，如果先前ChatGPT在英语对话中的表现曾让你感到惊艳，那么你可以期待在应用新的GPT-4模型后，在使用其他语言上也可以得到类似，甚至更好的体验。

▲GPT-4在24种语言的表现上，水平都超过了GPT-3.5在英语中的表现（图片来源：参考资料[1]）

GPT-4的另外一大亮点在于不仅可以接受文字中的信息，还可以理解图片。甚至在理解图片的过程中，顺便也理解了人类的幽默感。比如在一张图中，它不仅回答了每一张图里有什么物件，还指出其荒诞之处在于将一个过时的VGA连接器插到了一个智能手机的充电槽中。在另一张图里，它也能理解在“移动的出租车上熨烫衣服”是一件很不寻常的事。

▲GPT-4学会了看图说话，还学会了在图中寻找幽默的亮点（图片来源：参考资料[1]）

它的读图能力不仅能用于理解幽默，还可以用于进行更学术的应用。比如在提供一张柱状图时，它可以从中抓取关键信息，做出总结并进行进一步的计算分析；而当提供一些论文的截图时，它也能精炼其中的要点，并解释论文图片里的多个不同步骤。

▲GPT-4的读图能力也能用于更正经的用途……（图片来源：参考资料[1]）

说到创造力，GPT-4也同样表现出色。比如它可以用26个单词总结《灰姑娘》的故事大概，而且每一个单词开始的字母都按A-Z的顺序，不带重复……

图片来源：参考资料[2]

说的废话更少……

图片来源：参考资料[2]

还有人宣称它的知识储备也更丰富……

图片来源：Acquisition.com

尽管GPT-4在推出后的短短几个小时里凭借它的强大实力引爆了科技圈，它的开发者也指出其中的一些局限。比如尽管在答案的准确程度上有了明显提升，它有时依旧会“捏造事实”，因此在使用时需要人为进行事实的验证。《纽约时报》的一篇文章也指出，它擅长总结过去已经发生的事件，却难以和你探讨未来的无限可能。

正如OpenAI首席执行官Sam Altman先生总结的那样，GPT-4是其公司迄今为止最强大的模型。它和先前的模型相比，有更强大的创造力，在事实上把握得更准确，偏倚也更少。但它依然有缺点，有局限，在最初的几次使用后，新鲜感也会逐渐褪去。不过在这条消息下，更多人的留言反映了他们的看法：这是一个令人振奋的时刻。

当然，在这个人工智能时代，GPT-4也留给人们一个更大的问题：这个技术在未来会如何发展？又会给哪些人的生活带来颠覆？或许，只有时间才知道答案。

责任编辑：邵丽竹

审　　核：何发