延续多个月前ChatGPT的爆火,OpenAI公司于今日推出了新的里程碑——GPT-4。或许用社交媒体上刷屏的一张图,能快速看懂它的强大实力:尽管先前的ChatGPT已能通过律师资格考试,但分数只能说是勉强合格。而如今,GPT-4的得分已能超越90%的人类,可谓彻底进化出了精英的水平。即便申请顶尖名校,它的成绩也完全够格。
▲在一些标准化考试中,GPT-4的成绩已达到顶尖人类水平(图片来源:参考资料[1])
在新闻中,OpenAI自豪地说道,GPT-4“在多种职业和学术标准上”,表现已经达到了人类水平。他们尤其强调,越是复杂的任务,越能彰显出GPT-4的实力。如果只是普通的对话,ChatGPT先前使用的GPT-3.5模型与之相差不大。但在更为进阶的领域,我们可以看到两者的巨大区别。比如在一些标准化的考试中,GPT-4的水平有着极大提升,成绩位于最顶尖的20%之列。
▲有人感叹,GPT-4或许带来了应试教育的终结(图片来源:参考资料[1])
它在语言上也有极大的突破。先前,许多类似的人工智能工具都有些偏科,在使用英文时表现很好,使用其他语言时则表现大打折扣。在GPT-4中,这一瓶颈得到了很好的突破。OpenAI一共测试了26种不同的语言,GPT-4在其中24种语言上的表现要优于GPT-3.5在英语上的表现。换句话说,如果先前ChatGPT在英语对话中的表现曾让你感到惊艳,那么你可以期待在应用新的GPT-4模型后,在使用其他语言上也可以得到类似,甚至更好的体验。
▲GPT-4在24种语言的表现上,水平都超过了GPT-3.5在英语中的表现(图片来源:参考资料[1])
GPT-4的另外一大亮点在于不仅可以接受文字中的信息,还可以理解图片。甚至在理解图片的过程中,顺便也理解了人类的幽默感。比如在一张图中,它不仅回答了每一张图里有什么物件,还指出其荒诞之处在于将一个过时的VGA连接器插到了一个智能手机的充电槽中。在另一张图里,它也能理解在“移动的出租车上熨烫衣服”是一件很不寻常的事。
▲GPT-4学会了看图说话,还学会了在图中寻找幽默的亮点(图片来源:参考资料[1])
它的读图能力不仅能用于理解幽默,还可以用于进行更学术的应用。比如在提供一张柱状图时,它可以从中抓取关键信息,做出总结并进行进一步的计算分析;而当提供一些论文的截图时,它也能精炼其中的要点,并解释论文图片里的多个不同步骤。
▲GPT-4的读图能力也能用于更正经的用途……(图片来源:参考资料[1])
说到创造力,GPT-4也同样表现出色。比如它可以用26个单词总结《灰姑娘》的故事大概,而且每一个单词开始的字母都按A-Z的顺序,不带重复……
图片来源:参考资料[2]
说的废话更少……
图片来源:参考资料[2]
还有人宣称它的知识储备也更丰富……
图片来源:Acquisition.com
尽管GPT-4在推出后的短短几个小时里凭借它的强大实力引爆了科技圈,它的开发者也指出其中的一些局限。比如尽管在答案的准确程度上有了明显提升,它有时依旧会“捏造事实”,因此在使用时需要人为进行事实的验证。《纽约时报》的一篇文章也指出,它擅长总结过去已经发生的事件,却难以和你探讨未来的无限可能。
正如OpenAI首席执行官Sam Altman先生总结的那样,GPT-4是其公司迄今为止最强大的模型。它和先前的模型相比,有更强大的创造力,在事实上把握得更准确,偏倚也更少。但它依然有缺点,有局限,在最初的几次使用后,新鲜感也会逐渐褪去。不过在这条消息下,更多人的留言反映了他们的看法:这是一个令人振奋的时刻。
当然,在这个人工智能时代,GPT-4也留给人们一个更大的问题:这个技术在未来会如何发展?又会给哪些人的生活带来颠覆?或许,只有时间才知道答案。
评论
加载更多