从一般人的角度去对比GPT-3.5 以及GPT-4 之间的差距,或者有一定的难度,于是OpenAI 方面就举出非常实在的例子- 让两代GPT 一同去「考试」。
OpenAI 让GPT-4 参加了多项人类通用考试,结果证明它在许多测试和基准测试中的表现确实有了显著提升,例如在SAT(亦即美国的高考)考试中,GPT-4 目前已经可以在1600 分中得到1410分;另外GPT-4 亦成功通过模拟律师考试,分数更是应试者的前10%,相比之下,GPT-3.5 的得分只在倒数10%左右。
在之前的版本中,ChatGPT 已展现了非常强大的多语言理解以及翻译能力,但来到GPT-4,这方面的性能将再获得加强,具体的效果需要用户亲身尝试。
不过为了具现化OpenAI 的语言能力,OpenAI 就先将名「MMLU」的基准测试(一个包含了14,000条、涵盖57个学科多选题目的考试)以Azure Tranlate 翻译成不同文字,再让GPT-4 作答,其在绝大部份的语言中都有比GPT-3.5 进行英文答卷有更高的精准度,在中文考试中的结果更超过了80.1%。
诚如上文提过,GPT-4 的可贵之处在于它可以「阅读图像」并作出相应的答覆,而这背后的意义可能超越不少人的想像,从OpenAI 提供的范例中就可以大概感受得到它的威力。
例如你只要直接对其输入一张棒型图,它就可以总结出当中的数据,甚至可以用来进行追加的分析;又或是找来一条法文的图文数学题,再叫GPT-4 以英文作答,一样可以
GPT-4 对于图像的理解能力,已经超越一般人工智能的范畴,它可以分辨出图片中的不自然之处,甚至一张Meme 图的有趣之处