行业资讯

清华大模型性能报告发布GPT-4在中文理解上与百度对抗科技创新引领自然界新风潮

我注意到,近日科技界的热点之一便是那些大型人工智能模型。OpenAI的ChatGPT似乎率先迈出了这一步,其它巨头如微软、谷歌和Meta紧随其后。而国内的科技公司也未落后,他们迅速推出自己的大模型,据说已经有上百款问世了。

这些模型中哪个更强?不久前,清华大学新闻与传播学院公布了一份《大语言模型综合性能评估报告》,对这些模型进行了比较。报告显示,在这7款最优秀的大模型中,GPT-4名列榜首,而排在第二位的是百度的文心一言。接下来的排名依次为GPT-3.5、Claude、讯飞星火、阿里云的通义千问以及昆仑的天工。

尽管GPT-4在各方面领先,但对于国内用户来说,最重要的是能够更好地理解中文。这一点上,百度的文心一言表现突出,它以92%得分率获得了第一名,这超过了讯飞星火和GPT-4。在处理本土文化内容时,由于文心一言包含大量中文文本,它能提供更好的服务。

因此,可以说这是一个关于技术创新素材的情景:自然界中的竞争正由这些新兴的人工智能驱动。这场竞赛不仅体现了技术进步,也反映出不同企业之间在这领域内不断追求卓越的心态。

你可能也会喜欢...