科技部高新技术司雷鹏进一步支持显示领域科技攻关清华发布大模型性能报告GPT-4第一更懂中文的还是百度

我注意到，AI大模型在今年的热潮中占据了主要位置，ChatGPT由OpenAI带头，而微软、谷歌和Meta紧随其后。国内科技巨头也迅速跟进，不仅如此，据说现在已经有上百款这样的模型问世了。

那么，这些大模型各自的实力如何呢？最近清华大学新闻与传播学院发布了一份《大语言模型综合性能评估报告》，这份报告详细比较了国内外这些大型语言处理工具。

在这7款最顶尖的大模型中，GPT-4以压倒性的优势获得了第一名；第二名是百度研发的文心一言，其次是GPT-3.5，然后依次为Claude、讯飞星火、阿里云推出的通义千问以及昆仑公司开发的天工。

虽然GPT-4在多个方面表现出色，但对我们普通用户来说，最重要的是哪种能更好地理解中文。这一点上，百度的文心一言做得更好，它以92%的准确率，在中文语义理解方面领先于其他竞争者，即使包括那些如讯飞星火和GPT-4等强劲对手。

这种能力增强可能归功于百度的大模型训练过程中包含大量中文文本，因此它能够更加精准地处理涉及本土文化内容的问题。

你可能也会喜欢...