大模型“豆包”文科成绩超了一本线，为什么理科不行？

新闻资讯模型,豆包,成绩,文科,语言,题目,国产,能力,智能,维度,答案,方式,价格战,数学,标题,试卷,理科,主观,分数,语文,实验室,学界,数量,争议,图片,字节,图源,智源,量子,互 07-01

什么？好多大模型的文科成绩超一本线，还是最卷的河南省？？？

不仅如此，在前不久国产大模型To B市场打响价格战之际，火山引擎也是相当“壕气”让大模型进入“厘时代”，1元=1250000tokens。

因此，现在要如何评价字节跳动的大模型和应用，或许就是：

多：场景多，数据多

好：各路评测都能hold住

省：是冲在价格战头部的选手

但也正如我们刚才所述，现在的大模型还有很大的“进化”空间。

因此对于国产大模型在未来的发展，我们还需保持持续的关注；但毋庸置疑的一点是，字节的大模型和豆包，定然是最值得期待的其中一个。

参考链接：

[1]https://mp.weixin.qq.com/s/2IueZaiCuyVp97DT-bP4Ow

[2]https://flageval.baai.ac.cn/#/leaderboard/nlp-capability?kind=CHAT

[3]https://rank.opencompass.org.cn/leaderboard-llm/?m=24-05

[4]https://mp.weixin.qq.com/s/KYEsTA-qU72pXWnr7-iB4A

编辑：一起学习网

标签：豆包,模型,成绩,题目,文科,方式,维度,语言,能力,字节

分享: