一起学习网 一起学习网


大模型“豆包”文科成绩超了一本线,为什么理科不行?

新闻资讯 模型,豆包,成绩,文科,语言,题目,国产,能力,智能,维度,答案,方式,价格战,数学,标题,试卷,理科,主观,分数,语文,实验室,学界,数量,争议,图片,字节,图源,智源,量子,互 07-01

什么?好多大模型的文科成绩超一本线,还是最卷的河南省???

不仅如此,在前不久国产大模型To B市场打响价格战之际,火山引擎也是相当“壕气”让大模型进入“厘时代”,1元=1250000tokens。

因此,现在要如何评价字节跳动的大模型和应用,或许就是:

多:场景多,数据多

好:各路评测都能hold住

省:是冲在价格战头部的选手

但也正如我们刚才所述,现在的大模型还有很大的“进化”空间。

因此对于国产大模型在未来的发展,我们还需保持持续的关注;但毋庸置疑的一点是,字节的大模型和豆包,定然是最值得期待的其中一个。

参考链接:

[1]https://mp.weixin.qq.com/s/2IueZaiCuyVp97DT-bP4Ow

[2]https://flageval.baai.ac.cn/#/leaderboard/nlp-capability?kind=CHAT

[3]https://rank.opencompass.org.cn/leaderboard-llm/?m=24-05

[4]https://mp.weixin.qq.com/s/KYEsTA-qU72pXWnr7-iB4A


编辑:一起学习网

标签:豆包,模型,成绩,题目,文科,方式,维度,语言,能力,字节