大模型“豆包”文科成绩超了一本线,为什么理科不行?
新闻资讯
什么?好多大模型的文科成绩超一本线,还是最卷的河南省???
不仅如此,在前不久国产大模型To B市场打响价格战之际,火山引擎也是相当“壕气”让大模型进入“厘时代”,1元=1250000tokens。
因此,现在要如何评价字节跳动的大模型和应用,或许就是:
多:场景多,数据多
好:各路评测都能hold住
省:是冲在价格战头部的选手
但也正如我们刚才所述,现在的大模型还有很大的“进化”空间。
因此对于国产大模型在未来的发展,我们还需保持持续的关注;但毋庸置疑的一点是,字节的大模型和豆包,定然是最值得期待的其中一个。
参考链接:
[1]https://mp.weixin.qq.com/s/2IueZaiCuyVp97DT-bP4Ow
[2]https://flageval.baai.ac.cn/#/leaderboard/nlp-capability?kind=CHAT
[3]https://rank.opencompass.org.cn/leaderboard-llm/?m=24-05
[4]https://mp.weixin.qq.com/s/KYEsTA-qU72pXWnr7-iB4A
编辑:一起学习网
标签:豆包,模型,成绩,题目,文科,方式,维度,语言,能力,字节