Office Data

Posted: **Sun Jan 12, 2025 5:58 am**

这意味着，大模型公司之间的技术差距并不大。这也是为什么家创业公司，能在两三个月内从零到推出款全新大模型。最好的例证是，去年李开复的零万物发布系列模型，被指使用了的架构，只对两个张量进行了重命名。陈冉认为，国内大模型还没有形成完整的创业生态，大家蜂窝冲上来，发布几个模型证明不了什么。他以智能汽车行业早期做类比：大家都想造车，做轮胎的、造发动机的、甚至做雨刷的，都想亲自下场，但最基本的电池、电控甚至轮子座椅都还没准备好。

单纯从技术层面，时至今日，国内没有哪个团队处于绝对领先位置。算法、数据、算力，国内厂商们过去直在啃算法，大家发布模型，本质上是发布套算法和系统。大家比拼谁的算法更先进，谁的模型参数更大，推理效率更高。但现在越来越多从业者发现，算法其实没有壁垒。陈冉更是直言大模型不值钱。我认企业级的大模型没意义，开源企业级就行了，因为最重要的是数据。他说。数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代，算力可以通过砸钱买卡获得，但优质的数据没有渠道售卖，花钱不定能买来。

训练模型跟训练学生类似，数据相当于教材或教育资源，过程就叫预训练。偏远山区的阿富汗 whatsapp 数据孩子和线城市的孩子，从小获得的教育资源不同，训练过程不同，最后高考考上重点大学的概率也必然不同。某种意义上，拥有优质数据，预训练就成功了半。过去年，行业里评估个大模型好坏的标准，是通过测评，相当于考试。既然是考试，就有作弊的空间，或者可以通过刷题得高分。这就导致，很多大模型其实是应试教育的产物——参数大、得分高、性能强，但没啥实践能力。

李友峰认为，算法有很大局限性，如果脱离具体的应用场景，算法没有意义。比如模型的参数大，计算能力很强，做数学题也许表现很好，但这并不意味着它能在实际业务里产生价值。今年以来，大模型拼参数的风气有所改观，各种杂七杂八的野榜也有所收敛，说明公众不好糊弄了。问题是，如果不比参数，大家还能比啥？二、卷价格：端不敢收，端收不起个模型或个项目要证明自己有价值，最直接的方法是从市场上赚到钱。今年以来，越来越多创业者和投资人，开始将商业模式挂在嘴边。

Office Data

大模型有三大要素：

大模型有三大要素：