都是基于开源架
Posted: Sat Dec 28, 2024 10:27 am
厂商总是宣传大模型能干啥,却不说不能干啥,客户就有点被误导,以为大模型什么都能干,想着把原来的业务颠覆重做遍,这不现实。陈冉对「定焦」说。 回看过去年大模型行业的发展,我们会发现,最先打起来的不是价格战,甚至也不是技术战,而是营销战。 营销是为了抢声量。开发布会、刷榜、投广告甚至碰瓷对手,能吸引更多关注,让大家觉得自己领先。至于好不好用,真实的技术实力如何,可以后期再补课。 李友峰告诉「定焦」,现在国内所有的所谓自研大模型,基本构改的,没有真正意义上的原创和全自研。
这意味着,大模型公司之间的技术差距并不大。 这也是为什么家创业公司,能在两三个月内从零到推出款全新大模型。最好的例证是,去年李开复的零万物发布系列模型,被指使用了的架构,只对两个张量进行了 保加利亚 whatsapp 数据 重命名。 陈冉认为,国内大模型还没有形成完整的创业生态,大家蜂窝冲上来,发布几个模型证明不了什么。他以智能汽车行业早期做类比:大家都想造车,做轮胎的、造发动机的、甚至做雨刷的,都想亲自下场,但最基本的电池、电控甚至轮子座椅都还没准备好。
单纯从技术层面,时至今日,国内没有哪个团队处于绝对领先位置。 大模型有三大要素:算法、数据、算力,国内厂商们过去直在啃算法,大家发布模型,本质上是发布套算法和系统。大家比拼谁的算法更先进,谁的模型参数更大,推理效率更高。但现在越来越多从业者发现,算法其实没有壁垒。陈冉更是直言大模型不值钱。 我认企业级的大模型没意义,开源企业级就行了,因为最重要的是数据。他说。 数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代,算力可以通过砸钱买卡获得,但优质的数据没有渠道售卖,花钱不定能买来。
这意味着,大模型公司之间的技术差距并不大。 这也是为什么家创业公司,能在两三个月内从零到推出款全新大模型。最好的例证是,去年李开复的零万物发布系列模型,被指使用了的架构,只对两个张量进行了 保加利亚 whatsapp 数据 重命名。 陈冉认为,国内大模型还没有形成完整的创业生态,大家蜂窝冲上来,发布几个模型证明不了什么。他以智能汽车行业早期做类比:大家都想造车,做轮胎的、造发动机的、甚至做雨刷的,都想亲自下场,但最基本的电池、电控甚至轮子座椅都还没准备好。
单纯从技术层面,时至今日,国内没有哪个团队处于绝对领先位置。 大模型有三大要素:算法、数据、算力,国内厂商们过去直在啃算法,大家发布模型,本质上是发布套算法和系统。大家比拼谁的算法更先进,谁的模型参数更大,推理效率更高。但现在越来越多从业者发现,算法其实没有壁垒。陈冉更是直言大模型不值钱。 我认企业级的大模型没意义,开源企业级就行了,因为最重要的是数据。他说。 数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代,算力可以通过砸钱买卡获得,但优质的数据没有渠道售卖,花钱不定能买来。