风暴-王小川谈大模型商业化:这次和上一轮AI热潮不一样

2023-12-20 22:24:49 fc16888

图片关键词

12月19日,风暴平台百川智能发布Baichuan2-Turbo系列API(应用程序编程接口),可以让企业低成本定制自己的大模型产品。百川智能创始人、首席执行官王小川接受经济观察网在内媒体采访时判断说,之前业界流行行业大模型,企业通过预训练或者微调训练做自己的行业大模型,但这并不是最优解。他认为,通用大模型可以在大部分场景下替代行业大模型,通用大模型+搜索增强可以解决99%企业知识库的定制化需求。

Baichuan2-Turbo系列API是一个商业化产品,此举也可以视作百川智能在商业化领域迈了一大步。大模型在国内发展近一年后,年底进入冷静期,一些业内人士对大模型商业化表示悲观,认为可能会像2016年的AI(人工智能)热潮一样,一开始很热闹,但开启商业化后遇到难题。王小川对此并不认同,他觉得,这次跟上次不一样。

“上一波AI热潮主要集中在图像处理领域,不够通用。不够通用带来两个问题:一是大家都挤在同一个赛道里,都跑去做安防,不能赋能千行百业。第二个问题是,当赛道很窄时,每个项目都会很重,实施成本很高。这一次美国已经证明AI大模型可以在很多行业运行,所以我觉得商业化是可行的。”王小川说。

通用大模型目前的商业化主要是为B(Business,商用)端企业提供服务,记者了解到,百川智能已经从B端客户获得实际的商业收入。此前,大模型商业化的难点在于,企业不知道大模型能解决什么问题,也不知道自己需要什么样的AI服务。百川智能联合创始人、联席总裁洪涛告诉记者,现在,企业客户对于大模型的认知已经很清晰了,他们开始懂得,自己的哪些场景可以用AI了。

上半年时,很多B端企业会尝试自己做行业大模型,临近年底时,一些行业客户开始发现,与通用大模型厂商合作更省钱。

王小川用了一个比喻:“我们是养猪的。有些没吃过猪肉的人,之前会考虑自己也要养猪,现在他们直接吃猪肉就行了。”他认为,能让企业客户“直接吃猪肉”,建立在定制大模型成本下降的前提下。之前,企业自己做行业大模型,需要招聘AI算法人员,购买GPU(图形处理器)芯片,用一两个月时间训练大模型,花费少则几十万元,多则几百万元。使用百川智能定制化服务后,企业不再需要这些额外成本,用原有技术就可以定制一个自己的大模型。

王小川告诉记者,定制成本下降的一个核心技术是搜索增强技术。他表示,这项技术是解决现阶段大模型有幻觉、时效性差、缺乏专业领域知识,难以落地等问题的一种有效途径。具体做法是,通过搜索增强技术,提升大模型获取外部知识的能力,并把搜索增强知识库和超长上下文窗口结合,让模型连接全部企业知识库以及全网信息。王小川认为,这能替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求。

目前百川智能正在与泛互联网行业、金融行业、国央企等B端客户进行商业化合作,大模型落地方向有20多个场景,“需要处理大量文本数据的场景,以及需要跟客户打交道的场景,都是我们要做的。”王小川说,这两个领域最能发挥大模型的优势。

此外,百川智能也正在研发C(Consumer,消费)端领域的超级应用。王小川告诉记者,预计明年推出超级应用。他研发的是健康、快乐、个人助理方向的超级应用。


标签: 风暴娱乐
首页
产品
新闻
联系