尽管学术界对大模型的参数目并没明确的规范,很多10亿级参数的模型并不可以和GPT4相提并论,国内大模型的爆发式增长,无疑揭示了一个既定事实:和每一次风口出现时一样,总有人一窝蜂地涌入,试图在新一轮的创业潮中搏一个机会。
依据北京经信局公布的数据,截止到2023年十月初,国内公开的人工智能大模型数目已经达到238个。
就像革新工场董事长李开复的看法:人工智能大模型是绝对不可以错过的历史机会。由于这将是有史以来最大的平台革命,它将比Windows、Android要大10倍甚至更多,它会让每一个应用改写,会重构人类的工作,会让有创意的那些人的聪明才智被放大10倍或者更多......
为了很好过百年一见的历史机会,一场百模大战正在上演,可问题在于:目前的大模型战场,当真是是创业人士的机会吗?
大模型的爆火,是多种原因叠加的结果,其中让大部分人印象深刻的标志性事件有两个:一个是ChatGPT的走红,月活用户量在两个月的时间里就超越一亿;另一个是英伟达CEO黄仁勋的比喻,觉得人工智能的iPhone时刻已经到来。
01 插件更像是一种过渡
冷静下来考虑,这两个事件都有着鲜明的互联网+色彩,将月活视为一个商品成败的规范,将某个商品的爆炸性增长视为市场需要被激活的晴雨表。如此的逻辑是不是合理还不能而知,但深深影响了大模型商业模式的构建。
于是,不少大模型都在塑造我们的应用中心。Open人工智能上线了ChatGPT插件,付成本户可以调用插件解决某类需要,现在ChatGPT上已经有近1000个插件;国内的百度也在积极布局,发布文心一言插件生态平台灵境矩阵,并计划提供百亿流量、亿元基金等勉励来扶持插件生态。
无论是站在互联网+塔尖的苹果,还是交付量稳居前五的Android厂家,无不构建了应用市场的变现模式,衍生出了广告排名、支付分成、游戏联运等多种盈利方法。甚至微信如此的超级APP,也通过微信小程序达成了类似的机制。
个中缘由并不难理解。
就现阶段来看,像手机厂家一样经营插件生态,可能是大模型平台当下的最好选项,而开发者同样乐见其成。
就像互联网+催生的流量红利,灌溉了大大小小的应用,假如大模型可以沿着互联网+的轨迹增长,大概率将带来了新一轮的红利。为大模型平台开发插件,或许会得到平台的流量倾斜,拿到大模型年代的门票,乃至通过降维打击的方法颠覆固有些市场格局。
问题在于,大模型平台能否成为占领用户习惯的入口?在网络和互联网+年代,入口一词频频被提及,可以细分为内容、应用、操作系统、硬件四个维度,充当着用户获得信息、解决问题的第一触点。
把视线再放大一些的话,聊天机器人可能并非大模型的终极应用,更像是一个启蒙商品。
眼下的挑战在于,坊间常见觉得通用大模型会趋向寡头化,最后只剩下两到三家,开发者选择加入什么大模型插件生态,就像是一场豪赌。毕竟ChatGPT的访问量已经连续三个月下滑,而且功能一样的聊天机器人应用仍层出不穷,在大部分用户的习惯培养前,没办法断言什么大模型会是最后的赢家。
譬如华为已经将大模型和语音助手小艺融合,不排除愈加多的智能手机、智能音箱、智能家居类厂家有同样的计划,语音助手渐渐成为大家唤醒大模型的主流方法;再譬如一些人鼓吹的Agent,即可以能自主理解、规划决策、实行复杂任务的智能体,自动帮主人处置一些繁琐的步骤性工作。
无论是哪一种状况,都意味着插件不过是一种过渡,用户需要的只不过连接某个服务,无需了解服务来自什么插件。先调用某个插件才能获得某项能力的交互,注定是大模型初级阶段的产物。
事实好像也是这样。无论是ChatGPT还是相同种类商品,插件的主要贡献者集中在独立开发者和人数较少的小团队,那些手握上千万用户和大量数据的商品,仿佛对插件背后的机会窗口不太有兴趣。
02 垂直大模型是金矿吗?
毕竟插件生态的主导者是通用大模型,插件有哪些用途可以归类为人工智能+的范畴,目的是为了扩展大模型的多元能力。借用百度集团资深副总裁何俊杰的看法:假如说大模型是一颗聪明的大脑,那样插件就是大模型的手和脚。
典型的例子就是文档处置类的插件,调用大模型的能力对用户的文档进行处置,再基于文档完成摘要、问答、创作等任务。插件饰演的终归是工具的角色,而工具类商品的宿命常见不太乐观:风口期收成了大量的流量,但大部分工具没能走通变现的路子,风口过后还要买流量来保持增长。
一种是基于大模型的能力开发独立应用,或为我们的应用接入大模型厂家的API,进而提高商品的服务能力;另一种是在通用大模型或开源大模型的基础上,练习适用于垂直场景的模型。据了解北京已经有115个人工智能大模型,其中垂直大模型占到了103个。
有野心的开发者不甘心做插件,做通用大模型的寄生品,瞄准了更有吸引力的选择:
前者的挑战在于,现在的商品主要集中在对话型、绘画类商品上,且以To C场景为主。只是C端用户仍以闲聊、娱乐为主,尚未产生实实在在的生产力,致使付费意愿一般比较低。同时还存在商品同质化的现象,以闲聊类商品为例,早期的商品常见基于公开语料,倘若用户的提问很难产生有价值的数据,差异化也就无从谈起。
To B日渐成了行业内心照不宣的选项。
这就为垂直大模型提供了充足的想象空间,也是创业人士扎堆的赛道。B端企业的场景比较明确,并且积累了大量的数据,既能为大模型练习提供数据,还提供了大模型成效的检验场。
大模型的能力听起来非常美好,大部分企业却用不起来,缘由在于通用大模型没办法非常不错地解决垂类问题。对于B端企业来讲,可以将自己服务行业的专业常识灌输给大模型做进一步的练习与微调,练习完后在当地进行私有部署,再来解决对应垂类问题。
相对不那样乐观的是,现阶段想为大模型付费的,还只有金融为首的个别场景,不少行业还在观望中。以金融大模型为例,现在发布了金融大模型的企业有蚂蚁集团、Bloomberg、MorganStanley、Lemonade、苏黎世保险、度小满、瑞穗金融集团等,要么手握大量金融数据,要么有自研大模型的背景,都不是靠一腔热血闯进市场的创业人士。
简而言之,大模型的想象空间越大,想要从中探寻机会的企业就越多,留给创业人士的机会窗口并没太多。况且还有一个没办法避免的问题:在和大厂同台角逐的过程中,创业人士有资本试错吗?通往大模型的远方有千万条路,也意味着会有千万个死胡同。
首当其冲的正是合规问题。国内在7月初颁布了大模型备案需要,依赖API接口获得境外大模型能力的模式遭到挑战,致使年初时就接入Open人工智能做应用的团队,在不同程度上陷入了困境。
03 创业人士没办法承受之痛
譬如某在线设计平台,曾是国内最早推出人工智能生图的商品之一,并围绕人工智能生图搭建了社区生态。但在9月初的时候,这家平台忽然宣布网站维护,一直到一个多月后,依旧是网站升级中的状况。而在天天都有新事物出现的大模型行业,早期的先发优势正不可防止地伴随时间消亡。
和过往几次风口最大的不同,在大模型的希望面前,创业人士非常开心,监管却非常理性,为了防止大模型市场重蹈野蛮成长的局面,防止大模型走向失去控制,有关政策和法规密集颁布。
几乎在同一时间,全国信息安全指标化技术委员会发布了《生成式AI服务安全基本需要》,涉及语料安全、模型安全、安全手段、安全评估等多个方面。
就在不久前,科技部、工信部、教育部等10部门联合印发《科技伦理审察方法》,明确提到:算法、模型和系统的设计、达成、应用等遵守公平、公正、透明、靠谱、可控等原则,符合国家相关需求,伦理风险评估审核和应对处置策略合理,用户权益保护手段全方位得当等。
其中在语料安全需要中,不只明确提出语料可溯源,包含开源语料和自采语料,还提出要打造语料来源黑名单,不用黑名单来源的数据进行练习。应付各来源语料进行安全评估,单一来源语料内容中含违法不好的信息超越5%的,应将该来源加入黑名单。
也就是说,在监管趋严的背景下,等待开发者的不单单是备案问题,而是系统性的合规需要。无论是调用大模型API做革新的应用层开发者,还是想在垂直范围分一杯羹的垂类大模型,蒙眼狂奔的选项已经消失,需要要小心应付潜在的合规和安全风险。
垂直大模型大进步需要应付的潜在风险更多。就像《生成式AI服务安全基本需要》中提到的,预练习、优化练习等环节的输入端数据均纳入练习语料的范畴,过去靠采集境外数据进行练习的策略已经行不通,必然要花更多的精力进行数据采集、清洗、标注。数据影响着大模型的IQ,同时也左右着垂直大模型的生死。
假如开发者基于某个不合规的通用大模型练习商品,为了满足合规需要而切换大模型的话,需要重新处置数据,由于不同大模型的练习数据不同,开发者需要重新对数据进行清洗、预处置和标注;需要基于新模型练习和调优,包含练习算法、超参数,与反复的实验和调整;在模型部署和应用过程中,还要考虑不一样的部署平台和框架
相比于巨头们充沛的资源,大模型创业人士面临的挑战将愈加多,现阶段是合规,下阶段可能就是盈利了。
04 写在最后
用一句话形容大模型年代的创业人士:表面上鲜花着锦,事实上烈火烹油,从抢跑到碰壁,不过才半年时间。
或许大模型年代不缺少机会,但每一条赛道都不会是康庄大道,不缺少冲出一家家独角兽的机会,比率上注定是九死一生。结果大概率和一次次淘金热一样,淘到金子的人寥寥无几,卖水人悄悄发了财。