字节的野心:在大模型时代「卖铲子」

字节的野心:在大模子年代「卖铲子」

字节跳动审慎迈出了跨入大模子赛道的第一步。

6 月 28 日中午,字节旗下的火山引擎召开公布会,初次正式公布在大模子范畴的研公布局和互助历程,并公布大模子办事平台火山方舟,提供模子练习、推理、评测、精调等全方位功效与办事。

此前,百度、阿里、腾讯、商汤、360 等国内大厂以前相继公布入局,大局部的做法都是公布一个通用大模子大概数个行业大模子底座,行业客户可以基于这些基本模子和本身拥有的行业数据精调,打造一个办事本身业务的 AI 使用。

但字节的切入办法与其他大厂有分明的不同。火山没有公布本人的通用大模子大概行业大模子,火山方舟聚合了一批第三方消费商开发的大模子底座。

火山引擎向大模子消费商提供构建、练习大模子基座所必需的算力和工具体系,并将这些消费商的大模子会萃到本人的 MaaS 平台,需求给企业使用。这与微软投资算力需求 OpenAI,并基于后者开发的 GPT 模子向企业提供 Azure AI 云办事,有相似之处。

因此,火山引擎先容的互助案例也与其他大厂有所差别。这场公布会上登台的互助伙伴,包含英伟达如此的高明显卡需求商,以及智谱 AI、百川智能、IDEA 等当下国内第一梯队的大模子开发商。而其他大厂的公布会,先容的屡屡主要是金融、文旅、企服等各行各业的互助伙伴。

火山引擎总裁 谭待

停止本年 5 月,国内已公开披露的大模子数目到达 79 个。依照火山引擎总裁谭待的说法,将来大模子市场一定不会是一家大概几个寡头把持,而是一个百花齐放的多模子市场,会有少数几个超等大模子,多个通用大模子,和更多行业/垂直大模子。

企业使用大模子,将来也会展现「1+N」的形式,除了经过自研或深度互助,构成 1 个主力模子;由于本钱和场景繁复多元等缘故,在这个主力模子之外,还会有 N 个模子同时使用。

大模子开启了新一轮行业厘革,在这个淘金年代,OpenAI、谷歌、MiniMax、百川智能等大模子消费商是年代浪尖的淘金者。而火山引擎要做的,就是要在大模子年代「卖铲子」。

01 火山引擎大模子办事平台——火山方舟

会上,火山引擎公布了本人的 MaaS 平台——火山方舟。

火山引擎总裁谭待在会后承受媒体采访时重申:火山方舟终极办事的是模子的使用方;火山引擎是跟大模子的消费方互助,一局部被精选的大模子厂商在火山方舟上摆设,然后对外提供办事。

想让企业用户和大模子消费商到场到火山方舟的生态体系,起主要处理的是数据宁静的成绩。

火山引擎总裁谭待以为,企业使用大模子,最担心的是数据流出;假如将大模子公有化摆设,企业将承当更高的本钱,模子消费方也会担心知识资产宁静。「火山方舟」的主要职责,就是做好大模子使用者、提供者和云平台可以互信赖任的宁静保证。

据火山引擎智能算法卖力人吴迪先容,「火山方舟」已上线了基于宁静沙箱的大模子宁静互信盘算方案,使用盘算断绝、存储断绝、网络断绝、流量审计等办法,完成了模子的奥密性、完备性和可用性确保,实用于对练习和推理延时要求较低的客户。

宁静沙箱表现图

别的,「火山方舟」还在探究基于 NVIDIA 新一代硬件支持的可信盘算情况、基于联邦学习的数据资产分散等多种办法的宁静互信盘算方案,更全盘地满意大模子在不同业务场景的数据宁静要求。

第二,想要让企业可以更高效地打造 AI 大模子使用。一方面要低落企业用户使用大模子打造使用的门槛,另一方面也要低落用户使用大模子办事的本钱。

上文提到,火山引擎以为将来企业使用大模子会展现「1+N」的形式,也就是 1 个自研主力模子+N 个小模子同时使用。好比一个对话式的 AI 办事产物,对话功效的基本是源自企业自研的大模子,但提供文生图、文生视频、特定语种翻译,大概回复医疗、金融等专业范畴的成绩时,却可以调用其他的小模子。

如此做最大的利益是低落模子的推理本钱。吴迪称,练习大模子很昂贵,但是从长时来看,模子的推理开支会凌驾练习开支。后果和本钱的分歧永久存在,低落推理本钱会是大模子使用落地的紧张要素,「一个颠末精良精调的中小规格模子,在特定事情上的体现约莫不亚于通用的、宏大的基座模子,而推理本钱可以低落到原本的十分之一。」

举例来说,微软以医学文章数据精调了生物范畴的 BioGPT-Large 模子,仅有 15 亿参数,其在 PubMedQA 基准测试中的准确率却优于有着上千亿致使数千亿参数的大型通用言语模子。

但对企业来说,「1+N」形式的一大痛点就在于开发使用的历程中,必要调用种种不同的大模子。而火山方舟提供的第一个功效就是模子广场,不仅集成了多量的第三方大模子,企业本身开发的大模子也可以经过这个平台举行办理。

吴迪先容,企业可以用一致的事情流对接多家大模子,关于繁复需求可设置高等参数、验证集、测试集等功效,再经过主动化和人工评价直观比力模子精调后果,在不同业务场景里还可机动切换不同的模子,完成最具性价比的模子组合。这些自界说目标和评价数据的积累,将成为企业在大模子年代名贵的数据资产。

火山方舟卖力人 吴迪

02 火山引擎的大模子「伙伴圈」

火山引擎畅想的出息十分抱负,但要做到有一个条件,就是大轻重小的大模子开发商必要会萃到火山引擎。数据安满是他们乐意接入火山引擎的必要条件,但显然不会是富裕条件。火山引擎吸引大模子开发商互助的基本,在于其把握的算力资源,也就是已往囤积的多量 GPU。

客岁 ChatGPT 公布后,国内 AI 算力告急以前算是行业半公开的奥密,而字节跳动拥有国内最丰厚的算力资源。

据《延迟 LatePost》报道,字节本年向英伟达订购了凌驾 10 亿美元的 GPU(约合 70 亿元人民币),到货和没到货的 A100 与 H800 总计有 10 万块。而 2022 年整年,英伟达数据中央 GPU 在中国的贩卖总额约莫为 100 亿元,也就是说,仅字节一家公司本年的订单约莫已接近英伟达客岁在中国贩卖的商用 GPU 总和。

大局部团队没有条件置办多量 GPU 练习大模子,从火山引擎采买算力也就不敷为奇。而对火山引擎来说,大模子消费商提高越好,业务量越大,反过去就必要置办更多的算力。以是在这方面,大模子消费商和火山引擎有着相反的诉求。

本年 4 月,火山引擎公布与国内 70% 的大模子消费商告竣互助,缘故也在于此。

「火山方舟」首批大模子互助伙伴

会上,火山引擎重点先容了第一批到场火山方舟的大模子,包含百川智能、出门问问、复旦大学 MOSS、IDEA 研讨院、澜舟科技、MiniMax、智谱等多家 AI 科技公司及科研院所的大模子,并已启动邀测。

而首批邀测的企业,则包含金融、汽车、消耗等浩繁行业的客户。北京银行 CIO 龚伟华表现,大模子与客户营销、办公协同、数据智能的团结,在金融使用场景有宏大潜力。北京银即将与「火山方舟」互助,在算力优化、模子精调等方面掀开研讨,协同推进金融风控、营销等模子使用落地。

除了第三方的客户,吴迪先容,在火山方舟平台推向市场之前,以前使用浩繁的内里产物打磨和改良平台。字节跳动有 10 余个业务线正在探究接入和试用,在代码纠错等研发提效场景,文老实类、总结择要等知识办理场景,以及数据标注、归因分析等方面探究,使用大模子才能促进降本增效。

但是,关于这些内里实验何时面向用户,吴迪向极客公园表现:还必要一些时间,把大模子使用好是一个必要长周期打磨的事。

火山引擎总裁谭待进一步增补:有一些使用对用户是无感知的,由于它是在已有的情况中去提升听从,而不是像 ChatGPT 这种大模子原生使用,用户能分明感知到是一个大模子来做这个事变。好比客服这个场景,回复时必要检索知识库,但如今经过大模子去给它一些提示,但跟你对话的照旧谁人对应的客服,只是它的听从高了。

03 字节跳动的下一步

现在来看,字节/火山布局大模子第一阶段的思绪以前十分明晰。

从商业上看,火山引擎就是卖水卖铲子的思绪。依靠火山引擎的武艺体系,加上此前算力资源的积累,做管道和前一阶段的底层办事应该是没有任何成绩,以是在这个阶段把基本东西开放出来,协助各位做好大模子,大概更直接说,从收益上的考量,这个阶段公布武艺体系东西比公布大模子的收益值更高。

但有一个很紧张的成绩是:今天卖铲子的字节,将来会不会了局淘金?

答案是一定的。谭待报告极客公园,其内里也有团队在研发大模子。假如做好了,也会上到方舟平台对外提供。此前字节副总裁杨震原也曾向财新回应:字节跳动对大模子也在做一些学习和研讨,如今还没有什么后果,也没有大模子产物落地时间表。

但这存在一个成绩,就是怎样均衡自家大模子和其他第三方的干系。对此,谭待表现,自家的模子只会是浩繁模子中的一个,其他的是客户本人的选择,不必要火山来均衡,一个企业将来一定会在多个场景用多个模子,由于每个模子在不同场景的性价比是不一样的,这会是一个开放的市场。

正式入局后,不少行业人士看好火山引擎在大模子范畴的市场份额会在接下去一段时间快速飙升,缘故主要有三个:

  1. 第一是由于基本需求。字节本身在云办事这个层面是国内用量排在前三的公司,就算火山引擎,终极只是为了办事字节这一个买卖而建,它的收益和投入产出比都是相当可观的。
  2. 第二是产物才能。字节这套体系迭代出来的产物东西向外转达,在云办事里的积累和产物化的才能会十分的强,从这个维度来说,关于很多中小开发者,乃至有体系的开发者是很有吸引力的。
  3. 第三是由于生态体系成熟。字节本身在云办事这套体系并不是只做了火山引擎,字节在上卑劣的倾销分发、基本办法建立,开发东西等维度都有完满和成熟的生态链,乃至早几年还收买了开发者社区。有着可靠的基本体系,完备的事情链条和生态社区。

已往字节布局国内云办事市场的痛点,在于起步较晚,飞书要挑唆以前成熟的钉钉、企业微信,而云办事的特点就是前一阶段获客难,但获客后由于用户迁徙本钱太高,以是容易不会改换。

今天的大模子是一条全新的赛道,一切云办事厂商又回到了同一同跑线,关于想要掀开云办事市场的字节和火山而言,这也是十年忧伤一遇的机会。

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片