搜索

对话第四范式戴文渊:通往agi的路线,是把所有软件改造一遍-云顶yd2223线路检测

·2023-04-29 10:36
生成式ai对于企业软件的革新,正是打破原有菜单式的软件交互,转而将重点放在算力、数据侧的升级。面向用户的,仅是一个干净、简洁的对话框。
股权融资北京市2014-09
人工智能技术与服务提供商
我要联系

文 | 苏建勋

如果你抱着“围观炫技”的念头观看人工智能公司「」最近的发布会,或许不会感受到猎奇般的兴奋。事实上,在创始人戴文渊的筹划里,他就没打算让聊天、画图、写小说、写代码这类to c式的噱头成为第四范式头顶上的标签——尽管多数ai公司都对此乐此不疲。

“式说”大模型的写代码示例;图片来自第四范式

4月26日,第四范式首次展示其大模型产品「式说3.0」,在半个小时的断网环境下用画飞机、写代码秀了下模型肌肉后,戴文渊抛出了他认为的“更重要的事”:

“今天更重要的,是想跟大家分享我们要做的事情:用生成式ai重构企业软件,我们称之为aigs。”戴文渊谈到。

aigs(ai-generated software),戴文渊将其定为第四范式的核心战略,也是这位曾经的acm世界冠军、百度最年轻的t10科学家、江湖人称“戴神”的ai独角兽公司ceo,为2023年的这波ai浪潮,交上的第一张答卷。

“这次的变化很难估计是多少万亿的市场,大家都有机会。”谈及热潮汹涌的ai领域,戴文渊对36氪表示,而他眼中属于第四范式的机会,来自于中国软件市场的特殊生态。

一个直观的感性认知是,国内b端软件在体验上乏善可陈,“我们公司的报销系统也挺难用”,戴文渊坦承。在他的理想中,相比在系统菜单栏逐个点击的报销动作,如果能给软件安上生成式ai的心脏——用chat的方式说“我要报销”,把票拍给系统、识别出餐票、询问用餐对象,得到回复后完成报销——这种体验显然比现在的报销系统要强得多。

不论是内部oa、erp、crm,还是外部业务管理软件,上述可以被ai优化的场景不胜枚举。

比如物流,区域经理想知道某个快递员上周有没有偷懒;比如工厂,车间主任想知道流水线有没有违规操作——在过去,他们要从密密麻麻的excel表格、监控视频等数据库中找寻蛛丝马迹,但现在,只需要在“式说”的对话框中提问:

上周朝阳区有哪些快递员送件量在2000以下?

近三天工厂里有没有出现过违规操作?

如同搜索引擎的一个问答瞬间,“式说”就能依据企业的快递员当班/发件数据、工厂流水线视频监控记录……找到问题的答案。

“企业都有这些数据,但你不能要求一个区域经理会操作数据库,如果用更加自然的交互方式,其实可以很好地帮助企业管好团队。”戴文渊对36氪表示。

“式说”在装配集装箱的应用示例;图片来自第四范式

不过,只有用户体验还不够。第四范式敢于提出aigs的另一原因,是ai对于软件开发效率的极大提升。

由于人力成本不高,国内to b软件有着“定制化”的梦魇,软件商们被一个个菜单式的需求所困,靠脏活累活挣着“人/天”费用,稍有项目失控,就会面临企业盈亏的失衡。

而生成式ai的革新,正是打破原有菜单式的软件交互,转而将重点放在算力、数据端的升级,面向用户的,仅是一个干净简洁的对话框。

“转变为aigs的商业模式后,开发功能点就不用很长时间,只要你的软件还在使用,就能持续不断获得算力的收入,对软件公司来说,是一个特别大的商业模式革新。”戴文渊对36氪说道。

如何落地aigs?戴文渊用了“修图”的场景,将其路径总结为三个阶段:

第一阶段,copilot(企业ai助手)调动不同的信息、数据、应用,作为助手完成用户的指令。相当于在所有企业级软件系统里,配备一个指挥官。指挥官听用户的指挥,比如“把照片亮度调亮20%”。

第二阶段,copilot 基于企业规则的“知识库”,ai能够参照规则做复杂工作,进一步丰富「对话框」的能力。比如ai查询了“人像美化”知识库后,能执行把照片修好看的步骤。

第三阶段,copilot cot(思维链)。软件系统的使用行为最终会被大模型学会,形成ai针对这个领域的思维链,意味着“把照片处理得更好看”这种复杂指令,ai能自动按照步骤完成。

总结来说,在第四范式的“式说3.0”大模型产品中,cot代表思维推理能力,让机器从“图片调亮20%”的单点步骤,进化至“把图p好看”;而copilot则把人的指令翻译成要调用后台的哪个api,两者相结合,才能赋予企业软件新的交互形式。

在谈到第四范式带来的软件革命时,一位国产工业cad厂商代表难掩兴奋:“第一次看到的时候还是蛮震撼的”。

他分享了几个场景:将“式说”模型嵌入内部工具后,可以通过多模态的形式迅速从几十万的零件库中搜索到类似零件,还能在工艺设计环节,让机器给出几个零部件之间的装配组合。这一切都是完成在一个“对话框”里。

“式说”在零部件的应用示例;图片来自第四范式

是侵袭,也是革命,新的生产力替代旧的,向来是商业社会中的残酷法则。

当36氪抛出这样一个问题:“有没有可能某家软件公司通过生成式ai,成长为一家比salesforce更厉害的公司?”几乎没有犹豫,戴文渊当即给出了肯定回复。

“未来另一条agi(通用人工智能)的路线,是把现在所有软件改造一遍。”戴文渊对36氪说。

以下是36氪等媒体专访第四范式创始人戴文渊的采访实录,经编辑后发布:

一、谈软件变革:提升体验 开发效率,to b 软件亟待革命

q:去年底您看到chatgpt推出后,有什么感受?

戴文渊:实话实说,我们也没能预见chatgpt这种现象级的东西,在那个时间点能出来。

当时可以预见的是,gpt-3出来后,gpt路线的生成式终将有天会爆发,但是从去年底到这段时间的爆发,确实是早于我们的预期。

q:chatgpt爆发的时候,第四范式在这方面的积累有哪些?

戴文渊:对于业内来说,不需要等到爆发,最早谷歌bert出来,大模型就没有疑问了,等到gpt3就更加明确。

2018年,我们组建了大概一百多人的研究团队,可以想象成第四范式的(当然没有达摩院投入那么大),要保持对新技术的敏锐和提前投入。

(如果在)去年9、10月份谈生成式ai,大家觉得这不鬼扯?现在最大的变化,是我们看到的这些方向都可以变成产品,变成商业化的路线往市场推进,这是chatgpt最大的帮助——把整个市场的信心从0以下调到1了。

q:客户都是有迫切的需求,哪怕还不知道需求是什么。

戴文渊:这有点像当时的alphago,市场早期其实也不知道alphago是什么。但就想知道对我有没有用。

这次gpt的发展速度比alphago要快得多。从不知道chatgpt是什么,到需要chatgpt帮我做点事,也就持续了一个多月,这次的爆发速度比alphago所带来的ai热潮与机会要大得多。

q:第四范式很快推出了产品“式说”,这款产品迭代过程中有没有一些有意思的故事?

戴文渊:到了今年3月底,我们和客户的认知都在往前,当中很重要的是(意识到)企业内部软件的问题。

如果你看企业内部的软件,或者对比toc端和tob端的软件——toc端软件的用户体验在过去十几年已被打磨到较高水准(比如抖音);但是tob端,想象一下企业内的报销系统、hr系统、流程oa系统……体验还是很差。

我们公司的报销系统也挺难用,(理想中)如果用chat的方式说“我要报销”,你把票拍给系统,系统识别票的内容,识别出来是餐票,问你用餐的对象,得到回复后完成报销。这种体验显然比现在的报销系统要强得多。

这是其一,用户体验的提升。

其二,是开发迭代周期的提升。原先菜单式的开发,每次升级要以月计。而现在新的交互模式下,chatgpt每天都在提升,但你感受不到它的界面发生变化,这是数据层面的升级,这种新型软件开发形态的迭代周期也在不断提升。

所以我们在3月底,大概发第二个版本的时候,就强调多模态和copilot能力,首先你要去改造软件,不能只有自然语言;第二,要支持用“对话”去调用软件的某一个功能,才能实现软件的改造。

很重要的一点,软件不完全是一个个功能。比如photoshop,才菜单栏里把图片亮度调到5%,这是功能;对应到chat方式,我说“把照片p好看”,就不是功能了,photoshop里没这样的功能。但photoshop现在能不能一键美颜?还不行。因为需要我们定义一键美颜执行的步骤是什么。

如果你要实现一个功能,要通过鼠标点菜单三下才能实现,体验就不会比语音交互更好;所以用新型的交互模式替代老的,会给tob端的软件体验带来很大提升。

q:所以您希望用ai的能力重构软件?

戴文渊:绝大多数软件是菜单式的,你调取一个功能,在菜单里点一个下拉菜单,再点几下进入到某一个功能。

现在当我们有更强的自然语言后,可以通过更好的交互方式实现功能调用。本质上,我们要干两件事,第一是把软件转换成新型的交互;第二个是在新型交互上,通过不断学习软件的使用过程,让软件解决越来越复杂的任务。

q:看起来,aigs更像是一个优化数字化转型的工具。

戴文渊:这是现在非常容易量化的点。原来it部门开发一个功能,无论是自己开发,还是请外包,可能需要十个人开发半年。现在用新型的开发方式,一两个人开发一两天就搞定了。不说最后效果怎样,整个开发效率是提升了。

我们一直在这个产业链里,过去和这些软件公司互为生态。软件公司需要第四范式提供决策类模型,第四范式也需要把决策类模型装到应用软件里。这样的关系里,我们能够看到生态的作用、问题和挑战。

几年前gpt3出来之后,我们基本上有了一个判断:未来是能够改变软件产业的,当软件产业被改变后,整个行业的业务价值、商业模式都会得到飞跃。

q:这也是您做aigs的初衷?

戴文渊:我觉得未来另一条agi(通用人工智能)的路线,是把现在所有软件改造一遍,改造完以后,就覆盖了所有领域。

很难想象,通过一个大模型解决所有领域的问题,这个模型量太夸张了,的ceo也在讲,他们也要转变技术路线。如果实现agi是必须通过一个模型无限地扩大,最后是走不通的,至少在当前的计算架构下走不通。

q:“所有软件改造一遍”,您预计这个过程会持续多久?这是在原有基础上可以修缮的,还是一个彻底颠覆的过程?

戴文渊:起码要五年,软件的改变不可能一步到位,使用习惯也不可能一天内从一个菜单直接跨到对话框,需要一个循序渐进的过程。

单个软件可能一到三年可以完成转变,但整个行业起码要五年,改变完以后,会是一个完全的、跨时代的升级。

q:现在“式说”有哪些代表性的场景和案例?

戴文渊:我们真正target的是企业销售管理软件、财务管理、采购软件、研发的软件,以及像制造企业的cad软件等。

比如cad软件,我们能实现新型的交互,可以找到相似的零件,把两个零件做装配;比如门店管理,看哪些人上班迟到了,哪些人没有按照规则操作。很多店长不会用传统门店管理软件,还是用最原始的方式管,用更好的交互形态,其实能很好地赋能基层员工。

还有快递,比如仓库经理想知道辖区内快递员最近一个月运了多少单,投递冠军是谁,谁偷懒。企业都有这些数据,但你不能要求一个区域经理会操作数据库,如果用更加自然的交互方式,其实可以很好地帮助企业管理好团队。

我只是举了一些例子,这个适用面是非常广的,本质上每个企业里都有各种各样的管理软件,它们都能用更好的形态去实现。

二、谈趋势:算力不可能无限扩张;生成式ai短期内tob机会更大

q:您刚刚谈到我们跟软件公司互为生态,里面有很多问题跟挑战,具体是什么呢?

戴文渊:最大的问题是中国软件市场的问题,如果从投资者的视角来看,通常认为中国的软件市场很小,甚至“不太值钱”,但实际上不是这样,中国的软件市场是一个巨大的市场,只不过标准化软件市场比较小。

为什么会这样?因为中国有人口红利。美国没有人口红利,企业只能买标准化软件,定制化软件是买不起的。但在中国,企业买得起定制化软件,所以标准化软件市场就小了。

中国的软件市场其实比海外大得多,但是极度分散。问题大家都能看到,就是高度的定制化,有大量人力成本。企业都挺辛苦的。要不断做非常精细的、非标的项目管理。一旦管不好,企业就会从盈利变成亏损,导致这个市场最大的企业也只占千分之几的市场份额。

gpt技术出来以后能改变的,就是原先大量的定制功能点开发、菜单重新排布和流程改变上,用对话式的方式就都替代了,一下子从一个很差的商业模式变成一个很好的商业模式。

同时对于客户来说,过去虽然说可以定制,但体验也不好,很多软件最后功能多到上千个后,其实这些功能都找不到了。

用新的交互方式,客户体验也得到提升,所以从各个方面来说,这次的技术革命是各方都获益的一个局面。

q:融入ai后,软件有了更好的商业模式,核心还是成本跟定制化的改变?

戴文渊:对。原来软件公司的商业模式是什么?派20个人做了半年,开发完就结束了,如果没有新的功能点,也没有后续的收入。

转变为新的商业模式后,开发功能点不需要很长时间,主要的成本消耗在算力,而不是在人力。只要你的软件还在被使用,你就能持续不断获得算力的收入,对软件公司来说,是一个特别大的商业模式革新。

q:算力的问题,咱们怎么解决?

戴文渊:此时此刻能上牌桌的(ai公司),都有一定的算力门槛,但我们作为中国公司,永远需要考虑的问题,是有没有国产替代方案。

对于中国芯片来说,现在需要一个调整。从追求极致的计算,调整为追求三者(显存、带宽)的平衡,肯定要给他们点时间。

从算力差距来看,对于gpu来说,差两倍其实还好。假设我用了比你差2倍的gpu,我能跑1000亿参数,你能跑1000多亿参数,两者其实没有特别本质的区别。1000多亿肯定比1000亿好,但你是感受不到明显差异的,当然,1万亿参数和1000亿参数还是有本质区别。我觉得还是要给国产芯片更多信心。

q:您觉得算力和数据谁更重要?

戴文渊:数据最重要。但这个要辩证来看,数据充分到一定程度后,再多就没那么重要了。

比方说《红楼梦》看过一百遍了,再多看两遍也还好。未来在agi决胜的,其实是一个个领域里的数据。比方说你在photoshop这个软件积累足够多了,这个领域里你就无敌了。

q:您怎么看待算力扩张和大模型能力的关系?

戴文渊:openai的模型能力,一方面是依靠英伟达度算力的提升;另外一方面是微软的投资,你花了100倍的钱,算力提升很多,数量级就上去了。

但到了那个(算力)的数量级后,你还能再花10倍的钱吗?这个算力还能再提升100倍吗?当你想再往上提升一个数量级的时候,这个问题就要面对了。

如果算力已经无法再提升数量级,我们怎么通过一个模型的无限扩大实现agi?还是通过n个模型一起去覆盖?确实如果你有足够多的模型,也能覆盖一个完整的agi。

q:我们怎么让这个模型成本更可控一些?

戴文渊:成本可控是一个比较现实的问题。在不同领域是需要不同尺寸的模型,不是所有领域都支持一个万亿级参数的(模型)。

过去认为10亿(1b)参数以上都叫大模型,但不同的场景盈利能力不一样,能够负担的模型尺寸也不一样。我们说成本可控,是得看这个场景能负担多大的模型,以及我们能不能裁剪到它能够负担的大小,最后其实要达到某种折中。

q:第四范式一直在提“ai for everyone”,这个理念是不是到今天能够真正实现了?

戴文渊:通用大模型的出现让ai覆盖面扩大了,原先我们需要找到适合ai的场景,比如说搜索、资讯推荐。为什么需要找呢?原先ai只能干单点的事,没有到那么通用。除了这些点以外的地方,都不是ai覆盖的,是软件覆盖的。

q:我们能看到ai带来的生产力变化是非线性的增长,跟互联网或者芯片的迭代方式有很大区别,这也是现在那么多人选择创业的原因,您怎么看这个现象?

戴文渊:是的。这次的变化很难估计是多少万亿的市场,大家都是有机会的。

q:从大模型来看,现在有toc和tob两种路径,您觉得短期内哪个更有机会?

戴文渊:我认为短期内tob更有机会。抛开监管层面的问题,更容易被改进的是原来水平较低的,现有的toc软件体验比tob好得多,后者就更容易被替代。

q:您觉得底层模型研发更赚钱,还是上层应用开发更赚钱?

戴文渊:最后其实都赚钱,英特尔也赚钱,微软也赚钱。

q:是不是可能会出现一种情况,某家软件公司通过生成式ai,成长为一家比salesforce更厉害的公司,是有这种可能性的?

戴文渊:这是一定的。

1
52

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
你可能也喜欢这些文章

最新文章推荐

主笔

关注大公司、to b、新消费。有料?微信:jonas_suu

最近内容

报道的项目

我要联系
人工智能技术与服务提供商

提及的项目

下一篇

“奶酪棒”的故事结束了?

2023-04-29

热门标签

36氪app让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

网站地图