把大模型装进群聊里,钉钉会翻车吗?

更新时间:2023-06-01 14:27:04作者:橙橘网

把大模型装进群聊里,钉钉会翻车吗?



作者丨小盖

如果评选今年全球技术影响力榜单,大模型与AI一定是回避不掉的话题。甚至,到今天还没发布大模型的科技公司,在行业里已经显得有点非主流了。

微软和OpenAI联手烧起大型语言模型之火后,国内大模型飞快卷了起来。在百度在3月底发布文心一言后,阿里、字节、科大讯飞等行业巨头,以及商汤、知乎等细分领域玩家都陆续发布了自己的大模型产品,钉钉、WPS等也陆续宣布自己对大模型重塑应用层的思考。

5月的最后一天,在筹备了一个多月之后,接入阿里云通义大模型的钉钉斜杠“/”开启了对外公开邀测。虎嗅也第一时间拿到了邀测资格并上手体验。

不只有目前主流的文档、会议AI,群聊AI的产品设计上也让我们能够感受到这家有着6亿用户的赛道领导者,正在试图创新AI与应用的结合方式,将大模型做到群聊里。

钉钉应该是当下唯一把IM群聊作为核心界面,进行大模型改造的产品。这与其他厂商将文档作为核心界面大有不同,到底是另辟蹊径不从众,还是继续躺在8年的舒适区里出不来?

不只有文档AI,大模型还被装进了群里

在钉钉斜杠开放的一揽子AI能力中,首先自然要有喜闻乐见的文档AI。

在Notion AI出现后,文档成为当下大模型改造的热门产品,微软Microsoft 365、谷歌Workspace,以及国内的WPS等,都针对文档下了功夫,不过,大家的文档AI样子都差不多。

当然,这的确是一个市场上都在做、钉钉也必须做的产品。

目前,用户可以在钉钉文档上实现各类的文生文及文档智能摘要等功能,包括辅助创作,以及改写、润色等等能力,用户体验与Notion相似,不过率先引入了文生图。

总的来讲能力可圈可点,如果以ChatGPT的代际来类比,大概在3.0-3.5之间的水准;生成图片的能力中规中矩,相比midjourney还有明显差距,但只要不刻意去生成例如鱼香肉丝等刁钻的图片,已经可以辅助办公。


提示词:雅典诸神拿着电脑在办公室开会 油画风格,愁眉苦脸

其次是视频会议。

视频会议被视为文档之后下一个会被大模型改造的核心办公场景,目前业内尚没有成熟的解决方案,都处于前期准备阶段。

比如,Zoom刚刚宣布与人工智能初创公司Anthropic的合作,将Anthropic的AI助理Claude与Zoom平台(包括团队聊天、会议、电话、白板、ZoomIQ)集成。

钉钉视频会议中,可实现对会议全程进行转文字,及按主题划分章节并生成摘要。在这一领域,钉钉属于行业内比较早的产品,产品体验需要用户的检验。

最后是钉钉的IM(即时通讯)场景,它融合了消息摘要、AI画画和问答机器人、应用开发等多项AI功能,也是最值得探讨的场景。

IM在很多人看来是一个并不起眼的场景,一是中国用户已习以为常,二是与大模型源头的chat方式有类似之处。但起家于沟通的钉钉,似乎一直对IM与群聊有着自己的坚持,或者说是偏执。从邀测中能感受到,面临大模型,钉钉再次选择将群聊作为最核心的用户界面。

比如目前钉钉独有的应用开发功能,拍张照片或者上传张图片就能让AI开发一个应用,并自动以钉钉酷应用的形式安装到群聊内,不过看起来暂时只能开发表单类轻应用。

拍照生成一个应用后,如果想修改它,也只需要对话就可完成。这的确做到了一个不懂代码甚至不懂IT的小白,也可以用AI来开发应用;

不过,这些功能的体验也并非全都能满足刚需。比如,智能摘要很实用,可以几秒钟帮你总结、99+群聊消息的要点,不用再去爬楼翻记录。不过,目前这项功能抓取的更像是聊天的框架,对讨论的要点信息的抓取还有待提高。



最后,是笔者看来最为实用的一项功能——问答机器人。在群聊里输入“/”可以创建一个会学习文档的机器人,它能智能地进行提取、定位和总结文档内的信息,自动生成答案回复,可以类比为一个微型的知识小模型,且准确性比通用大模型更高。它一次性能学习数十万字的中文文档,并且能够学习多个文档,在客服答疑、社群运营、新人培训等实际生产场景,实用性很高。



总体体验下来,我们可以从两个层面去评述钉钉的AI:

第一,在各产品底层依赖的技术、算法层面,处在中规中矩的水平,还有很多提升空间,不过所幸大模型最擅长的就是快速学习、调优;

第二,在产品层面有很多不同的用户交互方式,尤其是将群聊作为核心界面,来承载AI的落地,足见钉钉没有完全模仿别人的策略,而是在尝试工程化创新。

就像OpenAI推出plugin(插件)来赋予AI更联网、更实时的工具属性,某种程度上,AI+群与酷应用的组合也赋予了钉钉很强的贴近业务场景的工具属性,也给生产场景的复杂应用怎么结合大模型提供了一个参照思路。

偏执“群聊”,是好是坏?

实际上,钉钉对沟通一直有着偏执。钉钉起源于IM,8年多的时间里围绕IM场景中,也做了不少初时不以为然、长期看却能改变行业的产品创新,比如已读未读、DING、消息卡片等等。“已读”在办公领域、甚至电商App中都成为常态,消息卡片也成为各办公APP将碎片化信息,进行结构化的通用形态。

在过去两年,钉钉在提出“业务数字化”后,依旧在群这个界面做了不少新尝试,其中有两次大的更新,和本次钉钉落地大模型有着强关联性。

一是2022年3月,钉钉发布一种全新的应用形态——酷应用,这是在钉钉all in低代码后的新动作。在笔者看来,钉钉的低代码的价值在于将开发、IT甚至数字化的权利下放给更多人;所谓酷应用,虽然命名值得再议,不过它确实解决了一个问题——将复杂应用融入到群这种低门槛的界面,且以结构化的方式输出信息。

大部分人接触到的“群聊”,足够简单、直白,但在有效传达信息、推动协同的进展上有着“天生”的缺陷。为了解决这些影响工作的问题,各家也是拿出了各家的方法,比如,微信通过小程序来扩展群的协作属性。

钉钉为了在群里能够用复杂软件,则做了个酷应用,将原本大块头的软件系统打碎,拆分为一个个小的组件,以卡片的形式,供用户在群聊里调用。这种卡片无需下载、不用安装,使用时也不用点进去,可直接在卡片上进行编辑,数据实时刷新。



二是在2022年12月钉钉发布的7.0版本,要用“群2.0”把触角从组织内突破到企业间,还是将群聊作为核心,把跨企业的协作做到群里。

过去的群聊大多就是聊天,应用系统之间是不通的。但以群为核心,去打破IT设计中租户的概念,在一个群中可以连接不同组织的人、数据、应用系统,打破了过去数据、系统受限于组织边界的束缚。

从钉钉发展的关键历程中,可以看到这种群聊偏执。的确,某种程度上在“群聊”场景,钉钉的创新力做到了国内最前列。

但今天面对AI新一轮的技术迭代,大模型对哪些应用能够带来巨大改变,目前的几点共识中并没有群聊:

与搜索引擎相结合,以百度和Bing为代表,可以为人节省大量筛选信息的时间;其次是文档,前有Notion验证,后有微软、WPS等跟随;再次,通用AI技术逐渐取代现有AI技术,例如用GPT的通用AI技术帮助自动驾驶实现跨越L3;最后,当通用AI技术愈发成熟,走向制造、医药等生产领域,解决各种问题。

前两者目前已有先行者可参照,后两者则暂无可借鉴标的。钉钉依然坚持群聊,在群场景中寻求大模型与商业的结合,是摸着石头过河,还是在自己擅长的群聊舒适区出不来了?

AI+群、酷应用,试图让AI人人可用

钉钉总裁叶军在4月接受采访时曾说过一段话:“有了AI以后,相当于是AI跟酷应用结合,AI就是它的大脑,酷应用就是它的手和脚。AI不只是以前的回答或者写个图片,还可以生成应用程序,甚至交互界面。以前存量的低代码系统,API系统数据和服务,可以跟AI快速建立连接和对接。”

在钉钉AI邀测后再回头看,这可能是对接入大模型后钉钉该怎么走的思考,也可以据此猜测,钉钉为什么选择了群:

对钉钉来讲,大模型的加入必然会带来应用开发门槛的继续降低,钉钉上的应用仍会爆发式增长,随之而来的就是庞大的应用数据。AI作为大脑处理数据,包括文档、会议的数据,也包括深层次的生产数据、业务数据,而这些生产系统也需要通过群聊与酷应用实现用户交互:

以聊天为界面,低代码和酷应用可以连接各类复杂的业务系统,比如MES、ERP、BOM等生产系统,订单、广告、采购等业务系统,在它们之间实现深层次的数据互通,再由AI汇总。更重要的是,这也是每个人都能够得着、用得上的低门槛方式,不需要去学习怎么使用专业的系统,在群里打打字就可以完成过去复杂的业务流程。

这可能是钉钉的思考——不只是AI停留在浅层的工具,也希望与群、酷应用结合,把AI落到生产场景,同时做到AI人人可用,实现产品范式的重塑。

另一方面,大模型也为钉钉提供了一个“减肥”的机会。钉钉用了8年成为超级App,但不可避免地越来越复杂、臃肿。这是所有软件产品会面临的共同难题。即便是有了酷应用、在群聊上做了很多降噪的设计,钉钉也一直没有找到很好的解决方案。

显然,钉钉也看到了AI的巨大机会,甚至提出未来的钉钉也许只是一条斜杠。他们提出,未来会通过一个简洁的新入口,把所有APP建立起来的壁垒全部跳过。例如,以后买东西不必细究货物是来自淘宝还是拼多多,以后的应用也不必经过复杂的交互界面,可能只需要一段自然语言对话,算法与数据就会呈现出结果。

钉钉起源于沟通,在推进业务数字化的阶段先后推出低代码与酷应用,今天在AI的加持下,又在擅长的IM领域摸着石头过河,试图趟出一条新的路径。这的确为AI工程化落地提出了一种新的思路。

从另一个角度来看,先不论大模型装进群聊能否成功,但中国大模型的发展显然处在追赶阶段,需要更多摸着石头过河的企业,而不该只有摸着他人过河的企业。

本文标签: 钉钉  大模型  app  wps  插件功能  阿里巴巴集团