查看原文
其他

钉钉已经在成为一个 AI 入口了

StartupBoy 投资实习所 2023-07-28

AI 这波浪潮带给我们的影响正在各个领域延伸,英伟达正式进入了万亿美金俱乐部,红杉和 Accel 等顶级 VC 甚至开始要求其被投公司们关注自己的抗 AI 风险能力

在国内,大模型的竞争程度甚至比海外还激烈,百度、阿里、字节以及科大讯飞等都发布了自己的大模型产品,并且陆陆续续开始将其应用于各自产品的核心应用场景。


钉钉在上个月发布基于阿里通义大模型的 AI 战略后,昨天正式开启了对外的定向邀测,我也在第一时间进行了简单的体验。


如之前的发布会所展示那样,这次邀测将四个核心应用场景的能力都开放了出来,涵盖了钉钉的文档、群聊、视频会议和应用开发等核心场景,涉及文生文、文生图、摘要总结和应用生成等多种 AI 能力。整个体验下来,钉钉斜杠“/”给了我 3 个感受:


  1. 钉钉 AI 更加的 All in one,如果做个简单的类比的话,可以将其看作是在一个产品里实现了 Notion AI+Midjourney+Zoom+Slack+OpenAI Plugin

  2. 问答机器人让每个人都可以拥有一个 AI 助手,也可以让企业可以快速训练自己的专属小模型

  3. 作为协同产品本身的核心以及 AI 能力承载的集中地,IM 可能正在成为国内 AI 应用最重要的一个入口


文档图文创作:集合Notion AI+Midjourney,但还有较大差距


首先是钉钉文档,这块和当下大部分文档类 AI 产品的交互非常类似,核心是各种文案的生成和辅助创作,像 Notion AI 覆盖的应用场景钉钉文档基本上都做了覆盖,你可以根据自己的需求让它进行头脑风暴、写新闻稿或者营销策划啥的,下面是我让钉钉斜杠简单写的一个关于钉钉文档和 Notion 的对比文章,内容质量和 Notion AI 生成的其实已经差不多了。



不过在生成表格这块,钉钉文档将这个场景单独列了出来,让表格这个需求更直接了一些。除此之外,钉钉 AI 也把图片生成的能力直接放到了文档里,相当于让它具备了 Midjourney 的能力,这个对于很多写文案需要配图的场景来说就非常方便了,你不需要再单独用其它产品来生成图片素材了,这是我觉得钉钉 AI 更 All in one 的第一个点。


不过在我体验文生图的过程中,也遇到了效果不太满意的情况,相比于 Midjourney,它画画的能力还有较大差距。不过它的 Prompt 更简单,结合工作中的高频场景,使用起来更方便。下面是我让它生成一位程序员在办公桌上对着电脑屏幕写程序的照片,给了我下面四张效果图,这个看着其实已经有一些感觉了。



另外,它对图片风格的理解我觉得可以达到及格水平,和用 Midjourney 画画的 prompt 一样,当我加入水墨画、卡通、印象派、广告插画、贴纸艺术、甚至是宫崎骏动画风格,效果都还不错。



说实话这个功能我还挺期待的,这样以后很多工作只需要在一个地方就完成了。将图片生成直接放到文档里,我体验过的产品像 Notion AI 和 Google 应该都还没有这么做,Google Docs 目前甚至连中文都还不支持。大家都在谈 All in one,那我想 AI 能力也应该实现能在一个地方完成的事情尽量不要在多个地方完成。


摘要提取:一键群爬楼、2小时的会1分钟看完


在视频会议结合 AI 方面,Zoom 最近参与投资了 OpenAI 的竞争对手 Anthropic,目标是希望借助其 AI 能力打造一个视频会议助手(Copilot),钉钉的目标也差不多。


如之前钉钉发布会上所介绍的那样,钉钉会议产品里已经实现了对会议纪要更智能的处理,会议结束后,其闪记会自动生成一份完整的会议内容纪要,你可以清晰看到会议相关的重点摘要、待办事项和速记内容。如果会议时间比较长、主题比较多,摘要还可以分议题、分段落帮你进行总结,一场两三个小时的会议1分钟就看完重点了。


此外,它可以快速回溯到会议中对应的环节,实现对会议内容的回顾。比方说可以按发言人、按关键词的维度进行筛选,选中发言人的发言片段,并能自动实现文字、视频、语音同步的内容定位,快速定位到想要查找的内容。



据官方介绍,摘要能力背后的通义听悟大模型内置了新一代工业级语音识别模型 Paraformer,中文理解与摘要准确度达 95% 以上,还能实现传统厂商 2 倍的转写速度,并对 10 人以上说话场景进行角色区分。我相信这些能力应该成为未来所有视频会议产品的标配。


摘要生成这个能力也延展到了钉钉 IM 的群聊场景,和 Slack 之前推出的 Slack GPT 类似,现在一键即可完成对最近 100 条群消息的摘要生成,省却大家在多个群里爬楼看消息的时间。新入群的同学面对海量消息,也可以快速了解前提提要。这是我测试时的效果,基本上总结得还是非常清晰的。



开发应用:无需代码,拍张照就行了


拍张照生成应用则让 AI 技术更加的民主化,不用写代码、甚至都不需要像之前使用低代码产品的拖拉拽动作,你只需要画个图、拍个照、用自然语言描述就能生成一个应用,并且这个应用可以直接安装在群里开始使用。


目前最方便的场景就是类似信息反馈、活动报名或者满意度调查这种表单应用的生成,你只需要在白纸或者白板上画一个简单的表单模型出来,用手机拍照上传到钉钉即可生成应用,之后你还可以通过对话的方式对这个应用的选项、字段等进行修改。


这里有一个重点是它生成的应用可以不光是个独立的小应用,还可以与企业内部系统进行打通,比方说当销售人员在群里实时提交了当天的客户跟进记录时,相关信息也可以通过其钉钉宜搭的接口同步到企业内部的 CRM 系统中,实现数据回流。



为了体验这个功能,我在纸上画了上面的图片,很快钉钉斜杠就帮我生成了一个简单的表单应用(如下图),并且还根据这个表单内容多生成了两个字段“备注”和“榜单特点”,这个是钉钉 AI 的智能推荐选项字段功能,根据你的表单内容自动进行字段的补全。



这个点实现起来并非那么容易,需要给大模型输入大量行业的 know how。钉钉说他们利用宜搭低代码的模板给大模型学习,已经沉淀了大量行业(制造业、医疗、建筑等)及各类高频业务场景(人事行政、财务报销、生产制造)的上千个应用模板,用起来确实更加智能了。


问答机器人:每个人都可以拥有的专属 AI 助手


在钉钉的 IM 群聊里,我最喜欢的一个 AI 功能是问答机器人,其实就是你给它投喂提供信息(目前是钉钉文档的内容),让它快速学习后变身为一个专属的 AI 机器人,无需手动设定问题和答案,然后群成员可以问它关于这些内容的任何问题,就像现在很多人开发的 PDFChat/WordChat 机器人一样。


我以公众号名字“投资实习所”建立了一个机器人,把之前比尔盖茨关于 AI 的文章上传投喂给它,很快就可以在群里艾特它让它回答问题,整个体验的效果目前已经非常不错了。



当然,你还可以继续给它喂多篇文档,让它自动新增、更新问答内容。据钉钉的说法,目前这个答疑机器人可以一次性学习数十万字的中文文档,未来可以用于类似客服答疑、制度培训以及各种法律咨询等专业场景,任何一个垂直领域都可以基于它来训练自己的小 AI 机器人。


我估计钉钉完全对外开放这个能力后,那些帮大家建立类似机器人的平台会受到很大的影响。而对于那些本来就在使用钉钉的企业来说,就可以用公司的私有数据训练自己的小模型机器人,既可以对内、也可以对外。


这将是一个很大的需求场景,特别是对于大量的中小企业来说,只需要将企业原有的知识库投喂给它就行了。


在这里,钉钉 IM 的角色已经有点类似于 OpenAI 之前发布的 Plugin 插件商店了,之前 OpenAI 将插件定义为语言模型的“眼睛和耳朵”,它们能够访问最新、私人或很具体而无法包含在训练数据中的信息。而与 OpenAI 所不同的是,很多企业本身就是其钉钉产品的客户。


整体实测下来,我觉得钉钉在整合各种应用场景的 AI 能力方面 All in one 做得更加彻底,海外可能需要 Notion、Zoom、Slack 以及 Midjourney 叠加起来实现的能力,在钉钉上全都可以完成。


而 IM 作为钉钉的核心,也是此次问答机器人、拍照生成应用这些 AI 功能承载的集中地,我觉得其成为未来 AI 入口是非常顺利成章的事情,这可能也是中国市场的一个特色。


延伸阅读:


1.ChatGPT 推 Plugin 将成 AI 时代的 AppStore


2.微软 Office 全面接入 AI,收购 Notion 的可能性应该不高了


3.红杉和 Accel 等 VC 开始要求被投公司审视自己的抗AI能力

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存