查看原文
其他

大模型Kimi研究报告:引领国产大模型群雄并起,国内AI应用迎发展良机(附下载)



需要下载本报告的朋友,可以扫描下方二维码进圈,2万+份报告,3000+会员,高清原版,无限制下载,持续更新

(公众号资源有限,仅能展示部分少数报告,加入星球获取更多精选报告)




(精选报告来源:报告研究所)


Kimi 实现破圈,引领国产大模型新方向 


月之暗面成为国产大模型新星 


愿景宏大,Kimi 成为国内通用大模型头部应用。月之暗面科技有限公司成立于 2023 年 3 月 11 日,秉持“寻求将能源转换为智能的最优解”的愿景,致力于通 过产品与用户共同创作,实现通用人工智能(AGI)目标。2023 年 10 月,公司正 式推出第一款对话类产品 Kimi 智能助手,其基于千亿级模型参数构建并以长文本 处理作为最核心能力,为用户提供高达 20 万汉字的输入与输出支持,实现了长上 下文的无损记忆。公司产品迭代迅速,并于 2024 年 2 月将 Moonshot AI 开放平台 启动公测,于 24 年 3 月进一步将上下文能力提升至 200 万汉字,不到半年提升 10 倍。当前,随着 Kimi 火爆出圈,已经成为国产 AI 头部应用。


创 AI 融资新高,吸金能力强劲。2023 年 6 月,月之暗面获得来自红衫资本中国 与真格基金的天使轮投资,投资金额超 2 亿美元。仅 4 月后,公司获得近 20 亿人 民币的第二轮融资,主要投资机构包括红衫资本中国、砺思资本等。2024 年 2 月, 公司完成超 10 亿美元的 A 轮融资,由阿里领投,红衫资本中国、小红书、美团等 跟投,投后估值约 25 亿美元,打破国内 AI 领域最高单轮融资额度的记录。


Kimi 访问量迅速提升,产品得到市场广泛认可。随着 Kimi 在用户体验,长文本 处理能力上口碑的日益积累,Kimi 的访问量整体呈现持续上涨。尤其是在 24 年 3 月后,公司开启了 200 万字的“长文本”输入的内测,产品能力进一步被市场认 可。据 SimilarWeb 统计,3 月 20 日 Kimi 移动端/桌面端的访问量同比分别高增 332/987pct,尤其近一周访问量激增。根据 AI 产品榜 2 月数据,目前国内多数 AI 应用的访问量出现了下降,但 Kimi 仍保持了极高的增长。

Kimi 主打长文本能力,产品能力优异 

上下文长度不足为传统大模型应用带来定制化和迭代问题。传统大模型应用中, 由于较短的上下文,会出现分割输入(同一单词分段输入后,出现语义理解的歧 义)、快速遗忘(角色扮演时,多轮对话后遗忘早期设定)、长度受限( Agent 等场景下,复杂任务无法装载在 Context 中)等问题。在“记忆”有限的背景下, 为了面对各类应用场景,传统大模型引入 fine-tune 实现定制化,而这样再模型 迭代后又将面临再次 fine-tune 的困境。如此造成了较高的成本,同时也无法满 足多数客户的需求。月之暗面公司认为,Long Context 是解锁模型定制与模型迭 代之间矛盾的钥匙。

长上下文可以解决 90%的定制问题。通过 Long Context,上下文中可以承载足够 多的信息,而这些信息足以让模型实现定制化。第一版的 Kimi Chat 就已支持长 达 20 万字的上下文处理能力,能满足大多数场景应用,例如角色定制、客服交 流、简历筛选等,在输入大多数客户要求的内容后(角色要求、产品手册、筛选 标准),Long Context 仍能支持后续超长的互动空间。利用 Long Context 可以 大幅减少 fine-tune 的成本,实现模型应用的“多、快、好、省”。例如可以先用 5 万字定制一个模型的能力,剩余还有大量文字窗口,也足够日常交互使用。而 fine-tune 需要构造数据并训练,时间较长且需要较高的复杂度,单位 token 的成本也更高。公司选择用 Long Context 方式来解决 90%的问题,更好向前向后 兼容,也成为公司最高优先级的技术突破方向。

Kimi Chat 在长文本、代码生成方面能力表现出色。

我们对其进行测试,发送了 8 篇有关货币政策的论文进行解析,在响应速度方面,对于 30 页以内的文档,上 传后即可迅速完成解析,仅需 20 秒综述相关文本即输出完毕;

在长文本概括能力 方面,模型能兼顾各文章核心观点,并能在处理多篇论文时,有效地比较和融合 相似的观点,同时保证文本输出的可读性和层次性。

在代码复现方面,Kimi 能够 运用 Python、R 等编程语言,提供精准且高效的代码实现,其不仅能根据论文的 模型和关键变量迅速编写出清晰、结构良好的代码,还能逐行解释代码的功能与 内在逻辑,确保用户能够充分理解其工作原理。

长文本能力成为产业共识,Kimi 取得领先并成为破局关键 

提升长文本能力是全球大模型技术趋势。目前,海内外的主要大模型玩家正在积 极扩展上下文窗口,以进一步强化模型处理复杂信息、理解并生成有逻辑的长文 本能力。目前 Kimi 升级到 200 万汉字,在全球范围内保持领先。而国内多家大模 型也在积极迭代,近期阿里通义千问宣布将向所有人免费开放 1000 万字的长文档 处理功能;百度文心也将进行升级,长文本能力将达到 200-500 万字;360 智脑 也在内测 500 万字长文本处理功能。长文本能力成为大模型技术主要突破方向。

“大海捞针”测试验证了 Kimi 长文本能力。根据近一年全球各个大模型迭代方向, 上下文窗口的“长文本”再持续升级。其中,在文本持续变长过程中,大模型是 否会忽略掉部分细节内容的问题一直是“长文本”能力的关键。因此有开发者进 行了一项名为“大海捞针”的大模型长文本性能测试,即在文本中加入一句与该 文本内容不相关的句子,测试大模型是否能通过 Prompt 把这句话准确提取出来。月之暗面的工程师在 2023 年 12 月也进行了测试,选取模型为 Kimi Chat(支持 20 万汉字输入),GPT-4 Turbo(支持 128K 上下文窗口),Claude 2.1(支持 200K 上下文窗口)。根据测试结果,Kimi Chat 在“大海捞针”中的表现明显好于 GPT-4 Turbo 和 Claude 2.1。

该测试在为英文语料,中文语料 Kimi 优势更为明显。

月之暗面的工程师进行了多 次实验,在以上英文版测试中,Kimi 已经证明其领先的长文本能力。

同时在中文 版的“大海捞针”实验中,Kimi 优势更为显著。

该测试主要体现了大模型本身的 长文本记忆能力和指令遵循能力;

Kimi 在技术突破上选择了长下文方向,并取得 了全球领先的水准。

应用体验得到广泛认可,B、C 两端均有突破 

C 端:目标打造超级应用,致力于成为 AI 原生交互入口。月之暗面以实现通用人 工智能(AGI)为目标,主要聚焦和发力在 C 端,以“通用性”打造超级 APP。公 司以 C 端找到产品、技术、市场方向为最高优先级任务。Kimi 一经推出即受到市 场广泛追捧,在应用端获得行业领先的用户体验。除了长文本优势之外,Kimi 联 网搜索总结能力,一方面让信息交互获得最好的实时性,一方面有据可依的“参 考资料”一定程度上能够解决用户的“幻觉焦虑”。因此 Kimi 也更容易拓宽应用 场景,产品受到学术科研、互联网从业者、程序员、内容创作者、教育工作者、 职场白领等人群的广泛认可。同时,公司认为 AI-Native 产品核心价值在于个性 化交互,因此基于 Long Context 可以实现用户更多信息的保存,也更能对用户进 行画像,并形成定制化交互;随着用户信息积累越多,模型也更容易实现精准推 送,用户留存也会逐步提升。以 C 端入口来看,一旦 AI 形成用户粘性,有望对传 统搜索、内容推荐等各类应用产生影响。

互联网打法快速占领用户心智,已经过多次扩容。在产品和运营领域,公司也配 备了一批操盘过数亿 DAU 产品的产品经理和运营专家等人才。除了网页端和 APP 端之外,公司也推出了小程序;配合市场导流,公司小程序凭借极其便捷的交互 体验,也形成了用户快速裂变。24 年 3 月下旬,随着用户访问量快速提升,Kimi 流量异常增高,Kimi 智能助手的 APP 和小程序一度无法正常使用,公司也进行了 5 次扩容。

B 端:打造 Moonshot AI 开放平台,API 与 OpenAI 兼容。月之暗面于 2024 年 2 月将 Moonshot AI 开放平台进行公测,为了方便快速接入 Kimi 同等能力的大模 型,Moonshot AI 开放平台的 API 于 OpenAI 进行兼容,开发者无需对代码做参 数意外的修改即可平滑千亿。在公测之前,已有数百位开发者在 Moonshot AI 开 放平台内测打造了不少应用,这些均是未来 B 端拓展的可能性。例如自动生成代 码修改记录的 Kimi Commits、做企业法律问题尽调的案牍 AutoDocs、高效阅读 论文的 Cool Papers 等。其中“哄哄模拟器”最为火爆,其是一款角色扮演的小 游戏,最高同时在线人数超过 1 万,消耗的 tokens 也很快过亿。该产品一开始接 入的 GPT3.5,随后由于成本压力,切换为 Moonshot AI,但用户反馈依然很好。随着产品能力进一步认可,未来越来越多应用有望接入 Moonshot AI。

Moonshot AI 定价优于 OpenAI,长文本场景是应用落地方向。目前公司提供三个 基础模型 moonshot-v1-8k/32k/128k,每百万个 token 的定价为 12、24、60 元。与 GPT-4 Turbo 对比,其价格为每百万个 token 输入 10 美金、输出 30 美金, Moonshot AI 价格优势明显。结合公司最大优势在于“超长文本”的上下文, Moonshot AI 有望在长文本场景大放异彩,例如法律助手、科研助手、AI 阅读等 是较好的落地场景。

Kimi 火爆再次拉动算力需求增长 

训练算力测算

完整报告下载:因篇幅限制,本报告完整版PDF已分享到报告研究所知识星球,扫描图片中二维码进圈即可下载!


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。


全文完。感谢您的耐心阅读,请顺手点个"在看"吧~



业务咨询、商务合作:136 3162 3664(同微信)


欢迎加入报告研究所知识星球社群,入圈后您可以享受以下服务:

  1. 报告持续更新,分享最新、最深度的行业研究报告、投行报告、白皮书、蓝皮书、公司研报、统计报告等。公众号发布的报告也可同步下载;

  2. 海量研究报告均可下载PDF高清版,无限制;

  3. 以提问方式获取具体报告需求;


扫描下方二维码加入星球


关于我们

我们是报告专业研究机构及知识服务平台。专注于分享国内外各类行业研究报告、热点专题报告、调研分析报告、白皮书、蓝皮书等。所有报告来源于国内外数百家知名研究机构,覆盖新能源汽车、数字经济、新材料、新能源、信息技术、先进制造、节能环保等新兴产业,并涉及医药生物、金融、互联网+、医疗大健康等众多行业及细分领域。目前报告已累积近50000+,并持续更新。


报告涵盖但不限于:

1、新能源汽车、数字经济、新材料、新能源、信息技术、先进制造、节能环保;

2、互联网、新媒体、短视频、抖音、快手、小红书;

3、元宇宙、5G、区块链、人工智能;

4、房地产、金融、券商、保险、私募;

5、零售、快消品、餐饮、教育、医疗、化妆品、旅游酒店;


温馨提示


应广大粉丝要求,「报告研究所」成立了报告交流群,欢迎各位公司企业、投行、投资机构、政府机构、基金、创业者及金融资本圈朋友加入!


这里能且不限于:“行业交流、报告交流、信息交流、寻求合作等......”


入群方式:扫描 / 识别二维码加助理好友,发送「个人纸质名片」或「电子名片」审核后即可入群。

免责声明:
本平台只做内容的收集及分享,报告版权归原撰写发布机构所有,报告均通过公开合法渠道获得,如涉及侵权,请联系我们删除;如对报告内容存疑,请与撰写、发布机构联系


继续滑动看下一个
报告研究所
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存