查看原文
其他

年会讲话 | 潘云鹤:AI和文化产业的升级

杭州城研中心 城市怎么办
2024-09-28

▲点击蓝字 关注我们!




大家上午好!非常高兴应邀第十四次参加中国城市学年会,我今天想和大家探讨的题目是“AI和文化产业的升级”。 




AI技术的突破




(一)2023年AI的热点:ChatGPT的突破


从2023年开始人工智能兴起了一个新的热潮,全世界对OpenAI公司ChatGPT新程序议论纷纷。常刊登经济、政治、军事信息的《参考消息》在2023年2月用两个版面来报道ChatGPT,同时也刊登了中国的百度公司将迅速发展人工智能的消息。2023年5月,科技部开始研究中国大模型的发展方向。在杭州召开的全国人工智能发展会议上,二十余位专家讨论认为,ChatGPT的成功得益于人工智能在大数据、大模型、大知识、大用户、智能生成AIGC等五个方面的巨变。具体表现在:目前已经拥有了1.45TB大数据,相当于2.25亿本书,形成了巨大的语料库;已经构建了1750亿个参数的大模型,提高了快速搜索与综合能力;按照“共生则关联”的原则,学习语言已经可以构造知识,能按指定主题自动生成语言;已经拥有1亿多规模庞大的用户,他们可以从使用反馈中学习提高;智能生成AIGC,应用面极广。



(二)AIGC是AI技术的重要大突破


回顾近几年人工智能的发展,不难发现其正在逐渐转化为智能生成AIGC的趋势。2020年,谷歌Alpha Fold的突破引起了生物学很大的担忧;2021年,Facebook公司宣布进入元宇宙,meta已可以生成与实际世界关联的虚拟世界;2022年,ChatGPT等可以生成符合要求主题的文本。


AI技术发展瞄准一个模拟人类智能新的大目标——AI1.0向AI2.0发展,即逻辑、推理到行动发展为学习、识别到生成,而生成是创造的基础,创造则是生成前所未有的东西。从条件上讲,AIGC时代崛起需要大数据、大知识、大模型三个基本因素,如今三个基本条件都已具备,智能生成AIGC的时代已经到来。


过去也有智能生成,且布局很广。1982年,中国用人工智能做图案设计,像这样的图案用图案设计专家系统来推理,几分钟就能完成一幅,效果显著,当时引起了全世界的兴趣。但从理论上讲,当时只提出“图案设计专家系统”没有提出智能生成AIGC的概念。





我曾利用中国自主研发的百度大模型“文心一言”进行了文学创作尝试,通过让它创作关于杭州的诗歌,虽然结果难以媲美人类写诗的诗意与灵感,但这一实验揭示了AI在文学创作辅助中的初步探索及其面临的挑战。具体而言,在智能生成AIGC缺乏深厚传统文化底蕴与针对性训练的情况下,难以完全捕捉古诗词的韵味与意境,生成的内容往往显得机械且缺乏生命力。但有理由相信,未来随着算法的不断优化、数据集的丰富以及更多针对文学创作的专项训练,人工智能有望在保持其高效生成能力的同时,逐步融入并提升文学创作的艺术性与深度,为文学创作领域带来全新的可能性与变革。



我也尝试用大模型来作画,还是以“文心一言”为例,它拥有在文字生成与图像生成上的双重潜力。以特定提示词“黄河入海流”创作一幅绘画作品,尝试印象派、梵高、马奈、融合马奈和莫奈的不同风格,这一实践揭示了当前生成式人工智能在文转图过程中的局限性:虽然技术已能在图像生成层面达到一定的成熟度,但在深入理解并精准传达文本深层语义方面仍显不足,难以实现高度的个性化与精准控制。



(三)2024年AI再次爆发:sora带来跨媒体智能突破


Sora是OpenAI发布的人工智能文生视频大模型,它的出现为跨媒体智能的深度融合创造了可能。这里所指的“媒体”,超越了传统广播、电视等传播媒介的范畴,聚焦于信息形态的多样性,即语言、图形、视觉与听觉等元素间语义层面的无缝对接与转换。跨媒体智能的核心能力在于促进这些不同信息形态之间的语义贯通,为联想、推理、概括等高级认知功能的实现提供了关键支撑,其中,语言和视觉信息的跨越整合尤为关键,构成了人工智能2.0时代亟待攻克的重要课题。







AI技术突破引起

文化产业变化的突破




(一)创作和设计的智能化平台


创作和设计的智能化平台是一个典型的群体智能系统,其本质在于通过网络与数据技术,将平台内的参与者有机整合,形成了一种新型的合作范式。这一系统充分发挥了群体智能自组织结构的优势,促进了资源的高效配置与价值的创新创造,从而孕育出了一系列新兴业态,在此过程中,创作和设计的智能化平台企业往往扮演着技术创新与引领的角色,成为推动数字科技发展的关键力量。以Stability AI为例,该公司作为美国领先的智能化创作与设计平台,通过深度学习算法,实现了从简单草图到动态人物模型的快速转换,展示了群体智能在创意产业中的巨大潜力。


通过keypose引导,T2I适配器可以生成具有相同姿势的动物,例如熊猫和老虎。


Sketch T2I Adapter可以即插即用,无需额外训练,就可以产生任何结果


(二)大模型发展的指向


自然语言大模型发展情况

目前,全球LLM大模型(含不同版本)有329个,其中中国拥有103个,其参数量为2000B ~ 0.034B,训练Token为 40000B ~ 0.1B。



AI应用大模型指向文化创意:TOP50的情况

2024年8月与3月相比,30%是新上榜的公司,其中52% 属于图像、视频、音乐、语音等文化创意领域,并且视频、音频的质量迅速提升。


AI工具快速增长

根据2024年8月30日最新更新,目前已经形成了19783个AI工具,近5个月增加了4000个。目前有233个分类,其中涉及文化创意产业的有文字写作、图像、视频、代码、音频等。


案例:字节跳动连接AI工具而创新

2023 年底,字节跳动成立研发部门 Flow,专注于生成式人工智能应用,已在美国及其他国家推出了教育科技平台 Gauth (#44)、机器人构建器 Coze (#45)、通用助手 Doubao (#47)、通用助手APP Doubao(#26)、照片和视频编辑器 Hypic(#19)、个人助手 Cici(#34)等6款AI工具新产品,排名都进入了前50。




文化艺术产业将有大变革




(一)技术引领变化


AIGC将使文艺创作与设计的效率与产业形态发生巨变。利用AIGC,无论是画画,拍电影,还是写文章,抑或创作小说,其速度都会大大加快。


设计与创作工具与平台(平台经济2.0)将使得全民参与文艺创作时代到来。当前,全民摄影已成为普遍现象,预示着未来全民绘画乃至更广泛的艺术创作活动亦有可能成为常态,艺术的边界将被极大拓宽,准入门槛显著降低。在此背景下,个体的创意与想象力成为了最为宝贵的资源,其重要性日益凸显。


能掌握AI平台工具进行文艺创作与设计的人才更加重要。更为核心的是,需着力培养一批能熟练运用人工智能平台工具进行文艺创作与设计的新型人才。若继续沿用传统的艺术教育模式,仅聚焦于传统的艺术创作与设计技能,则此类人才的就业市场或将面临日益严峻的挑战。因此,教育体系需适时调整,应更注重跨学科融合,强化人工智能技术在艺术创作与设计领域的应用教育,以培养出适应未来需求的复合型人才。



(二)多重机遇:中国文化+文化产业化+AIGC叠加效应


当前,中国文化、文化产业化、AIGC三股浪潮出现叠加趋势,推动了中国文化产业的迅猛发展,2024年上半年,文化产业实现营收64961亿元,比上年同期增长7.5%,相当于我国GDP总量的1/10。其中最显著的例子就是《黑神话:悟空》,作为国产首款3A游戏,发售首日就攀升至各大平台销售排行榜首位,同时在线玩家突破140万。目前,销售额已突破50亿元。该游戏席卷全球不仅带动了中国文化热,比如《西游记》英文版脱销,而且也为国内诸多历史文化遗迹带来了火爆流量,如山西晋城的玉皇庙、天津蓟州的独乐寺、四川绵阳的天王殿、重庆大足石刻等。


在AIGC推动下,中国文化和中国文化产业必然会迎来大发展的浪潮,各地政府和企业都应该及早认识到浪潮到来的意义。这个浪潮的潮头在哪里,是在北京,上海、杭州还是长沙?现在不知道,但我知道有一些政府和企业已经下决心在迎接这个浪潮中发力了。我希望中国在这次浪潮中能展现实力,勇立潮头,给全世界带来一次文化冲击,这对于大国崛起是必不可少的。

(根据录音整理,未经本人审阅。)



供稿:邵   莹

编辑:林玥玥

审核:毛燕武


免责声明:文章旨在传递更多信息及用于知识推广、网络分享,不具有任何商业目的。如有论文、图片版权异议及其他任何问题,请权利人通过后台留言及时告知,我们会妥善处理。

推荐阅读:

"城市怎么办"微信公众号

投稿邮箱:

urbanchina@vip.126.com

继续滑动看下一个
城市怎么办
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存