查看原文
其他

一场划时代的革命已经开始……

田园 天罡 2024-04-08
【田园按】AI引领的第四次工业革命已经来了!红衣教主周鸿祎的视频有助于大家对AI的了解。在人工智能领域,中国与美国的差距不是缩短了,而是扩大了,这是周鸿祎这样的专业人士的判断。

通用人工智能的推出,将深刻地改变着世界,至少对普通人来说,周鸿祎提出了一个非常好的概念,叫做科技平权。


这个世界是不平等的,但科技能够改变我们的处境,改变我们的阶层,这就是科技平权,而这些都需要我们去学习!


 
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

有人提出想要“一段海上自行车比赛的视频,让各种动物作为运动员骑自行车,采用无人机拍摄视角”。奥特曼在回复中发布了一段由Sora生成的视频,视频中有企鹅、海豚和其他水生生物骑自行车。


一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。




电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。


AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。


竖屏超近景视角下,这只蜥蜴细节拉满:


另一段视频显示,一位身穿围裙、面带微笑的白发女士邀请观众进入她的厨房。有人向奥特曼要一段“由一名祖母辈的网红主持的自制团子烹饪课程,背景是一个质朴的托斯卡纳乡村厨房,并配有电影级的灯光”,之后Sora生成了这段AI视频。

OpenAI发布了多个Sora生成的视频,大家可以感受一下。或许已经很难再分清,AI和现实的界限了。

网友直呼工作要丢了!



甚至有人已经开始“悼念”一整个行业!



还有网友表示,电影业要彻底颠覆了。

一位YouTube博主Paddy Galloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”

对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。


该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。


OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。

视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。

Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E 3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。

如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。



今日下午,周鸿祎又在微博发长文,谈论他对OpenAI刚刚发布的文生视频大模型Sora的看法。


周鸿祎称,Sora意味着AGI实现将从10年缩短到1年。


周鸿祎表示,很多人说Sora的效果吊打Pika和Runway,这很正常,和创业者团队比OpenAI这种有核心技术的公司实力还是非常强劲的。周鸿祎认为,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。今天Sora可能给广告业、电影预告片、短视频行业带来巨大的颠覆,但它不一定那么快击败TikTok,更可能成为TikTok的创作工具。


此外,周鸿祎还提到,现在所有的文生图、文生视频都是在2D平面上对图形元素进行操作,并没有适用物理定律。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况。


所以他理解这次OpenAl利用它的大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。这都是大模型的功劳!


感谢支持田园的读者朋友。真话不全说,这是知识分子的权利;假话不说,这是知识分子的底线,请珍惜坚守底线的人。

知音相惜

有人问我:你发这些有什么用?能改变什么?我会告诉他:我传播了一些常识,没想过有什用,只是认为这样是对的。


  推荐阅读 
真傻
插队砸车事件反转?第二段视频出来了
拉完屎用卫生纸擦屁股,是不是资本主义的骗局?
插队砸车事件反转?第二段视频出来了
乱世中,这些硬通货可能救你一命
一觉醒来:马斯克把人类带入超人时代
突发!副局长与女教师车内中毒身亡,聊天记录却揭开了另一个盖子
在广东砸车的河北奔驰男被拘留了
商务部关于CPTPP最新表态,中国或迎来第二次国运叩门时刻
哈马斯使用中国武器?中方回应
拉夫罗夫刚发出开战提醒,中方已经抵达朝鲜,中方要当一回定海针
“12秒换刑13年”的雷政富出狱了
未满12岁男孩杀害4岁半女童,最新:警方已撤案
我知道荒唐,但没想到这么荒唐
重大突破!澳媒曝孙维疑似身份造假,内政部或介入调查!其丈夫罕见接受媒体采访,未来可能永远离开澳洲…
中方增持124亿美债,又购入29万吨美国大豆,美宣布派代表团访华
  一定不要放过这个畜生!
  比“守身如玉”更重要的是“守脑如玉”
“不和你玩了”才叫最大的失败!
北京地铁打老外被反杀和他们的遮羞布
“一根青菜”盒饭上热搜:这样可怜的饭菜,都是谁在吃啊?
朱令案最新消息:或将重新调查,律所向最高检提起法律意见书:呼吁启动监督程序
47国发联合声明,谴责“俄使用朝鲜弹道导弹”,中方回应
2个乌克兰美女诱杀46名俄军士兵,被抓捕时又打死数名俄特工,跑了……
台湾的最新评估:解放军收台首波登陆5万人,要警惕“焦土战略”
台湾为何与我们渐行渐远?
重磅!英法与乌克兰签署安全协议
最新!中国人口二连降,2023年比上年末减少208万人!
中央内定的台湾省委书记,竟是他…
10岁女将军亲切接见部队官兵,气场强大


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存