关闭广告

再次掀翻AI圈!Sora2面前,MiniMax的另类打法

南方都市报534人阅读

初代王者Sora推出的升级版Sora2,再次“掀翻”了AI圈。除了比上一版Sora对物理世界理解更准确、逼真、可控、能实现同步生成音频能力以外,Sora2对AI圈的撞击在于,它的社交模式将模型厂商对AGI的野心和盘托出:在AI时代构造超过“抖音”这样的超级应用。

AI视频模型刚兴起之时,威尔·斯密斯吃意大利面吃得错漏百出的鬼畜视频记忆仍未远去,不到一年的时间,AI视频已经能对物理世界理解得更好,比如今年全球爆火的“猫猫跳水”“粒子消散”“兔子蹦床”系列视频。但模型厂商的野心并没有就此停下。10月28日,Minimax旗下海螺AI全量更新Hailuo 2.3、2.3 fast系列模型,再次推高视频产品上限。

与此同时,Minimax还用其他组合牌的方法验证了国内厂商的先进性:最新开源、专攻Agent和coding的M2大模型在权威测评榜单上打下全球第五、开源第一的成绩,在LMArena Web Dev榜单上水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型;语音模型MiniMax Speech 2.6专为商用场景Voice Agent 打造;MiniMax Music 2.0对音乐的理解与表达进一步升级。

一个时代有一个时代的超级应用,结合MiniMax的整体布局,你或许可以窥探到AI时代的创业者们用全模态不断逼近AI战事的终局状态和真正的AGI。

从爆款到变现,新的社交范式被模型厂商造出来了

近半年,AI生成的爆款视频多了起来。

最先出现在公众视野的爆款视频是“猫猫跳水”。周鹏从未想到,自己随手做的一条“口水片”,竟能给自己带来意想不到的曝光度。今年6月,一条在“鲤鱼与鱼Ai”账号上发布的动物跳水视频在互联网上迅速走红,周鹏成为了国内第一个做出“猫咪跳水”爆火视频的人。随后,各种动物、宠物跳水视频频繁出现在视频平台上,抖音平台上,“动物运动会”词条已有1.4亿的播放量。


周鹏在“鲤鱼与鱼Ai”账号上发布的动物运动会视频。

“粒子消散”是另一个爆款AI视频品类,“粒子消散”视频中人物或物体会转化为细小粒子,随着其在空间中逐步消散,会创造出一种梦幻的视觉效果。在抖音发起的“粒子消散大赛”中,这一主题中的视频结合先烈、经典著作人物的追溯等故事,已有4.6亿的播放量。

除了国内互联网,粒子消散模板的视频特效也在同一时间风靡海外。美国AI视频平台Higgsfield AI自今年7月份接入国内AI六小虎中Minimax旗下Hailuo02视频模型API,Hailuo02的粒子消散模板迅速广受欢迎,据Higgsfield AI透露,用户量两个月激增了三倍。



AI生成的爆款视频疯狂进入公众视野、形成新的社交范式的背后,是AI生成技术、底模能力正在被进一步推高。与此同时,AI视频正在进入影视、游戏等商业创作领域。

前述首个在国内做出“猫猫跳水”视频的周鹏,很早就感受到了AI视频带来的改变。相较于基于好玩心态和兴趣做的“口水片”,从今年2月起,周鹏已把更多的精力从原来的装修公司业务转移到AI视频上来,并在4月就开始接商单。他透露,目前自己已在全职用做AI广告服务,1分钟的视频价格在3万到5万之间。

谈及AI视频带来的变化,周鹏直言,以前一条1分钟的传统特效动画片,四个人的团队大概需要做20天,现在两个人用AI三天就能做出来。

新锐创作者“猫大人爱睡大觉”(下文称“猫大人”)也感知到了今年的AI视频热。“猫大人”是AIGC动画团队光影几何视觉方向负责人,此前从事的工作为3D方向。目前,“猫大人”所在的团队创作以中国经典传统文化故事IP、国风水墨为主,输出内容多会配上古典民乐,目前正在和头部视频大厂谈相关商业合作。


“猫大人爱睡大觉”团队作品

“猫大人”表示,目前在他的作品中,应用海螺的频率最高,海螺在大动态运镜、打斗、基础动画上都能解决得很好。

同时“猫大人”也表示,从电影到游戏行业,AI的降本效应已无处不在。“以前一部电影也许需要花上千万来做3D建模、绑定、灯光、渲染、合成等各种流程。尽管AI目前也有一些无法达到的效果,但确实将成本大大降低,甚至不到100万就可以做一部电影。”

“猫大人”兴奋地表示,自己做视频时常常会感到很“燃”。“我做的大多是国风的内容,在对传统内容的表现上,中国的厂商无疑是最好的,AI能赋能我们推动传统文化出海,把我们的优质内容推出海外甚至变现,这是AI时代最强的文化输出,可以让全球看到,其实动画不再只有迪士尼、皮克斯。”

“毛骨悚然”,Minimax拉高天花板

AI生成爆款视频更广泛走入公众视野的现象中,潜藏着中国视频生成模型厂商你追我赶的故事。周鹏就曾总结过,行业有几次“拉高天花板”式的模型上新:去年12月可灵AI 1.6上线,今年5月即梦AI 3.0发布,以及今年6月海螺02的上线。在周鹏看来,中国的视频生成模型正处于百花齐放的阶段:即梦对中国元素有独特的理解、Vidu在角色一致性上做得很好、海螺的运镜和动态实录最强。

在上述爆款视频的背后,Minimax的身影尤为不能忽略。

周鹏透露,以“猫猫跳水”视频为例,海螺02在当时已开启了一个“新的时代”。“其实猫猫跳水在海螺2.0出现前是不可能完成的,因为跳水这个动作很复杂,涉及空中转体、入水水花反馈等,这些你要逐字逐句用提示词教大模型生成,但海螺02对物理世界有感知,它可以自己完成这些动作的反馈。”

“粒子消散”背后最早的推手也是海螺。截至目前,在海螺国内App端,两款带有“粒子消散”特效的花瓣消失模板使用次数已超过40万人。

但Minimax明显没有就此停下。10月28日,Minimax旗下海螺AI全量更新Hailuo 2.3、2.3 fast系列模型。MiniMax全球业务总经理盛静远表示,MiniMax这一次推出的Hailuo 2.3、2.3 fast系列模型相较于Hailuo 02在多方面都进行了优化和升级。

其中,Hailuo 2.3在Hailuo 02模型的基础上进一步升级动态表现力,画面更加真实、稳定,且在肢体动作呈现、风格化以及人物微表情方面实现提升。



特别是在几乎所有模型都会遇到困难的舞蹈动作上,Hailuo 2.3的表现颇为惊人。这一次,海螺还在官网上准备了关于舞蹈的提示词模板,可以应用在各种舞种上。

周鹏在Hailuo 2.3、2.3 fast系列模型一发布就立马使用,他透露,“跳舞以前对模型来说是一个比较难的题目,因为这里面包含大量转身、头部的动作,还有就是手部细节会崩、转身后一个人的脸接上另一个人的身子,海螺2.3在这方面做得很好,复杂手部动作、手臂手指动作都解决得不错。”



他还提到,Hailuo 2.3在微表情的处理上也堪称强项。“大家不喜欢看死板的数字人,更希望数字人是有情感的,以前我们靠分镜、蒙太奇手法来侧面表达,比如主角很悲伤我们用平静的脸加一朵枯萎的花,现在可以直接用微表情了。”

另外,在此前被各大视频工具追求实现的粒子消散能力上,Hailuo 2.3这一次也做了新的突破。还记得上一个接入Hailuo2后拿到三倍用户增长的平台吗?这一次Hailuo2.3一上线,Higgsfield AI和多个视频平台都自发组织了内测活动,所有人都在期待借Hailuo2.3押中下一个“粒子消散”。

在物理表现与指令遵循方面,Hailuo 2.3再度推高上限,被无数海外专业人士推荐。

亚马逊Prime Video创意总监希瑟·库珀在Hailuo 2.3上线后快速试用,并为它的指令遵循能力感到惊奇;3D数字艺术家特拉维斯·戴维斯用Hailuo2.3做了一直想做的狼人变身视频,他认为就电影输出感而言,Hailuo2.3达到了让人毛骨悚然的效果,并再一次cue到了新模型的指令遵循能力。


3D数字艺术家特拉维斯·戴维斯推荐海螺。

美剧《大卫王朝》AI视觉特效艺术家Pierrick Chevallier认为,Hailuo 2.3将带来巨大冲击,他放出了自己用Hailuo 2.3做高空楼宇爆炸场景的测试demo,特效、爆炸效果、运镜都让人为之一振,Pierrick 直言“这个带有破坏场景的测试已经非常震撼了”。

模型厂商的野心:打造下一个时代的超级应用

今年10月1日,OpenAI发布了Sora 2模型,相比初代Sora模型,Sora 2在物理世界的准确性、真实感和可控性方面都实现了巨大提升,并首次加入了同步对话和音效生成功能。特别是新增的客串Cameo功能,为Sora 2带来了更具标志性的社交意义,首次混合了真实物理世界与AI世界。作为一个单独App推出(Sora App),被业内视为下一个接近甚至超过“抖音”“TikTok”的超级应用。

在这个AI版的“抖音”中,用户能创作AI内容、对他人生成的AI内容进行二次创作、在可自定义的信息流里发现新视频,还能通过“客串”功能,让自己或朋友进入Sora生成的环境,并进行各类社交。

尽管手机设备、互联网的进化,已经将大众变成可以“随时随地随手拍”的内容拍摄者。但客观来看,专业内容拍摄仍然是有门槛的行业。新AI视频产品的出现,一方面降低了专业创作视频的门槛,一方面又创造了新的场域,让用户可以把创意变成视频,甚至变现。与此同时,新的社交形态也潜藏在这些产品中,新的超级应用也许会从中诞生。

过去一段时间,行业在以下方面形成了布局趋势:一是多模态进一步融合,除了视频以外,音频等各种元素正在被模型厂商融入模型;二是传统专业视频市场在快速拥抱AI、在多重工作流中融入AI;三是模型厂商对视频模型的布局,正在从“单一对话工具”向“生态化社交平台”进发。

在布局这些趋势的同时,MiniMax已经用“猫咪跳水”“粒子消散”打造爆款来颠覆社交范式,并在全球范围内做到了小范围领先。

MiniMax不单独出牌,你可以看到,这家厂商是朝着整体生态去的,它按照自己的路线,全面布局,并系统地突破每一个模态的模型上限。

在近期的批量上新中,除了上新Hailuo 2.3、2.3 fast系列视频模型,也同步上新了语音模型MiniMax Speech 2.6、MiniMax Music 2.0,以及专门为coding和agent打造的MiniMax-M2。

M2一经上线,便在全球权威测评榜单Artificial Analysis (AA)中取得全球第五、开源第一的成绩;在LMArena Web Dev位居全球第四,超过了Claude 4.5;智能水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型。另外在价格上,MiniMax也再次以惠普的态度将M2价格颠覆至Claude 4.5的8%。


M2在全球权威测评榜单Artificial Analysis (AA)中取得全球第五。

目前,M2每天的调用量token还在迅速增长,已成为token wallet share最大的国产模型,未来有望切走Anthropic的份额。这应该是第一个国产模型真正在复杂的coding、agent场景中进入硅谷主流视野,现在每天的调用量token还在迅速增长。

在多模态融合上,这一次发布Hailuo Video Agent也正式迭代升级为支持全模态全能创作的 Media Agent。目前,Media Agent已自动匹配了多模态模型,agent集成语音、视频、图片、剪辑相关工具,会根据用户的要求分步骤实现视频需求。另外这一次还新增了“一键成片”功能。

在社交生态的打造上,MiniMax在国内布局有沉浸AI社交应用星野AI,在海外布局有情感陪伴类AI应用Talkie。据公开信息,上线一年后,Talkie在全球的月活跃用户突破1100万,主要用户来自美国市场,同时去年全年Talkie的营收已达到7000万美元。

据透露,在商业化端,MiniMax的ARR早已迈过上亿美金门槛,目前是年化可持续收入和国际化收入最高的中国公司之一。同时MiniMax很快会对标Veo3和Sora2推出下一代的技术,融合各个不同模态的领先技术。未来,MiniMax会带来哪些社交范式的颠覆、走出怎样的AGI之路,值得期待。

采写:南都N视频记者 林文琪

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

塞维利亚vs奥萨苏纳:夸西、胡安卢-桑切斯首发,劳尔-加西亚、博约莫出战

懂球帝 浏览 425

TFBOYS开个演唱会,炸出了无数牛鬼蛇神

冰川思想库 浏览 13275

冲绳知事7月将第三次访华:冲绳绝不能再次沦为战场

环球网资讯 浏览 65603

火箭官宣霍乐迪加盟:7新援全签约完毕 狄龙称史密斯或成联盟最佳

颜小白的篮球梦 浏览 14186

专家:俄乌“和平计划”应触及冲突发生深层原因

环球网资讯 浏览 160

到了秋天才知道,年纪大的女人要告别“小脚裤”,这样穿显瘦

静儿时尚达人 浏览 811

肖战主演电影《得闲谨制》,有点东西!

不八卦会死星人 浏览 72

美防长抨击美军士兵肥胖后 一张照片火了

环球网资讯 浏览 4035

白宫称舍弃乌领土能结束俄乌冲突 泽连斯基:我不同意

3号环球观 浏览 88270

同济发布全球首部《工程智能白皮书》,发起“国际工程智能联盟”全球倡议

上观新闻 浏览 619

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 712

魏晨一家三口合体,妻子抱着儿子看他演唱会

柠檬有娱乐 浏览 325

新越王?努涅斯本赛季联赛中已越位23次,英超球员中最多

直播吧 浏览 11053

特朗普拿错剧本了?刚扬言要禁中国“地沟油”,就遭美媒啪啪打脸

北向财经 浏览 747

宋慧乔怎么不会老啊?

时尚COSMO 浏览 274

黄子韬婚礼险翻车!许艺洋喊错男朋友

林木体育解说 浏览 724

台湾省金钟奖成了“照妖镜”,小S拿奖后,破防人算是照明白了

娱乐圈笔娱君 浏览 695

趁春光大好,赶紧法式一下!

瑞丽网 浏览 13323

熟龄女人多穿这"三裤一裙" 方便又高级

虎哥说衣不二 浏览 13914

辛杰上任9个月辞去万科董事长职务 深铁系黄力平接任

每日经济新闻 浏览 4159

牛弹琴:英国"动真格"了 王子被"大义灭亲"剥夺头衔

上游新闻 浏览 2359
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1