发布日期:2026-02-06 02:17 点击次数:77

2月5日音问,可灵AI讲求内行上线3.0系列模子,当今正面向黑金会员灵通使用,瞻望将于近期全量上线。这次发布的可灵视频3.0、可灵视频3.0 Omni及可灵图片3.0、可灵图片3.0 Omni模子,遮蔽图片生成、视频生成、剪辑及后期等影视级全进程链路,记号着AI讲求参预影视与创意本体的中枢坐褥关键,可灵AI也讲求迈入3.0时期。
全新All-in-One居品和期间理念 多模态输入输出一体化助力原生创作
可灵3.0系列模子基于All-in-One居品和期间理念构建,酿成一个多模态输入与输出高度长入的一体化视频模子体系。它并非将功能简便肖似,而是通过长入架构,将影像创作中的意会、生成与剪辑整合为一个麇集进程,让创作初度在单一模子内完成闭环。
在这一体系下,创作家不错同期使用笔墨、图片、声息与视频动作输入,并成功赢得可用的专科影像级输出遵守,创作过程不再被拆分为多个用具与神色。
围绕创作家最照应的自在性与抒发力,可灵3.0系列模子在多个关键关键上作念了系统级增强。耐久困扰行业的一致性问题赢得突破性进展:通过整合视频主体上传、音色绑定及内行草创的“图生视频+主体参考”等一系列期间能力,好像使得东谈主物形象、动作与声息在复杂镜头切换中保捏自在,笔墨明晰、品牌符号可识别,即便在多话语场景下,视觉作风与脚色特征也能高度长入。
在叙事层面,模子营救最长15秒的麇集生成,并引入智能分镜与自界说镜头适度,让创作家好像成功组织镜头节拍与叙事结构,不再依赖碎屑化拼接,从而让镜头具备情谊递进与画面张力。

音画能力也被进一步拉都到影视创作方法。视频3.0与视频3.0 Omni均营救原生音画同出,遮蔽多语种与多种方位口音,东谈主物口型、情谊与扮演愈加当然,举座画面真确感权臣提高,东谈主物演绎更具扮演张力。图片模块则营救4K超清输出,分镜图与系列组图的引入,使静态画面本人也具备竣工的叙事能力。
从单点生成到系统化疗养,可灵3.0系列模子不仅仅一次模子升级,而是创作花式的变化。它将正本需要多东谈主谐和、多轮修正才能完成的导演级抒发,压缩进更成功、更可控的创作进程中,让更多创作家好像以接近专科制作的花式完成影像抒发。
可灵视频3.0:电影级叙事与精确掌控
全新的智能分镜系统如归拢位AI导演,能深度解读脚本意图,自动疗养机位与景别。不管是经典的“正反打”对话,照旧复杂的跨分镜转场,均可一键生成,大幅镌汰后期修正本钱。

通过内行草创的“图生视频 + 主体参考”期间,创作家可对画面特定元素进行二次锚定。不管镜头如何推拉摇移,主角、谈具及场景特征恒久自在如一。该期间灵验科罚了行业耐久存在的“主体崩坏”痛点。此外,模子营救最高15秒超长麇集生成,并适配多国话语(中英日韩西)及多种方位口音及方言(粤语、四川话、东北口音、北京口音等),已毕情谊充足的音画同步扮演。这些能力使AI不再仅是用具,而是能本质导演意图的智能创作伙伴。
可灵视频3.0 Omni:万能参考与极致一致性
Omni版块进一步强化了脚色一致性与指示反应的尖锐度。具体来说,创作家只需上传参考素材,模子即可已毕对特定主体视觉特征与音色的原生索求与绑定。基于特征解耦期间,脚色、谈具等元素可在不同场景中目田复用,恒久保捏归拢张脸、归拢种声息。

该版块不仅让画面更少崩坏、更具灵动感,还攻克了笔墨变形等费事,劝诱天果真分镜适度能力,使AI生成本体达到专科影视的“成功托福”方法。这相配于为导演提供了高度可控的“数字演员”与“造谣摄制组”。
可灵图片3.0系列模子:强化静态叙事 并营救4K超高清
可灵图片3.0及可灵图片3.0 Omni模子专注于强化静态画面的“叙事感”,用静帧讲述竣工故事。模子能深度解构提醒词中的视听元素,精确把控构图与视角逻辑,高度适配影视分镜、场景设定等专科需求。
{jz:field.toptypename/}新版块营救2K/4K超高清图直出,并新增系列组图生告捷能,在增强画面真确感的同期,确保组图间作风、光影与细节的高度长入,舒服专科视觉物料对精度与一致性的严苛条款。
冲破创作壁垒:AI成为中枢坐褥链路与三次跃迁
可灵AI 3.0完成了从“可用”到“可控”,再到“专科疗养”的三次关键跃迁。自2024年6月发布内行首个面向用户的 DiT 视频生成模子以来,可灵 AI 推动行业参预“可用时期”;参预2.0阶段后,通过模子能力和发达力的捏续提高,已毕了从“可用”到“好用”的演化。
基于All-in-One理念打造的可灵AI 3.0系列模子,在近期推出的O1和2.6模子基础上,进一步深远Multi-modal Visual Language(MVL)交互理念,已毕了从“基础生成”到“专科疗养”的系统性越过,在生成质地和专科可控两大创作维度上取得关键突破。
通过智能分镜、图生视频 + 主体参考、多话语多口音音画同出等中枢能力,模子不再仅仅意会创作意图,而是好像对镜头节拍、脚色联系与视听结构进行系统级疗养与协同。创作家不错在一个模子内完身分镜组织、主体锚定与叙事鼓舞,可灵AI也由此完成了从单点生成用具,向本体创意者下一代“创作接口”的进化。
在影视和告白界限,创作家可运用智能分镜等镜头疗养能力快速考证创意;在游戏与造谣制作中,自在的脚色一致性则能大幅加快数字财富的构建。据公开数据,遗弃2025年12月,可灵AI 已领有卓越6000万创作家,生成卓越6亿个视频,干事卓越3万家企业用户,年化收入开动率达到2.4亿好意思元。
可灵3.0系列模子的发布记号着AI从一个简便的生成用具回荡为意会创作意图、本质分镜的创作谐和者,属于每个东谈主的导演时期依然驾临。(心月)