
取消




#可靈 AI3.0 全模態(tài)升級(jí) #15 秒視頻生成黑科技 #多模態(tài)創(chuàng)作引擎 #AI 賦能內(nèi)容生產(chǎn)2026 年 2 月,可靈 AI 正式推出 3.0 系列多模態(tài)模型,首次實(shí)現(xiàn)文本、圖像、音頻、視頻全模態(tài)輸入輸出的一體化整合,最長(zhǎng)支持 15 秒視頻生成,以 All-in-One 架構(gòu)重構(gòu) AI 創(chuàng)作流程,讓 “一人劇組” 從概念走向現(xiàn)實(shí),百度搜索量單日激增 2100%,成為 AI 內(nèi)容生產(chǎn)領(lǐng)域的現(xiàn)象級(jí)突破。該系列包含視頻 3.0、視頻 3.0 Omni、圖片 3.0 及圖片 3.0 Omni 四大核心模型,覆蓋從前期分鏡到后期合成的全鏈路創(chuàng)作,目前已向黑金會(huì)員開(kāi)放,預(yù)計(jì)短期內(nèi)全量上線,為專業(yè)創(chuàng)作者與普通用戶帶來(lái)創(chuàng)作效率的革命性提升。

全模態(tài)輸入輸出的深度整合,讓創(chuàng)作擺脫工具切換的繁瑣,實(shí)現(xiàn) “端到端” 的高效生產(chǎn)。創(chuàng)作者可同時(shí)上傳文本腳本、參考圖像、配音音頻及視頻片段,模型通過(guò)統(tǒng)一架構(gòu)無(wú)縫銜接理解、生成、編輯三大環(huán)節(jié),直接輸出具備專業(yè)質(zhì)感的影像內(nèi)容。例如,廣告從業(yè)者只需輸入產(chǎn)品文案、品牌 LOGO 圖像、宣傳音頻及 3 秒產(chǎn)品演示片段,模型就能自動(dòng)生成 15 秒完整廣告視頻,包含智能分鏡、角色口型匹配、文字信息清晰呈現(xiàn)等專業(yè)效果,全程無(wú)需額外工具輔助,創(chuàng)作周期從傳統(tǒng)的 3 天縮短至 15 分鐘。這種一體化創(chuàng)作模式,徹底改變了以往多工具協(xié)作、多輪修正的低效流程,讓創(chuàng)意快速落地成為可能。

15 秒視頻生成能力的突破,標(biāo)志著 AI 視頻創(chuàng)作從碎片化走向完整敘事,滿足多元場(chǎng)景的內(nèi)容需求。視頻 3.0 模型支持 3-15 秒靈活時(shí)長(zhǎng)設(shè)置,內(nèi)置 Multi-Shot 智能分鏡系統(tǒng),可自動(dòng)理解文本敘事邏輯,輸出多機(jī)位、多鏡頭的連續(xù)畫(huà)面,減少后期剪輯依賴。同時(shí),模型強(qiáng)化主體一致性控制,通過(guò)多圖或視頻作為 “視覺(jué)錨點(diǎn)”,避免角色漂移,音頻方面支持中英日韓西多語(yǔ)言口型匹配,多人場(chǎng)景中可區(qū)分角色發(fā)聲,文字生成清晰度也得到重點(diǎn)優(yōu)化,解決廣告、招牌類內(nèi)容的 “亂碼痛點(diǎn)”。而視頻 3.0 Omni 進(jìn)一步引入視頻主體特征庫(kù),用戶可上傳 3-8 秒素材提取角色外形與音色,實(shí)現(xiàn)跨場(chǎng)景復(fù)用,大幅提升內(nèi)容生產(chǎn)的連貫性與個(gè)性化。

圖片 3.0 系列模型則聚焦靜態(tài)內(nèi)容的質(zhì)感與效率提升,為視頻創(chuàng)作提供高質(zhì)量素材支撐。圖片 3.0 新增組圖生成能力,支持單張或多張輸入圖像批量生成邏輯連貫的系列畫(huà)面,輸出分辨率提升至 2K 與 4K 級(jí)別,適配影視預(yù)演圖、場(chǎng)景設(shè)定等專業(yè)需求。通過(guò)強(qiáng)化學(xué)習(xí)與視覺(jué)思維鏈 vCoT 技術(shù),模型改善細(xì)節(jié)一致性與電影質(zhì)感,降低 AI 痕跡,同時(shí)提升對(duì)構(gòu)圖、視角等元素的控制精度,讓靜態(tài)圖像更符合專業(yè)創(chuàng)作標(biāo)準(zhǔn)。圖片 3.0 Omni 則主打 4K 超清敘事感與批量生成能力,助力創(chuàng)作者快速完成分鏡設(shè)計(jì)、場(chǎng)景搭建等前期工作,為后續(xù)視頻創(chuàng)作奠定堅(jiān)實(shí)基礎(chǔ)。

可靈 AI 3.0 系列模型的推出,不僅是技術(shù)的升級(jí),更是創(chuàng)作生態(tài)的重塑。其 All-in-One 架構(gòu)與全模態(tài)整合能力,打破了專業(yè)影視創(chuàng)作的技術(shù)與資金門(mén)檻,讓普通用戶也能輕松制作高質(zhì)量?jī)?nèi)容,開(kāi)啟 “人人皆可導(dǎo)演” 的新時(shí)代。目前,該技術(shù)已在廣告營(yíng)銷、短視頻創(chuàng)作、影視預(yù)演等領(lǐng)域得到應(yīng)用,幫助用戶降低創(chuàng)作成本、提升產(chǎn)出效率。未來(lái),隨著模型的全量開(kāi)放與持續(xù)優(yōu)化,可靈 AI 有望進(jìn)一步拓展應(yīng)用場(chǎng)景,推動(dòng) AI 內(nèi)容生產(chǎn)向更高效、更專業(yè)、更個(gè)性化的方向發(fā)展,為整個(gè)行業(yè)注入新的活力。
物聯(lián)網(wǎng),讓世界更精彩;
斯邁爾,讓物聯(lián)網(wǎng)更智能!
