可靈 AI 3.0 重磅發(fā)布！全模態(tài)整合重塑創(chuàng)作生產(chǎn)力，最長(zhǎng) 15 秒視頻生成開(kāi)啟全民導(dǎo)演時(shí)代

可靈 AI 3.0 發(fā)布！全模態(tài)整合，最長(zhǎng) 15 秒視頻生成重塑創(chuàng)作生態(tài)
——KEEP SMILE ~ KEEP ADVANCING——

2026-02-12 09:00:00深圳市斯邁爾電子有限公司208

#可靈 AI3.0 全模態(tài)升級(jí) #15 秒視頻生成黑科技 #多模態(tài)創(chuàng)作引擎 #AI 賦能內(nèi)容生產(chǎn)2026 年 2 月，可靈 AI 正式推出 3.0 系列多模態(tài)模型，首次實(shí)現(xiàn)文本、圖像、音頻、視頻全模態(tài)輸入輸出的一體化整合，最長(zhǎng)支持 15 秒視頻生成，以 All-in-One 架構(gòu)重構(gòu) AI 創(chuàng)作流程，讓 “一人劇組” 從概念走向現(xiàn)實(shí)，百度搜索量單日激增 2100%，成為 AI 內(nèi)容生產(chǎn)領(lǐng)域的現(xiàn)象級(jí)突破。該系列包含視頻 3.0、視頻 3.0 Omni、圖片 3.0 及圖片 3.0 Omni 四大核心模型，覆蓋從前期分鏡到后期合成的全鏈路創(chuàng)作，目前已向黑金會(huì)員開(kāi)放，預(yù)計(jì)短期內(nèi)全量上線，為專業(yè)創(chuàng)作者與普通用戶帶來(lái)創(chuàng)作效率的革命性提升。

斯邁爾條碼

全模態(tài)輸入輸出的深度整合，讓創(chuàng)作擺脫工具切換的繁瑣，實(shí)現(xiàn) “端到端” 的高效生產(chǎn)。創(chuàng)作者可同時(shí)上傳文本腳本、參考圖像、配音音頻及視頻片段，模型通過(guò)統(tǒng)一架構(gòu)無(wú)縫銜接理解、生成、編輯三大環(huán)節(jié)，直接輸出具備專業(yè)質(zhì)感的影像內(nèi)容。例如，廣告從業(yè)者只需輸入產(chǎn)品文案、品牌 LOGO 圖像、宣傳音頻及 3 秒產(chǎn)品演示片段，模型就能自動(dòng)生成 15 秒完整廣告視頻，包含智能分鏡、角色口型匹配、文字信息清晰呈現(xiàn)等專業(yè)效果，全程無(wú)需額外工具輔助，創(chuàng)作周期從傳統(tǒng)的 3 天縮短至 15 分鐘。這種一體化創(chuàng)作模式，徹底改變了以往多工具協(xié)作、多輪修正的低效流程，讓創(chuàng)意快速落地成為可能。

可靈 AI3.0 全模態(tài)升級(jí)

15 秒視頻生成能力的突破，標(biāo)志著 AI 視頻創(chuàng)作從碎片化走向完整敘事，滿足多元場(chǎng)景的內(nèi)容需求。視頻 3.0 模型支持 3-15 秒靈活時(shí)長(zhǎng)設(shè)置，內(nèi)置 Multi-Shot 智能分鏡系統(tǒng)，可自動(dòng)理解文本敘事邏輯，輸出多機(jī)位、多鏡頭的連續(xù)畫(huà)面，減少后期剪輯依賴。同時(shí)，模型強(qiáng)化主體一致性控制，通過(guò)多圖或視頻作為 “視覺(jué)錨點(diǎn)”，避免角色漂移，音頻方面支持中英日韓西多語(yǔ)言口型匹配，多人場(chǎng)景中可區(qū)分角色發(fā)聲，文字生成清晰度也得到重點(diǎn)優(yōu)化，解決廣告、招牌類內(nèi)容的 “亂碼痛點(diǎn)”。而視頻 3.0 Omni 進(jìn)一步引入視頻主體特征庫(kù)，用戶可上傳 3-8 秒素材提取角色外形與音色，實(shí)現(xiàn)跨場(chǎng)景復(fù)用，大幅提升內(nèi)容生產(chǎn)的連貫性與個(gè)性化。

15 秒視頻生成黑科技

圖片 3.0 系列模型則聚焦靜態(tài)內(nèi)容的質(zhì)感與效率提升，為視頻創(chuàng)作提供高質(zhì)量素材支撐。圖片 3.0 新增組圖生成能力，支持單張或多張輸入圖像批量生成邏輯連貫的系列畫(huà)面，輸出分辨率提升至 2K 與 4K 級(jí)別，適配影視預(yù)演圖、場(chǎng)景設(shè)定等專業(yè)需求。通過(guò)強(qiáng)化學(xué)習(xí)與視覺(jué)思維鏈 vCoT 技術(shù)，模型改善細(xì)節(jié)一致性與電影質(zhì)感，降低 AI 痕跡，同時(shí)提升對(duì)構(gòu)圖、視角等元素的控制精度，讓靜態(tài)圖像更符合專業(yè)創(chuàng)作標(biāo)準(zhǔn)。圖片 3.0 Omni 則主打 4K 超清敘事感與批量生成能力，助力創(chuàng)作者快速完成分鏡設(shè)計(jì)、場(chǎng)景搭建等前期工作，為后續(xù)視頻創(chuàng)作奠定堅(jiān)實(shí)基礎(chǔ)。

多模態(tài)創(chuàng)作引擎

可靈 AI 3.0 系列模型的推出，不僅是技術(shù)的升級(jí)，更是創(chuàng)作生態(tài)的重塑。其 All-in-One 架構(gòu)與全模態(tài)整合能力，打破了專業(yè)影視創(chuàng)作的技術(shù)與資金門(mén)檻，讓普通用戶也能輕松制作高質(zhì)量?jī)?nèi)容，開(kāi)啟 “人人皆可導(dǎo)演” 的新時(shí)代。目前，該技術(shù)已在廣告營(yíng)銷、短視頻創(chuàng)作、影視預(yù)演等領(lǐng)域得到應(yīng)用，幫助用戶降低創(chuàng)作成本、提升產(chǎn)出效率。未來(lái)，隨著模型的全量開(kāi)放與持續(xù)優(yōu)化，可靈 AI 有望進(jìn)一步拓展應(yīng)用場(chǎng)景，推動(dòng) AI 內(nèi)容生產(chǎn)向更高效、更專業(yè)、更個(gè)性化的方向發(fā)展，為整個(gè)行業(yè)注入新的活力。

物聯(lián)網(wǎng)，讓世界更精彩；

斯邁爾，讓物聯(lián)網(wǎng)更智能！