可靈AI數(shù)字人來了支持情緒與動作控制、輕松打造“有靈魂”的數(shù)字角色

每日快訊

2025

09/19

20:56

評論

近日，可靈AI數(shù)字人正式亮相，憑借領(lǐng)先的口型精準度、情緒動作演繹和跨風(fēng)格泛化能力，重新定義了數(shù)字人技術(shù)的行業(yè)標(biāo)桿。用戶僅需上傳一張角色圖片、輸入角色表達內(nèi)容或一段音頻，就能生成最長1分鐘、極具表現(xiàn)力的數(shù)字人視頻，而且支持多類角色及中英日韓多語種，最低價格僅0.12元每秒，廣泛適用于廣告、電商、娛樂、媒體、教育等眾多場景。目前產(chǎn)品公測陸續(xù)開放中。

極簡輸入、高質(zhì)輸出：一張圖實現(xiàn)分鐘級數(shù)字人生成

可靈AI數(shù)字人極大降低了行業(yè)的制作門檻，用戶只需提供一張角色圖（支持寫實人物、動漫、動物等多種角色），輸入一段文字或音頻，即可一鍵生成最高達1080p分辨率、48FPS高幀率的高質(zhì)量數(shù)字人視頻。

該功能可支持生成最長達1分鐘的數(shù)字人視頻，可輕松滿足產(chǎn)品講解、新聞播報、在線教育等多種場景需求，結(jié)合會員優(yōu)惠最低價僅0.12元/秒（標(biāo)準價格：高品質(zhì)模式8靈感值/秒，標(biāo)準模式4靈感值/秒），讓高品質(zhì)數(shù)字人技術(shù)不再是少數(shù)專業(yè)機構(gòu)的專利，真正賦能廣大內(nèi)容創(chuàng)作者與中小企業(yè)。

此外，為了實現(xiàn)“開箱即用”的便捷體驗，可靈AI還提供了一站式解決方案。既支持用戶上傳自有素材，也可以使用內(nèi)置的官方形象庫、AI生圖功能以及近百種TTS音色，輕松完成從角色創(chuàng)建到配音的全流程。

角色演繹“神形兼?zhèn)?rdquo;

在數(shù)字人的核心能力——“表現(xiàn)力”上，可靈AI展示了其深厚的技術(shù)功底，不再滿足于同類產(chǎn)品簡單的音畫同步，而是追求角色“神形兼?zhèn)?rdquo;的生動演繹。

（可靈AI數(shù)字人視頻截圖）

在對口型這一基礎(chǔ)指標(biāo)上，可靈AI數(shù)字人展現(xiàn)出了業(yè)界領(lǐng)先的精準度。實測案例中，一位女歌手正演唱英文歌曲，其唇形與快速變化的歌詞音節(jié)完美貼合，復(fù)雜口型也表現(xiàn)出色。而根據(jù)提示詞“眼神專注自信地唱歌”，數(shù)字角色更呈現(xiàn)出自信的眼神、持麥的自然姿態(tài)，以及與觀眾互動的微笑，生動還原了歌手在舞臺上的表演狀態(tài)。

同時，憑借可靈視頻模型的強大能力，可靈AI數(shù)字人展現(xiàn)出優(yōu)秀的泛化性能，無論是寫實人物、動漫卡通、動物形象，皆可生成高質(zhì)量數(shù)字人視頻。在卡通貓咪唱英文Rap的案例中，可靈AI精準地捕捉音頻節(jié)奏，生成了一只一邊說唱、一邊隨節(jié)奏自然搖擺身體的“Rapper貓”，跨越不同角色風(fēng)格界限，賦予角色生命力。

提示詞驅(qū)動角色表演情緒與動作精細可控

區(qū)別于僅“動嘴皮”的數(shù)字人，可靈AI數(shù)字人還帶來了對情緒的深刻理解與表達，而且可通過提示詞精細化控制角色情緒與肢體語言，實現(xiàn)“有靈魂的表演”。

（可靈AI數(shù)字人視頻截圖）

在這個表現(xiàn)“憤怒”情緒的案例中，根據(jù)音頻內(nèi)容和提示詞“內(nèi)心全是氣憤，非常生氣”。模型精準地將這種抽象情緒轉(zhuǎn)化為具體的面部微表情——緊鎖的眉頭、緊抿的嘴唇和充滿壓迫感的眼神，將角色的內(nèi)心怒火展現(xiàn)得淋漓盡致。

基于可靈AI視頻模型，依托多模態(tài)理解大模型與視頻生成模型的深度融合，可靈AI數(shù)字人突破傳統(tǒng)音畫同步的表淺擬合，首次實現(xiàn)從「聽聲音」到「懂意圖」的跨越。在口型準確度已達行業(yè)領(lǐng)先的基礎(chǔ)上，可精準解析輸入的語音、圖像和提示詞，對長視頻中數(shù)字人情緒、動作與運鏡作出精準規(guī)劃，確保生成內(nèi)容緊密呼應(yīng)敘事意圖與情感脈絡(luò)，真正完成從對口型到情節(jié)演繹的升級。

技術(shù)驅(qū)動打造數(shù)字人行業(yè)標(biāo)桿

可靈AI數(shù)字人的卓越表現(xiàn)，得益于其背后多模態(tài)理解大模型與視頻生成模型的深度融合。通過音畫高度對齊的交叉注意力機制、強化口型的訓(xùn)練策略以及精細化的數(shù)據(jù)處理，實現(xiàn)了語音與唇形的精準同步，即使面對多語種、歌唱或極快語速的臺詞，仍能保證唇形與發(fā)音嚴絲合縫。而采用關(guān)鍵幀控制的架構(gòu)，模型先構(gòu)建高層次敘事骨架，再并行生成多個片段的數(shù)字人視頻，可在保持身份一致的前提下，實現(xiàn)無限長度視頻生成。

專業(yè)測試中，可靈AI數(shù)字人與行業(yè)知名產(chǎn)品Heygen及即夢數(shù)字人（Omnihuman-1方案）進行了效果對比。結(jié)果顯示，可靈 AI 數(shù)字人在整體效果及多個細分維度上均表現(xiàn)優(yōu)異，與即夢數(shù)字人（Omnihuman-1 方案）對比的整體 GSB 得分達到 2.39，與 Heygen 對比的整體 GSB 得分達到 1.37，位居行業(yè)領(lǐng)先。

* GSB 指標(biāo)用于衡量群體意見的一致性和正負傾向，GSB 值越大，說明模型優(yōu)勢越大

* 評測時間：Heygen于2025.08.25評測；即夢于2025.07.22評測。

可靈AI作為全球領(lǐng)先的視頻生成大模型，自2024年6月發(fā)布以來已完成超30次迭代，用戶規(guī)模突破4500萬，生成視頻數(shù)量超2億，為超過2萬家企業(yè)提供API服務(wù)，覆蓋廣告、影視、游戲等多個領(lǐng)域。隨著可靈AI數(shù)字人的推出，將進一步降低行業(yè)創(chuàng)作門檻、提升制作標(biāo)準，推動其在短視頻、電商直播、在線教育、企業(yè)服務(wù)等領(lǐng)域的規(guī)模化應(yīng)用。

THE END

廣告、內(nèi)容合作請點擊這里尋求合作

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點和立場。

久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

可靈AI數(shù)字人來了支持情緒與動作控制、輕松打造“有靈魂”的數(shù)字角色

相關(guān)熱點

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產(chǎn) Apple Car 汽車電池

關(guān)注我們

久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

可靈AI數(shù)字人來了 支持情緒與動作控制、輕松打造“有靈魂”的數(shù)字角色

相關(guān)熱點

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產(chǎn) Apple Car 汽車電池

關(guān)注我們

可靈AI數(shù)字人來了支持情緒與動作控制、輕松打造“有靈魂”的數(shù)字角色