久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

2025 年中國多模態大模型行業模型現狀 圖像、視頻、音頻、3D 模型等終將打通和融合

創投圈
2025
06/03
18:00
分享
評論

行業主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等

多模態大模型的模型路徑

多模態大模型的探索正在逐步取得進展,近年來產業聚焦在視覺等重點模態領域突破。理想中的 "Any-to-Any" 大模型,Google Gemini、Codi-2 等均是處于探索階段的方案,其最終技術方案的成熟還需要在各個模態領域的路線跑通,實現多模態知識學習,跨模態信息對齊共享,進而實現理想中多模態大模型。現階段產業主要的工作還是聚焦在視覺等典型的重點模態,試圖將 Transformer 大模型架構進一步在圖像、視頻、3D 模型等模態領域引入使用,完善各個模態領域的感知和生成模型,再進一步實現更多模態之間的跨模態打通和融合。

多模態大模型的圖像模型

早在 2023 年 LLM 的流行之前,過去產業界在對于圖像的理解和生成模型領域已經打下了堅實的基礎,其中也產生了 CLIP、Stable Diffusion、GAN 等典型的模型成果,孕育出了 Midjourney、DALL · E 等成熟的文生圖應用。而更進一步,產業界也在積極探索將 Transformer 大模型引入圖像相關任務領域 ( ViT,Vision Transformer;DiT,Diffusion Transformer ) ,探索統一視覺大模型的建立,以及將 LLM 大語言模型與視覺模型進行更加密切的融合,包括近年來的 GLIP、SAM、GPT-V 都是其中的重點成果。

注:利用真實文本描述,通過 CLIP 生成的圖像特征

多模態大模型的視頻模型

由于視頻本質上是由很多幀的圖像疊加而成,因此本質上語言與視頻模態的融合和語言和圖像具有相當多的互通之處,產業界也在嘗試將圖像生成模型遷移到視頻生成,先基于圖像數據進行訓練,再結合時間維度上的對齊,最終實現文生視頻的效果。其中近年來也產生了 VideoLDM、W.A.L.T. 等典型的成果,并在近期也出現了 Sora 這樣具有明顯突破性效果的模型,其在視頻生成領域沿用了 Diffusion Transformer 架構,并在視頻類場景首次呈現出 " 智能涌現 " 的跡象。

視頻本質上是一系列圖像的連續展示,圖片生成是視頻生成的基礎。圖片生成的主流技術即擴散模型同樣也是視頻生成的主流技術,目前主流的文生視頻模型的技術路線為基于文生圖模型,通過在時間維度加入卷積或注意力,在生成的關鍵幀基礎上實現時序對齊得到視頻。在此基礎上,插幀 + 超分、初始噪聲對齊、基于 LLM 增強描述等方法均有助于增強時序對齊能力,實現更高質量的視頻生成。Zero-shot 領域的一系列研究則能夠實現無需訓練,直接將圖片生成模型轉化為視頻生成模型。

多模態大模型的 3D 模型

實際上 3D 是由 2D+ 空間信息構成,因此類似于由圖像生成到視頻生成的延伸,2D 圖片的生成方法理論上也可以遷移到 3D 中。近年來產業界也在積極探索將圖像領域的 GAN、自回歸、Diffusion、VAE 等骨干模型在 3D 模型生成任務中的擴展,其中也產生了 3D GAN、MeshDiffusion、Instant3D 等重點的模型成果。但相比圖像和視頻生成,目前的 3D 模型生成技術還處于早期發展階段,相關模型的成熟度仍有較大提升空間。

3D 數據表征:包括網格 ( Mesh ) 、點云 ( Point clouds ) 等顯式表示,以及 NeRF ( Neural radiance fields,神經輻射場 ) 等隱式表示,還包括體素 ( Voxel grids,3D 空間中的像素 ) 這類混合表示,其中 NeRF 具有強大的三維表達能力和潛在的廣泛應用范圍,是 3D 數據表征的關鍵技術 ;

3D 數據集:包括 3D 數據 ( 數據量和精度有限 ) 、多視角圖片 ( 用途最為廣泛 ) 、單張圖片 ( 使用仍具有較大難度 ) 等。目前 3D 對象數據集仍然稀缺,代表性的數據集包括 ShapeNet ( Chang 等,2015 ) 構建了 5.1 萬個 3D CAD 模型,為 3D 數據集的充實做出開創貢獻 ;Deitke 等 ( 2023 ) 構建了 Objaverse 和 Objaverse-xl 數據集,分別有 80 萬和 1000 萬個 3D 對象 ;

3D 生成模型:前饋生成 ( 通過前向傳遞中直接生成結果 ) 、基于優化的生成 ( 每次生成需要迭代優化 ) 、程序生成 ( 根據規則創建 3D 模型 ) 、生成式新視圖合成 ( 生成多視角圖像 ) ;

3D 應用:包括 3D 人生成、3D 人臉生成、3D 物體生成、3D 場景生成等應用。

多模態大模型的音頻模型

語音相關的 AI 技術在過去多年中已經較為成熟,但近年來 Transformer 大模型在 AI 音頻領域的投入應用,還是成功推動了相關技術再上臺階,實現更優的音頻理解和生成效果,其中重點的項目成果包括 Whisper large-v3、VALL-E 等。語音技術沿革可分為三階段,深度學習驅動發展加速。語音技術主要向增強泛化能力的方向持續延伸,Transformer 架構引領語音技術迭代浪潮。泛化能力是指模型對于未經訓練的數據的適應能力,技術基礎來自具有強大學習能力的網絡架構和大量多樣化的數據訓練。語音模型泛化能力的增強主要體現在:從覆蓋單一語種到多語種和方言,從處理人聲到自然聲音、音樂,從簡單語音識別或合成到零樣本學習和多任務集成。

Omni 模型是利用 neural audio codec,主要是對音頻進行編碼以實現音頻合成。文本和聲波會先分別進入 embedding 和 adapter 進行編碼,再通過 Omni 模型進行合成和預測音頻的 token,最后通過擴散模型進行訓練,量化再用解碼器合成音頻。

來源:前瞻網

THE END
廣告、內容合作請點擊這里 尋求合作
OpenAI
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3
久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区
黄色精品一二区| 综合欧美一区二区三区| 69精品人人人人| 中文字幕乱码日本亚洲一区二区 | 久草在线在线精品观看| 日韩视频中午一区| 奇米精品一区二区三区在线观看 | 91久久精品一区二区| 亚洲精品第1页| 99精品久久只有精品| 亚洲免费在线观看| 欧美高清性hdvideosex| 看国产成人h片视频| 欧美高清一级片在线观看| 91麻豆精品一区二区三区| 亚洲一区二区三区视频在线| 欧美一级片在线| 国产在线视频一区二区| 久久久精品国产免费观看同学| 国产成人精品亚洲日本在线桃色| 亚洲欧洲在线观看av| 欧美亚洲愉拍一区二区| 国产乱码精品1区2区3区| 日韩美女视频一区二区| 日韩欧美中文一区二区| 成人激情免费电影网址| 性欧美大战久久久久久久久| 国产色爱av资源综合区| 欧美亚洲一区二区在线观看| 久久99国产精品久久| 亚洲在线一区二区三区| 国产视频在线观看一区二区三区| 在线亚洲高清视频| 国产成人在线视频网站| 日韩高清一区在线| 亚洲精品久久久蜜桃| 国产夜色精品一区二区av| 欧美精品久久一区| 色94色欧美sute亚洲线路一久| 久久国内精品自在自线400部| 日韩伦理免费电影| 久久久91精品国产一区二区精品| 欧美片网站yy| 欧美日韩国产在线观看| 欧美手机在线视频| 日本韩国欧美一区二区三区| 不卡视频在线看| 成人深夜福利app| 国产91精品入口| 国产成人免费av在线| 国产精品夜夜嗨| 国产精品99久| www.成人在线| 在线视频欧美精品| 欧美日韩一区不卡| 在线播放91灌醉迷j高跟美女| 欧美日产国产精品| 91麻豆精品国产自产在线| 欧美喷潮久久久xxxxx| 欧美美女bb生活片| 欧美精品在欧美一区二区少妇| 欧美女孩性生活视频| 8v天堂国产在线一区二区| 日韩一级大片在线观看| 国产日韩欧美高清| 亚洲特黄一级片| 日韩va欧美va亚洲va久久| 国产在线视频一区二区| 成人av网站在线观看| 在线欧美日韩国产| 日韩一区二区在线看| 亚洲国产精品黑人久久久| 亚洲欧美日韩电影| 性久久久久久久| 精品伊人久久久久7777人| 国产精品中文字幕一区二区三区| a亚洲天堂av| 91精品国产综合久久婷婷香蕉 | 欧美精品久久99久久在免费线| 日韩亚洲欧美在线观看| 国产婷婷一区二区| 一区二区三区在线观看动漫| 老色鬼精品视频在线观看播放| 成人精品亚洲人成在线| 欧美日韩三级一区二区| 国产午夜精品一区二区三区四区| 一区二区三区在线播放| 国产在线精品视频| 欧美日韩国产综合视频在线观看| 久久久久久久电影| 午夜电影一区二区三区| www.在线成人| 久久奇米777| 日本一道高清亚洲日美韩| 99久久99久久免费精品蜜臀| 2021久久国产精品不只是精品| 一区二区久久久| 国产精品伦一区| 88在线观看91蜜桃国自产| 91精品国产综合久久婷婷香蕉| 国产精品福利影院| 国内精品视频666| 欧美人xxxx| 天天操天天综合网| 欧美一区二区三区免费视频| 欧美日韩亚洲综合一区 | 国产偷国产偷精品高清尤物| 亚洲成av人在线观看| 成人动漫一区二区在线| 欧美电影免费观看完整版| 午夜精品一区二区三区电影天堂 | 国产精品久久久久久久久晋中 | 亚洲免费毛片网站| 国产成人超碰人人澡人人澡| 久久综合九色综合欧美就去吻 | 一个色妞综合视频在线观看| 97精品国产露脸对白| 国产精品美女www爽爽爽| 欧美乱妇15p| 国产亚洲欧美色| 日韩一区二区三区视频在线观看| 亚洲激情图片qvod| 成人免费一区二区三区视频| 日韩一区二区三区视频在线| 欧美日本韩国一区二区三区视频 | 国产91精品精华液一区二区三区| 一区二区三区在线视频观看58| 2024国产精品视频| 日韩欧美亚洲国产另类| 欧美一区二区女人| 欧美成人r级一区二区三区| 亚洲色图都市小说| 亚洲一二三级电影| 免费成人av资源网| 亚洲视频资源在线| av一二三不卡影片| 日本视频中文字幕一区二区三区| 亚洲国产精品传媒在线观看| 中文字幕日韩一区二区| 亚洲免费伊人电影| 午夜视频在线观看一区| 欧美大片在线观看一区二区| 91同城在线观看| 97国产一区二区| 欧美片在线播放| 欧美人妖巨大在线| 99久久综合国产精品| 色久综合一二码| 婷婷中文字幕一区三区| 视频一区欧美精品| 国产精一品亚洲二区在线视频| 欧美日韩综合在线免费观看| 国产日韩欧美精品电影三级在线| 日韩高清不卡在线| 欧美性猛交一区二区三区精品| 国产精品欧美一区二区三区| 国产精品不卡一区二区三区| 激情久久五月天| 国产欧美日韩视频一区二区| 韩国精品久久久| 国产人伦精品一区二区| 国产欧美日韩久久| 欧美激情一区二区三区蜜桃视频| 中文字幕一区二区三区四区不卡 | 国产麻豆成人精品| 日韩va欧美va亚洲va久久| 亚洲一区二区三区四区在线免费观看 | 国产午夜精品一区二区| 欧美大片国产精品| 欧美精品高清视频| 欧美无砖砖区免费| 欧美性xxxxx极品少妇| 欧美丝袜丝nylons| 欧美日韩中文字幕精品| 日本电影欧美片| 欧美三级电影一区| 7777精品伊人久久久大香线蕉经典版下载 | 亚洲欧洲精品一区二区精品久久久| 欧美精品一区视频| 日韩欧美一级在线播放| 26uuu亚洲婷婷狠狠天堂| 久久久一区二区三区捆绑**| 久久女同互慰一区二区三区| 国产三级一区二区| 亚洲少妇30p| 午夜精品久久久久久久久久| 丝袜诱惑制服诱惑色一区在线观看| 亚洲不卡一区二区三区| 免费观看久久久4p| 国产精品一区二区在线播放| 白白色亚洲国产精品| 欧美日韩国产美| 国产婷婷色一区二区三区在线| 亚洲少妇最新在线视频| 日韩电影在线一区二区三区| 国产做a爰片久久毛片| caoporn国产精品| 日韩免费视频一区| 一区二区三区美女视频| 国产高清精品在线|