久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

2025 年中國多模態大模型行業模型現狀 圖像、視頻、音頻、3D 模型等終將打通和融合

創投圈
2025
06/03
18:00
分享
評論

行業主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等

多模態大模型的模型路徑

多模態大模型的探索正在逐步取得進展,近年來產業聚焦在視覺等重點模態領域突破。理想中的 "Any-to-Any" 大模型,Google Gemini、Codi-2 等均是處于探索階段的方案,其最終技術方案的成熟還需要在各個模態領域的路線跑通,實現多模態知識學習,跨模態信息對齊共享,進而實現理想中多模態大模型。現階段產業主要的工作還是聚焦在視覺等典型的重點模態,試圖將 Transformer 大模型架構進一步在圖像、視頻、3D 模型等模態領域引入使用,完善各個模態領域的感知和生成模型,再進一步實現更多模態之間的跨模態打通和融合。

多模態大模型的圖像模型

早在 2023 年 LLM 的流行之前,過去產業界在對于圖像的理解和生成模型領域已經打下了堅實的基礎,其中也產生了 CLIP、Stable Diffusion、GAN 等典型的模型成果,孕育出了 Midjourney、DALL · E 等成熟的文生圖應用。而更進一步,產業界也在積極探索將 Transformer 大模型引入圖像相關任務領域 ( ViT,Vision Transformer;DiT,Diffusion Transformer ) ,探索統一視覺大模型的建立,以及將 LLM 大語言模型與視覺模型進行更加密切的融合,包括近年來的 GLIP、SAM、GPT-V 都是其中的重點成果。

注:利用真實文本描述,通過 CLIP 生成的圖像特征

多模態大模型的視頻模型

由于視頻本質上是由很多幀的圖像疊加而成,因此本質上語言與視頻模態的融合和語言和圖像具有相當多的互通之處,產業界也在嘗試將圖像生成模型遷移到視頻生成,先基于圖像數據進行訓練,再結合時間維度上的對齊,最終實現文生視頻的效果。其中近年來也產生了 VideoLDM、W.A.L.T. 等典型的成果,并在近期也出現了 Sora 這樣具有明顯突破性效果的模型,其在視頻生成領域沿用了 Diffusion Transformer 架構,并在視頻類場景首次呈現出 " 智能涌現 " 的跡象。

視頻本質上是一系列圖像的連續展示,圖片生成是視頻生成的基礎。圖片生成的主流技術即擴散模型同樣也是視頻生成的主流技術,目前主流的文生視頻模型的技術路線為基于文生圖模型,通過在時間維度加入卷積或注意力,在生成的關鍵幀基礎上實現時序對齊得到視頻。在此基礎上,插幀 + 超分、初始噪聲對齊、基于 LLM 增強描述等方法均有助于增強時序對齊能力,實現更高質量的視頻生成。Zero-shot 領域的一系列研究則能夠實現無需訓練,直接將圖片生成模型轉化為視頻生成模型。

多模態大模型的 3D 模型

實際上 3D 是由 2D+ 空間信息構成,因此類似于由圖像生成到視頻生成的延伸,2D 圖片的生成方法理論上也可以遷移到 3D 中。近年來產業界也在積極探索將圖像領域的 GAN、自回歸、Diffusion、VAE 等骨干模型在 3D 模型生成任務中的擴展,其中也產生了 3D GAN、MeshDiffusion、Instant3D 等重點的模型成果。但相比圖像和視頻生成,目前的 3D 模型生成技術還處于早期發展階段,相關模型的成熟度仍有較大提升空間。

3D 數據表征:包括網格 ( Mesh ) 、點云 ( Point clouds ) 等顯式表示,以及 NeRF ( Neural radiance fields,神經輻射場 ) 等隱式表示,還包括體素 ( Voxel grids,3D 空間中的像素 ) 這類混合表示,其中 NeRF 具有強大的三維表達能力和潛在的廣泛應用范圍,是 3D 數據表征的關鍵技術 ;

3D 數據集:包括 3D 數據 ( 數據量和精度有限 ) 、多視角圖片 ( 用途最為廣泛 ) 、單張圖片 ( 使用仍具有較大難度 ) 等。目前 3D 對象數據集仍然稀缺,代表性的數據集包括 ShapeNet ( Chang 等,2015 ) 構建了 5.1 萬個 3D CAD 模型,為 3D 數據集的充實做出開創貢獻 ;Deitke 等 ( 2023 ) 構建了 Objaverse 和 Objaverse-xl 數據集,分別有 80 萬和 1000 萬個 3D 對象 ;

3D 生成模型:前饋生成 ( 通過前向傳遞中直接生成結果 ) 、基于優化的生成 ( 每次生成需要迭代優化 ) 、程序生成 ( 根據規則創建 3D 模型 ) 、生成式新視圖合成 ( 生成多視角圖像 ) ;

3D 應用:包括 3D 人生成、3D 人臉生成、3D 物體生成、3D 場景生成等應用。

多模態大模型的音頻模型

語音相關的 AI 技術在過去多年中已經較為成熟,但近年來 Transformer 大模型在 AI 音頻領域的投入應用,還是成功推動了相關技術再上臺階,實現更優的音頻理解和生成效果,其中重點的項目成果包括 Whisper large-v3、VALL-E 等。語音技術沿革可分為三階段,深度學習驅動發展加速。語音技術主要向增強泛化能力的方向持續延伸,Transformer 架構引領語音技術迭代浪潮。泛化能力是指模型對于未經訓練的數據的適應能力,技術基礎來自具有強大學習能力的網絡架構和大量多樣化的數據訓練。語音模型泛化能力的增強主要體現在:從覆蓋單一語種到多語種和方言,從處理人聲到自然聲音、音樂,從簡單語音識別或合成到零樣本學習和多任務集成。

Omni 模型是利用 neural audio codec,主要是對音頻進行編碼以實現音頻合成。文本和聲波會先分別進入 embedding 和 adapter 進行編碼,再通過 Omni 模型進行合成和預測音頻的 token,最后通過擴散模型進行訓練,量化再用解碼器合成音頻。

來源:前瞻網

THE END
廣告、內容合作請點擊這里 尋求合作
OpenAI
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

相關推薦

1
3
久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区
国产一区高清在线| 欧美美女直播网站| 国产精品一区在线观看乱码 | 日韩欧美一二三| 国产精品久久久久久久久果冻传媒 | 国产三级精品三级| 国产一区二区三区观看| 久久精品人人做人人爽人人| 国产成都精品91一区二区三| 亚洲欧洲www| 日本福利一区二区| 日韩中文字幕麻豆| 国产三级一区二区三区| av在线不卡免费看| 一区二区高清在线| 日韩美女一区二区三区四区| 国产高清成人在线| 又紧又大又爽精品一区二区| 91麻豆精品国产综合久久久久久 | 久久女同互慰一区二区三区| 成人av电影在线网| 亚洲成人手机在线| 国产片一区二区三区| 色婷婷av一区二区三区大白胸| 亚洲福利视频导航| 91精品国产全国免费观看| 国产成人啪免费观看软件 | 免费人成在线不卡| 亚洲国产经典视频| 91精品婷婷国产综合久久性色| 国产精品69久久久久水密桃 | 精品少妇一区二区三区在线播放 | 日韩成人dvd| 国产精品久久久久久久久免费樱桃 | 欧洲精品中文字幕| 国产一区二区看久久| 亚洲午夜影视影院在线观看| 日本一区二区三区四区在线视频| 欧美三级电影在线看| 国产99精品在线观看| 青青草97国产精品免费观看无弹窗版| 国产精品白丝在线| 中文字幕精品在线不卡| 日韩精品专区在线影院重磅| 欧美色爱综合网| 成人sese在线| 懂色av中文一区二区三区| 久久99九九99精品| 日韩成人免费电影| 日韩av一级电影| 日韩国产高清影视| 奇米一区二区三区av| 日韩高清一区在线| 理论电影国产精品| 久久99久久久欧美国产| 麻豆精品久久久| 精品亚洲国产成人av制服丝袜| 丝袜美腿亚洲一区二区图片| 日韩中文字幕亚洲一区二区va在线 | 热久久国产精品| 亚洲成人精品一区二区| 亚洲一区二区三区视频在线播放 | 亚洲日本欧美天堂| 亚洲视频在线观看三级| 亚洲色欲色欲www| 亚洲欧美一区二区三区极速播放 | 亚洲自拍偷拍麻豆| 亚洲成人免费视频| 热久久免费视频| 韩国午夜理伦三级不卡影院| 国产精品综合av一区二区国产馆| 高清日韩电视剧大全免费| aaa国产一区| 欧美一区二区三区的| 日韩免费观看高清完整版| 国产三级精品视频| 亚洲自拍偷拍综合| 国模大尺度一区二区三区| 成人激情小说网站| 欧美三级蜜桃2在线观看| 久久午夜羞羞影院免费观看| 亚洲精品成人在线| 美女一区二区久久| 色综合激情五月| 久久亚洲影视婷婷| 一区二区三区视频在线看| 蜜桃视频一区二区| 色成年激情久久综合| 精品精品国产高清一毛片一天堂| 一区免费观看视频| 国产在线视视频有精品| 欧美亚洲丝袜传媒另类| 亚洲欧洲性图库| 国产激情一区二区三区四区| 欧美日韩一二三| 亚洲欧美日韩电影| 国产成人亚洲精品青草天美| 欧美一区二区精品| 亚洲国产精品尤物yw在线观看| 国产一区二区毛片| 精品国产91久久久久久久妲己| 亚洲大片精品永久免费| 91亚洲精品乱码久久久久久蜜桃| 久久人人超碰精品| 久久99精品国产麻豆婷婷| 欧美视频你懂的| 亚洲男人电影天堂| 91首页免费视频| 中文字幕欧美国产| 国产一区二区三区在线看麻豆| 欧美唯美清纯偷拍| 一区二区三区在线视频播放 | 日韩美一区二区三区| 亚洲h在线观看| 91麻豆精品国产91久久久久久| 一区二区日韩电影| 91久久精品一区二区三区| √…a在线天堂一区| caoporm超碰国产精品| 国产欧美日韩精品一区| 国产91对白在线观看九色| 精品福利av导航| 国产乱淫av一区二区三区| 久久久精品日韩欧美| 不卡一区二区中文字幕| 亚洲男同1069视频| 欧美婷婷六月丁香综合色| 日本伊人精品一区二区三区观看方式| 91精品婷婷国产综合久久竹菊| 日韩影院在线观看| 日韩欧美精品在线| 波多野结衣在线aⅴ中文字幕不卡| 国产精品久久久久久一区二区三区| 99视频有精品| 日本色综合中文字幕| 欧美一级片免费看| 成人永久免费视频| 亚洲一区二区三区四区在线观看| 6080日韩午夜伦伦午夜伦| 国产呦精品一区二区三区网站| 中文字幕精品三区| 欧美日韩国产不卡| 成人一道本在线| 亚洲已满18点击进入久久| 日韩一区二区三区观看| 成人97人人超碰人人99| 秋霞午夜鲁丝一区二区老狼| 中文字幕精品一区| 欧美一级艳片视频免费观看| 暴力调教一区二区三区| 爽爽淫人综合网网站| 国产精品情趣视频| 欧美一卡2卡三卡4卡5免费| 99久久伊人精品| 奇米777欧美一区二区| 亚洲三级小视频| 国产清纯在线一区二区www| 欧美一区二区在线观看| 色美美综合视频| 国产乱人伦偷精品视频不卡| 日日夜夜精品视频免费| 亚洲精品中文字幕在线观看| 久久精品一区二区三区不卡| 欧美久久免费观看| 欧美三区在线视频| 日本久久一区二区三区| 成人免费观看av| 国产一区二区三区免费在线观看| 亚洲h动漫在线| 亚洲国产精品一区二区www | 欧美三级日韩在线| 99精品1区2区| www.亚洲色图| 成人av电影在线观看| 岛国av在线一区| 国产 欧美在线| 国产精品亚洲人在线观看| 国产麻豆视频一区二区| 国产一区福利在线| 国产资源在线一区| 国产99久久久国产精品免费看| 风间由美中文字幕在线看视频国产欧美 | 久久精品久久99精品久久| 午夜精品免费在线观看| 日韩电影免费在线看| 美女mm1313爽爽久久久蜜臀| 蜜桃av一区二区在线观看| 久久99精品国产麻豆不卡| 激情综合色播激情啊| 国产suv一区二区三区88区| 91小视频在线| 欧美亚洲国产一区二区三区| 91精品国产免费| 久久久欧美精品sm网站| 国产精品三级在线观看| 亚洲综合在线视频| 日本欧美一区二区在线观看| 国产成人亚洲精品狼色在线| 在线观看一区不卡| 26uuu亚洲婷婷狠狠天堂|