久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区

Stable Diffusion 3 來了:生成圖片文字終于不亂碼了

人工智能
2024
02/24
17:34
機器之心
分享
評論

來源:機器之心

繼 OpenAI 的 Sora 連續一周霸屏后,昨晚,生成式 AI 頂級技術公司 Stability AI 也放了一個大招 —— Stable Diffusion 3。該公司表示,這是他們最強大的文生圖模型。

與之前的版本相比,Stable Diffusion 3 生成的圖在質量上實現了很大改進,支持多主題提示,文字書寫效果也更好了。以下是一些官方示例:

提示:史詩般的動漫作品,一位巫師在夜晚的山頂上向漆黑的天空施放宇宙咒語,咒語上寫著 "Stable Diffusion 3",由五彩繽紛的能量組成(Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy)

提示:電影照片,教室的桌子上放著一個紅蘋果,黑板上用粉筆寫著 "go big or go home" 的字樣(cinematic photo of a red apple on a table in a classroom, on the blackboard are the words "go big or go home" written in chalk)

提示:一幅畫,畫中宇航員騎著一只穿著蓬蓬裙的豬,撐著一把粉色的傘,豬旁邊的地上有一只戴著高帽的知更鳥,角落里有 "stable diffusion" 的字樣(a painting of an astronaut riding a pig wearing a tutu holding a pink umbrella, on the ground next to the pig is a robin bird wearing a top hat, in the corner are the words "stable diffusion")

提示:黑色背景上變色龍的攝影棚特寫(studio photograph closeup of a chameleon over a black background)

此外,Stability AI 媒體主管也曬出了一些生成效果:

Stability AI 表示,Stable Diffusion 3 是一個模型系列,參數量從 800M 到 8B 不等。這個參數量意味著,它可以在很多便攜式設備上直接跑,大大降低了 AI 大模型的使用門檻。

此外,Stability AI 還透露,他們和 Sora 一樣,在新模型中采用了 diffusion transformer 架構,并在博客中鏈接了 William ( Bill ) Peebles 和謝賽寧合著的 DiT 論文。這篇論文目前的被引量是 201,今年有望大幅增長。

不過,現在,Stable Diffusion 3 還沒有全面開放,權重也沒有公布。團隊提到,他們正在采取一些安全措施,防止不法分子濫用。

該公司首席執行官 Emad Mostaque 在 X 平臺的帖子中提到,在得到反饋并進行改進后,他們會把該模型開源。

很多人可能會好奇,這個 Stable Diffusion 3 和 DALLE 3、Midjourney 比效果如何?有些人做了測試,看起來似乎沒有拉開明顯差距。不過,Stable Diffusion 3 是開源領域的希望。

值得注意的是,在 Stable Diffusion 3 發布的同一時間,外媒還傳出了 Stability AI 旗下圖像生成應用公司 Clipdrop 被收購的消息。總部位于巴黎的 Clipdrop 成立于 2020 年 7 月,使用開源 AI 模型允許用戶生成和編輯照片。在 2023 年 3 月以未披露的金額出售給 Stability AI 之前,它已從 Air Street Capital 籌集了種子投資。當時,Clipdrop 表示它擁有超過 1500 萬用戶。但僅僅一年之后,Stability AI 就將它賣給了美國寫作助理初創公司 Jasper。

有人評價說,Stable Diffusion 3 的發布就是在掩蓋這個消息。和很多 AI 創業公司一樣,Stability AI 面臨的困境在于其以驚人的速度燒錢,但卻沒有明確的盈利途徑。去年年底,該公司還傳出了 CEO 可能被投資者趕下臺的消息,公司本身可能也在尋求賣身。在這樣的背景下,Stability AI 迫切地需要提振投資者信心。

英國媒體評價說,這筆交易標志著 Stability AI 戰略的逆轉。Emad Mostaque 在一份電子郵件聲明中表示,這筆交易將使該公司能夠繼續專注于開發 " 尖端的開放模型 "。在 Stable Diffusion 3 的相關博客中,該公司也強調," 我們對確保生成式人工智能開放、安全和普遍可及的承諾仍然堅定不移。" 目前看來,Stability AI 的前途仍不明朗。

Stable Diffusion 3 背后的技術:Diffusion Transformer+Flow Matching

在博客中,Stability AI 公布了打造 Stable Diffusion 3 的兩項關鍵技術:Diffusion Transformer 和 Flow Matching。

1. Diffusion Transformer

Stable Diffusion 3 使用了類似于 OpenAI Sora 的 Diffusion Transformer 框架,而此前幾代 Stable Diffusion 模型僅依賴于擴散架構。

Diffusion Transformer 是 Sora 研發負責人之一 Bill Peebles 與紐約大學助理教授謝賽寧最初在 2022 年底發布的研究,2023 年 3 月更新第二版。

論文探究了擴散模型中架構選擇的意義,研究表明 U-Net 歸納偏置對擴散模型的性能不是至關重要的,并且可以很容易地用標準設計(如 Transformer)取代。

論文鏈接:https://arxiv.org/pdf/2212.09748.pdf

具體來說,論文提出了一種基于 Transformer 架構的新型擴散模型 DiT,并訓練了潛在擴散模型,用對潛在 patch 進行操作的 Transformer 替換常用的 U-Net 主干網絡。他們通過以 Gflops 衡量的前向傳遞復雜度來分析擴散 Transformer(DiT)的可擴展性,各個型號的 DiT 都取得了不錯的效果。

我們都知道,擴散模型的成功可以歸功于它們的可擴展性、訓練的穩定性和生成采樣的多樣性。在擴散模型的范圍內,所使用的骨干架構存在很大差異,包括基于 CNN 的、基于 Transformer 的、CNN-Transformer 混合,甚至是狀態空間模型。

用于擴展這些模型以支持高分辨率圖像合成的方法也各不相同,現有方法或是增加了訓練的復雜性,或是需要額外的模型,或是犧牲了質量。潛在擴散是實現高分辨率圖像合成的主要方法,但在實踐中無法表現精細細節,影響了采樣質量,限制了其在圖像編輯等應用中的實用性。其他高分辨率圖像合成方法還有級聯超分辨率、多尺度損失、增加多分辨率的輸入和輸出,或利用自調節和適應全新的架構方案。

基于 DiT 的啟發,Stability AI 進一步提出了 Hourglass Diffusion Transformer ( HDiT ) 。這是一種隨像素數量擴展的圖像生成模型,支持直接在像素空間進行高分辨率(如 1024 × 1024)訓練。

這項工作通過改進骨干網絡解決了高分辨率合成問題。Transformer 架構可以擴展到數十億個參數,HDiT 在此基礎上,彌補了卷積 U-Net 的效率和 Transformer 的可擴展性之間的差距,無需使用典型的高分辨率訓練技術即可成功進行訓練。

論文鏈接:https://arxiv.org/pdf/2401.11605.pdf

研究者引入了一種 "pure transformer" 架構,獲得了一種能夠在標準擴散設置中生成百萬像素級高質量圖像的骨干結構。即使在 128 × 128 等低空間分辨率下,這種架構也比 DiT 等常見 Diffusion Transformer 骨干網絡(圖 2)的效率高得多,在生成質量上也具有競爭力。另一方面,與卷積 U-Nets 相比,HDiT 在像素空間高分辨率圖像合成的計算復雜度方面同樣具備競爭力。

2. Flow Matching

使用 Flow Matching 技術的意義則在于提升采樣效率。

深度生成模型能夠對未知數據分布進行估計和采樣。然而,對簡單擴散過程的限制導致采樣概率路徑的空間相當有限,從而導致訓練時間很長,需要采用專門的方法進行高效采樣。在這項工作中,研究者探討了如何建立連續標準化流程的通用確定性框架。

這項究為基于連續歸一化流(CNF)的生成建模引入了一種新范式,實現了以前所未有的規模訓練 CNF。

論文鏈接:https://arxiv.org/pdf/2210.02747.pdf

具體來說,論文提出了 "Flow Matching" 的概念,這是一種基于固定條件概率路徑向量場回歸訓練 CNF 的免模擬方法。Flow Matching 與用于在噪聲和數據樣本之間進行轉換的高斯概率路徑的通用族兼容(通用族將現有的擴散路徑歸納為具體實例)。

研究者發現,使用帶有擴散路徑的 Flow Matching 可以為擴散模型的訓練提供更穩健、更穩定的替代方案。

此外,Flow Matching 還為使用其他非擴散概率路徑訓練 CNF 打開了大門。其中一個特別值得關注的例子是使用最優傳輸(OT)位移插值來定義條件概率路徑。這些路徑比擴散路徑更有效,訓練和采樣速度更快,泛化效果更好。在 ImageNet 上使用 Flow Matching 對 CNF 進行訓練,在似然性和采樣質量方面的性能始終優于其他基于擴散的方法,并且可以使用現成的數值 ODE 求解器快速、可靠地生成采樣。

THE END
廣告、內容合作請點擊這里 尋求合作
ai
免責聲明:本文系轉載,版權歸原作者所有;旨在傳遞信息,不代表砍柴網的觀點和立場。

相關熱點

9 月 17 日消息,紐約郵報 9 月 12 日發布博文,報道稱在印度航空 AI171 航班空難造成 241 人遇難后,兩位印度工程師推出“重生計劃”(Project REBIRTH)原型機,號稱是全球首個 AI 驅動的飛機墜機生存系...
業界
9月16日,脈脈最新發布的《2025年AI人才流動報告》顯示,今年1-7月,平臺AI新發崗位量同比增長超10倍,簡歷投遞量同比增長11倍。
業界
北京時間9月16日,彭博社周一發文稱,一度隱退的阿里創始人馬云“強勢回歸”,在公司戰略決策中的作用越來越大。
業界
北京時間9月10日,據科技網站TheVerge報道,蘋果備受期待的秋季發布會帶來了關于AirPods、Apple Watch、iPhone等多項硬件的更新消息。
業界
9 月 7 日消息,上月初,彭博社曾報道蘋果正在開發一款自研生成式 AI 搜索產品,并為此組建了全新的“答案、知識與信息”團隊。
業界

相關推薦

1
3
久久精品国产亚洲5555_亚洲人成亚洲人成在线观看图片 _亚洲.国产.中文慕字在线_久久精品免费电影_奇米影视7777精品一区二区_91精品免费观看_www.亚洲人_欧美一区二区三区免费_91精品国产91久久久久_eeuss影院一区二区三区
欧美日本韩国一区二区三区视频 | 国产精品理论片在线观看| 亚洲主播在线播放| 亚洲在线成人精品| 日韩一级片在线观看| 国产在线国偷精品产拍免费yy| 91免费看`日韩一区二区| 亚洲午夜成aⅴ人片| 欧美大片在线观看一区二区| 精品在线免费视频| 夜夜嗨av一区二区三区中文字幕| 亚洲444eee在线观看| 8x福利精品第一导航| 一本在线高清不卡dvd| 婷婷丁香激情综合| 亚洲女厕所小便bbb| 国产午夜精品久久| 日本韩国欧美一区| 99热精品国产| 99久久精品免费| 国产露脸91国语对白| 精品国产一区二区三区四区四| 一区二区在线免费| 中文字幕av免费专区久久| 精品理论电影在线观看| 欧美美女直播网站| 久久视频一区二区| 精品国产伦一区二区三区观看方式 | 成人激情校园春色| 成人综合婷婷国产精品久久| 国内精品免费**视频| 成人精品gif动图一区| 欧美色窝79yyyycom| 欧美一级片免费看| 中文字幕亚洲一区二区va在线| 精品播放一区二区| 亚洲另类在线视频| 日本亚洲一区二区| 在线观看网站黄不卡| 日韩欧美亚洲国产精品字幕久久久| 国产日韩欧美精品电影三级在线| 中文字幕制服丝袜一区二区三区 | 久久色中文字幕| 蜜臀av一区二区在线观看| 99久久精品免费精品国产| 精品剧情v国产在线观看在线| 国产精品三级视频| 国内精品写真在线观看 | 亚洲国产成人高清精品| 麻豆精品在线播放| 欧美猛男男办公室激情| 国产日韩欧美精品一区| 奇米影视7777精品一区二区| 欧美四级电影网| 亚洲影院久久精品| 91浏览器打开| 在线观看亚洲一区| 一区二区久久久| 91丨九色丨尤物| 亚洲男同1069视频| 成人a区在线观看| 一区二区三区加勒比av| 色综合久久九月婷婷色综合| 欧美伊人久久大香线蕉综合69| 99国产精品久久久久| 中文字幕av一区 二区| 欧美日韩色综合| 狠狠色丁香婷综合久久| 精品av久久707| av成人免费在线| 蜜臀99久久精品久久久久久软件| 亚洲精品一区二区三区蜜桃下载 | 欧美精品一区二区三区蜜臀| 国产精品中文字幕一区二区三区| 日韩欧美区一区二| 色婷婷综合久久久久中文一区二区 | 亚洲h动漫在线| 久久久久久久久久久久久女国产乱| 国产精品一区二区久久不卡| 午夜精品福利视频网站| 在线观看亚洲一区| 中文字幕一区日韩精品欧美| 日韩欧美一级精品久久| 色综合一个色综合| 国产91富婆露脸刺激对白| 免费在线视频一区| 国产福利精品一区| 成人小视频在线| 自拍偷拍国产精品| 亚洲国产成人av好男人在线观看| 亚洲一区二区欧美激情| 日韩av在线播放中文字幕| 欧美一级黄色录像| 成人在线一区二区三区| 成人免费毛片片v| www.久久久久久久久| 欧美日韩精品欧美日韩精品| 精品视频在线免费看| 欧美另类久久久品| 国产网站一区二区| 天天色天天爱天天射综合| 久久99日本精品| 亚洲国产精品久久久男人的天堂| 久久www免费人成看片高清| 色一情一乱一乱一91av| 日韩午夜精品电影| 国产精品免费视频一区| 视频一区国产视频| 成人国产免费视频| www.成人在线| 中文字幕一区视频| 国产精品一二三在| 久久久亚洲高清| 秋霞午夜鲁丝一区二区老狼| 欧美日韩国产综合视频在线观看| 国产视频一区在线观看 | 99精品在线观看视频| 成人精品国产一区二区4080| 精品视频在线视频| 亚洲欧美成人一区二区三区| 美女视频黄 久久| 91麻豆精品国产91久久久使用方法 | 欧美在线你懂的| 欧美一级免费大片| 亚洲精品一二三四区| 色国产综合视频| 亚洲国产色一区| 国产亚洲美州欧州综合国| 99精品一区二区| 成人综合在线视频| 7777精品伊人久久久大香线蕉完整版 | 在线观看91精品国产入口| 国产成人在线观看| 久久久久久久国产精品影院| 日韩成人免费看| 在线观看日韩av先锋影音电影院| 国产精品网站导航| 欧美日韩国产精品自在自线| 麻豆精品久久久| 亚洲女人的天堂| 国产午夜精品一区二区三区嫩草 | 色婷婷精品大在线视频| 国产精品视频第一区| 欧美少妇一区二区| 不卡免费追剧大全电视剧网站| 亚洲成人你懂的| 欧美中文字幕一区| 日本不卡的三区四区五区| 亚洲精品视频观看| 国产精品久久久久久亚洲毛片 | 国产精品无遮挡| 国产午夜精品一区二区三区嫩草 | 亚洲一二三四在线| 中文字幕制服丝袜成人av | 日本一区免费视频| 91精品一区二区三区在线观看| 欧美日本一区二区三区| 精品奇米国产一区二区三区| 91精品欧美综合在线观看最新| 欧美综合一区二区| 日本不卡的三区四区五区| 三级在线观看一区二区| 国产精品一区二区久久不卡| 色综合网站在线| 日韩午夜三级在线| 亚洲人成亚洲人成在线观看图片| 亚洲图片有声小说| 国产精品99久久久久久有的能看| 国产精品一卡二| 日韩三级中文字幕| 亚洲黄一区二区三区| 麻豆久久一区二区| 欧美老肥妇做.爰bbww| 亚洲国产精品成人综合| 亚洲欧美一区二区在线观看| 日本一不卡视频| 欧美日韩免费观看一区三区| 久久久精品天堂| 国产成人精品在线看| 国产日产欧产精品推荐色| 国产在线日韩欧美| 精品毛片乱码1区2区3区| 国产精品一线二线三线精华| 精品国产乱码久久久久久牛牛| 亚洲福利视频一区二区| 色94色欧美sute亚洲13| 亚洲午夜国产一区99re久久| 成人18精品视频| 亚洲国产婷婷综合在线精品| 亚洲伊人色欲综合网| 国产一区二区三区免费看| 91精品国产欧美一区二区成人| 亚洲欧美日韩中文播放 | 精品99999| 99热99精品| 蜜臀av性久久久久蜜臀aⅴ| 欧美成人性福生活免费看| 国产乱色国产精品免费视频| 日产国产欧美视频一区精品| 国产精品久久三|