與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35億+66億雙模型,AI圖像生成飛躍式進步 全球播報
新智元報道??
編輯:編輯部
【新智元導(dǎo)讀】雖然此前CEO曾陷入種種爭議,但依然不影響Stability AI登上時代雜志。近日,該公司又發(fā)布了Stable Diffusion 的XL 0.9版本,35億+66億雙模型,搭載最大OpenCLIP,讓AI生圖質(zhì)量又有了新的飛躍。
(資料圖)
Stable Diffusion又雙叒升級了!
最近,Stability AI發(fā)布了最新版的Stable Diffusion XL 0.9(SDXL 0.9)。
比起之前的模型,這波更新在圖像和構(gòu)圖細節(jié)上,都有了質(zhì)的飛躍。
尤其是在參數(shù)上,這次的SDXL0.9具有35億參數(shù)基礎(chǔ)模型和66億參數(shù)模型的集成管線。相比之下,Beta測試版僅用了單個31億參數(shù)的模型。
為了生成更逼真的圖像,以及更大的深度和更高的分辨率(1024x1024),SDXL 0.9使用了兩個CLIP模型,包括迄今為止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。
不僅如此,SDXL 0.9在消費級顯卡上就能運行。只需要Win10/11或Linux操作系統(tǒng)、16GB內(nèi)存,以及具有8GB以上顯存的英偉達RTX 20系顯卡即可。
SDXL 0.9和SDXL Beta的差異究竟有多大?
咱們看圖說話。
實測效果
下面就來看看新版的SDXL 0.9,在圖片細節(jié)上有什么不一樣吧~
Prompt:外星人在拉斯維加斯漫步
SDXL Beta版
SDXL 0.9
Prompt:優(yōu)勝美地國家公園的一只狼
Negative prompt:3d渲染,光滑,塑料,模糊,顆粒感,低分辨率,動漫,過度飽和
SDXL Beta版
SDXL 0.9
Prompt:手舉咖啡
Negative prompt:3d渲染,光滑,塑料,模糊,顆粒狀,低分辨率,動漫
SDXL Beta版
SDXL 0.9
官方表示,SDXL系列還會提供一系列超越基本文本prompt的功能。
包括圖像對圖像的prompt(輸入一個圖像以獲得該圖像的變化)、內(nèi)畫(重建圖像的缺失部分)和外畫(構(gòu)建一個現(xiàn)有圖像的無縫擴展)。
SDXL 0.9在兩個CLIP模型上運行,包括迄今為止訓(xùn)練的最大的OpenCLIP模型之一(OpenCLIP ViT-G/14),這增強了0.9的處理能力和創(chuàng)造具有更大深度和1024x1024更高分辨率的逼真圖像的能力。
SDXL團隊不久將發(fā)布一個研究博客,更詳細地介紹這個模型的規(guī)格和測試。
榮登Time最具影響力公司
就在最近,Stability AI被時代雜志選為100家最有影響力的公司之一。
對于Stability AI,時代雜志是這樣介紹的——
如果你能用文字描述,Stability AI可以將其轉(zhuǎn)化為圖片。
Stable Diffusion是該公司幫助訓(xùn)練的免費開源文本到圖像生成器,在8月份推出后,它改變了世界對于AI潛力的理解。
然而,Stability AI很快陷入了種種爭議,包括如何訓(xùn)練這些工具,以及從互聯(lián)網(wǎng)上獲取數(shù)據(jù)的版權(quán)訴訟之中。
盡管如此,該公司表示,在推出Stable Diffusion 2.0的一個月內(nèi),App Store TOP 10應(yīng)用中的4個,背后都是這個模型。
而公司CEO Emad Mostaque也被報道經(jīng)??浯蠊镜谋憩F(xiàn),此前他曾聲稱:Stability AI「真正的開源」為「突破」鋪平了道路。
SDXL Beta
實際上,SDXL的Beta版本也沒發(fā)布多久,可見作圖這一塊的版本迭代真的是日新月異。
當(dāng)時,StabilityAI就表示,Stable Diffusion XL并不是最終發(fā)布版的名字,并且也并非是v3,因為SD-XL的架構(gòu)和SD-v2系列的模型架構(gòu)非常相似。
下面幾張SD-XL官方發(fā)布的例圖,可以看出圖像的質(zhì)量已經(jīng)非常能打了。
SD-XL相比之前版本的改進如下:
使用較短的描述性prompt即可生成高質(zhì)量圖像
可以生成更貼合prompt的圖像
圖像中的人體結(jié)構(gòu)更合理
與 v2.1和 v1.5版本(程度較輕)相比,SD-XL生成的圖片更符合大眾審美
負面提示詞(negative prompt)是可選項
生成的肖像圖更逼真
圖像中的文本更清晰
清晰可讀的文字
在v1系列和v2.1版本的Stable Diffusion模型中,并不具備在圖片中生成可讀文本的能力。
雖然SD-XL生成的文本信息并不總是準確,但確實得到了巨大的提升。
一個年輕的女性舉著一個牌子,上面寫著「Stable Diffusion」,頭發(fā)高亮,坐在餐廳外面,棕色的眼睛,穿著裙子,側(cè)燈
更好的人體結(jié)構(gòu)
Stable Diffusion在生成人體解剖結(jié)構(gòu)方面一直存在諸多問題,多幾條腿、少個胳膊實在是太常見不過的問題。
比如說SD-v1.5生成瑜伽的圖像,經(jīng)常會出現(xiàn)扭曲的人體。
而SD-XL雖然生成的圖像并不完美,不過在人體姿態(tài)方面已經(jīng)有了顯著的進步。
更有美感(more aesthetic)
比如同樣以屋子為主題,SD-XL可以生成更對稱、視覺效果更好的照片。
SD-XL在肖像照片上也有顯著改進。
一個女人的照片
參考資料:
https://stability.ai/blog/sdxl-09-stable-diffusion
關(guān)鍵詞:
您可能也感興趣:
今日熱點
為您推薦
注意避雨!深圳24-25日有雷陣雨,局地暴雨風(fēng)險較高
烏情報局長稱俄方在扎波羅熱核電站埋地雷,俄烏曾屢次互指“反人類”
全球今亮點!榆林首次試驗在沙區(qū)飛播喬木樹種
排行
- 熱點!工信部:強化平臺設(shè)施建設(shè),遴選跨行業(yè)跨領(lǐng)域綜合型等...
- 兩部門印發(fā)辦法明確 消防員面向社會公開招錄
- 低價出售410萬旅客信息?12306回應(yīng):為第三方泄漏
- 2019年這些新規(guī)將落地 又一次普惠“加薪”
- 北京8家醫(yī)院試點將推錯峰就診 率先開展“治堵”
- 數(shù)字化的城商行們怎么樣了?數(shù)字化轉(zhuǎn)型背后的故事
- 四川省稅務(wù)系統(tǒng)將推出10大類舉措服務(wù)納稅人、繳費人
- 長三角禁限塑新規(guī)實施尚存3個堵點 仍需多方合力推進
- 中國鐵建高溢價溫州奪地 去年毛利率低于行業(yè)約10個百分點
- 推行郵件快件包裝“綠色革命” 從根源上解決問題
最近更新
- 與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35...
- 【一級建造師】海南省2023年度一級建造師資格考試報名資格核...
- 【一級建造師】安徽考區(qū)2023年度一級建造師資格考試答題方式_...
- 國際移民組織官員:意大利海域發(fā)生移民船沉沒事故 或有40人...
- 美國將要求大貨車大客車配備自動剎車系統(tǒng)
- 這份心理調(diào)適指南,送給高考后的你們
- 杜康:黃金1917空單進場,歐盤繼續(xù)看跌!
- 【天天新視野】BNANA幣全面介紹
- 磁粉商品報價動態(tài)(2023-06-23)
- 【鄉(xiāng)村振興新農(nóng)人】尤兵:優(yōu)化種養(yǎng)殖結(jié)構(gòu) 念活“生態(tài)循環(huán)經(jīng)...
- 西餐主食一般有哪幾種
- 陰離子交換樹脂商品報價動態(tài)(2023-06-23)_全球快訊
- 法拉第未來賈躍亭發(fā)文承諾全力解決融資瓶頸問題,F(xiàn)F 91 2.0...
- 粒堿商品報價動態(tài)(2023-06-23)
- 【全球獨家】3999元辦公本市場戰(zhàn)況膠灼:惠普星14 Pro跟進,...
- 北京觀象臺連續(xù)兩天氣溫超40℃,專家解析為何北京這么熱?
- 全球通訊!殊觀(關(guān)于殊觀介紹)
- 狂虎帝技能(狂虎帝覺醒)
- 周鴻祎談高考志愿:優(yōu)先看專業(yè) 比好大學(xué)更重要 今日最新
- 世界今熱點:加拿大出臺《在線新聞法》 強制數(shù)字平臺付費使...
- 暴雨藍色預(yù)警!湘南地區(qū)注意防范
- 奔馳發(fā)布了一臺諾基亞
- 高考和中考結(jié)束了,孩子抑郁癥也好了?是不是可以停藥了?家...
- 天天信息:79個觀眾,首日票房僅3982元,端午檔最慘新片誕生了
- 西藏養(yǎng)老金調(diào)整最新消息公布了嗎(2022~2023年西藏養(yǎng)老金調(diào)整...
- 速讀:齊魯山水文脈深 花式露營玩法新
- 浙江湖州:粽葉飄香迎端午 環(huán)球觀速訊
- 巨蟹勿拐彎抹角 射手要注意小人 環(huán)球快資訊
- 環(huán)球熱頭條丨遼寧營口一鋼鐵廠發(fā)生燙傷事故,造成4人死亡5人受傷
- 2023年端午檔票房突破5億
今日要聞
- 天天信息:79個觀眾,首日票房僅3982元,端午檔最慘新片誕生了
- 與Midjourney開戰(zhàn)!Stable Diffusion XL 0.9重磅發(fā)布,35億+66億雙模型,AI圖像生成飛躍式進步 全球播報
- 狂虎帝技能(狂虎帝覺醒)
- 西藏養(yǎng)老金調(diào)整最新消息公布了嗎(2022~2023年西藏養(yǎng)老金調(diào)整方案細則全文)
- U17亞洲杯小組賽今晚收官 中國隊背水一戰(zhàn) 全球微頭條
- 618結(jié)束后下一個活動是什么_世界消息
- 焦點快報!介紹幾本好看的都市言情小說吧_推薦3部都市言情
- 存款異地騰挪賺息差 當(dāng)前速讀
- 環(huán)球快訊:畢業(yè)典禮上火出圈的他,還有一個身份
- 全球最資訊丨三句半服裝造型_三句半服裝及全套道具