不圓 發自 凹非寺
量子位 | 公眾號 QbitAI
AI生圖,但是沒有AI味,可能么?
一款全新、可編輯、照片級的AI生圖模型FLUX.1 Krea [dev]現已發布,可在Krea Edit上免費試用。
![]()
官方介紹該模型“沒有AI感,沒有過曝的高光,只有自然細節。”
主打一個真實。
![]()
新模型是Krea 1的開源權重版本,它被訓練的目標是生成更真實、更多樣化的圖像,這些圖像不包含文生圖生成中常見的過度飽和紋理。
我們實測了這款模型,看看下面這張拼圖,可以猜一下哪張是FLUX.1 Krea [dev]生成的。
![]()
答案馬上揭曉~
模型表現
為了測試FLUX.1 Krea [dev]是否“沒有AI感”,我們將從光學真實性、紋理連續性、語義一致性、透視、動態模糊等方面入手,并與真實的攝影圖片進行對比。

一起來看一下。
光學真實性
AI作圖容易出現“塑料感”或死白過曝的問題,難以區分不同的材質。
我們先在圖蟲網找到了一些主體為不同材料的攝影圖片,并根據圖片的內容設置提示詞,把提示詞輸入FLUX.1 Krea [dev]進行文生圖,驗證模型是否理解物理光學規律。
There is a row of stainless steel pipes neatly arranged at the bottom, and three horizontally placed stainless steel pipes at the top, with the pipe openings facing outward at a 45° angle to the right.
![]()
剛剛的那張拼圖就是由以上的提示詞生成的,正確答案是下圖,猜對了么?
FLUX.1 Krea [dev]會一次性輸出4張圖(對,像豆包一樣),我們挑選了相對真實的那張作為展示。
可以看到,FLUX.1 Krea [dev]在原有提示詞的基礎上,主動添加了銹點的特質——這確實讓材料看上去更加真實。
但也并非十全十美,例如下圖中圈出來的部分,仍存在一些難以解釋的結構。
![]()
The water is calm, a gentle and transparent blue with a few waves.
![]()
同樣的,上圖為真實攝影,下圖為FLUX.1 Krea [dev]的最優輸出。
可以看到,FLUX.1 Krea [dev]對于波浪的理解比較淺顯,看起來有些重復、失真,網狀波紋光看起來不像是在水底,反而像是浮在水面上。
紋理連續與語義理解
AI容易出現常見的重復圖案或斷裂,對于復雜的真實紋理,能否自然過渡成了一個難題。
為此,我們以針織面料和植物為例,測試一下FLUX.1 Krea [dev]對微觀結構的理解能力。
以下拼圖的上圖均為真實攝影,下圖為FLUX.1 Krea [dev]的最優輸出。
Texture of green twill stitch knitted fabric, top view, the fabric is slightly uneven.
![]()
就微觀結構的連續性而言,FLUX.1 Krea [dev]的輸出并無明顯問題。
但對于uneven(不平整)的呈現還是比較規律,且似乎并不能理解twill(斜紋針)的含義。
There are some water droplets on the back of the Plumeria rubra leaves.
![]()
上圖為雞蛋花(Plumeria rubra,華南常見樹種)葉子的背面,有水珠。
根據輸出結果可以看出,FLUX.1 Krea [dev]難以掌握準確的植物類型,甚至沒能很好地理解back(背面)的要求。
(以下是此次輸出的全部四張圖片,均出現同樣問題。)
![]()
就材質而言,水珠的效果也有些“AI味”,過于均勻、單調。
透視與動態模糊
生成多物體交錯場景可以測試文生圖模型對空間關系的理解,還是僅能簡單拼接訓練樣本。
而生成運動物體可以驗證模型對時間維度的模擬能力(檢查模糊方向是否符合物理規律)。
There is a blanket on the grass, with three books stacked on top of it, and a lilac flower in front of it partially blocking the books.
![]()
可以看到,雖然對花朵的理解不太準確,但整體的擬真表現還算不錯,甚至能夠做到讓前景和背景都呈現出模糊的效果(淺景深)。
乍一看沒什么大問題。
A silver car was driving from left to right at about 70 miles per hour, with the city receding behind it.
![]()
且不說左右不分的問題(并不是全部輸出都左右不分,但這張圖效果相對真實),FLUX.1 Krea [dev]的輸出很難看出畫面主體運動的趨勢。
背景的模糊沒有方向性,更像是散光,輪胎上有反光這點也很奇怪(吧?)。
物理規則
通過輸入一些“反常識”的、邏輯矛盾的內容,可以判斷模型是否優先遵循物理規律,還是單純擬合數據。
At noon, the sun was so strong that an oak tree cast no shadow at all in the sun.
![]()
可以看出,即使提示詞為cast no shadow at all(完全沒有影子),FLUX.1 Krea [dev]能夠遵循物理規則,保持影子的存在。
但如果提示詞為“魚在天上飛”這類幻想性比較強的文本,輸出將有所不同:
The weather was sunny, the sky was blue, and some goldfish were swimming above the city.
![]()
雖然金魚像貼圖一樣,但可以看出,在這種時候FLUX.1 Krea [dev]就會跳出既有的物理規律,生成的圖片也缺乏真實感。
畢竟本來就是不可能的事。
其它玩法
根據頁面上已有的功能,似乎還可以做出一些別的嘗試。
![]()
比如可以選擇作圖的風格(image style),或對原有圖像進行調整(image prompt):
![]()
還可以調整生成圖片的比例:
![]()
我們試著用奧特曼的一張照片作為參考,提示詞為“被美元包圍”,“表情自信”。
![]()
注意到在網頁內還可以調整參考比例。
![]()
默認參考為0.4,我們使用了0.5作為嘗試,風格參考也是0.5,輸出結果如下:
![]()
比較大的問題是它似乎無法很好地把人物特征抓出來,呈現出來的結果讓人完全認不出這是誰。
選擇了油畫風格作為參考,卻讓畫面顯得很臟。
所以在下一次測試中,我們取消了參考風格,把參考圖像的比例調整至最大(1),提示詞相同。
輸出的結果如下:
![]()
把提示詞中的“The person in the photo”改成“Samuel Harris Altman”,結果也并沒有多大改變:
![]()
由此大概可以得出,FLUX.1 Krea [dev]并沒有辦法識別出人物特質。
(它的數據庫里可能也沒有奧特曼。)
一個“有主見”的文生圖模型
簡單總結,它在光影和自然細節上做得確實很不錯,屬于乍一看看不出什么大問題的水平,但對于形象的把握、時間和空間結構的理解上還有待提升。
依然會和大多數的AI作圖工具一樣,出現較多的重復,實際情況往往會更加復雜。
當提示詞比較明確是某種植物或者某個具體個體的時候,它并沒辦法很好地生成準確內容,哪怕有圖像參考也是如此。
不過嘛,如果“AI味”指的僅僅是光影和材料的質感,我想它確實做到了。
![]()
官方對FLUX.1 Krea [dev]的介紹是:一個“有主見”的文生圖模型。
FLUX.1 Krea [dev]在人類偏好評估中仍超越了以往的開源文生圖模型,并與FLUX1.1 [Pro]等閉源解決方案表現相當。
此外,它在架構上與FLUX.1 [dev]生態系統兼容,并可作為靈活的基礎模型,用于下游應用的定制。
![]()
雖然在介紹說是免費試用,但一個賬號每天也有固定額度。然而,根據我們的實測體會,似乎不是由圖片數目決定的。
這點也引發了部分網友的不滿:因為一次性默認輸出4張圖,可能會“浪費”額度。
![]()
不過,趁著它還有免費額度,或許也值得一試。
(PS:可以直接用郵箱注冊新賬號,額度就更多了,嘻嘻)
參考鏈接:
[1]https://x.com/bfl_ml/status/1950920537741336801
[2]https://x.com/krea_ai/status/1928218053893828931
[3]https://x.com/roileean/status/1951314395578925061





京公網安備 11011402013531號