圖片生成界的「大魔王」Midjourney 也來搶攻影片生成市場了?!
上面展示的就是一個影片效果。
可以看到跑步動作和人物、空間轉換都非常流暢。
下面這個挖蛋糕的場景不僅逼真,湯匙上還有倒影,非常精細了。
一石激起千層浪,消息一出,Reddit 上的按讚數直接衝到 2.5k。
還引發了網友們的熱烈討論。
有人說「這是我第一次以為是人工拍攝的影片」、「幾乎和現實無法區分」。
不僅影片模型表現良好,Midjourney 的圖像模型 V7 也在不斷更新中。
不僅效果驚人,價格還由你來定
再来看看更多的效果演示。
多人物動作和視角切換都非常流暢。
小貓的動作和人手的動作都很有物理真實感。
小狗溜滑板來了~
汽車甩尾也不成問題。
小貓美甲確實很精細,但更精細的是手部的紋路,手指上竟然還有指紋(雖然有一部分指紋是缺失的)。
不過,也正如上面那位網友所說,有些地方還是不太合理的。
例如,這個疊毯子的場景中,雖然考慮到了手部施力拉扯出的皺褶,給人一定的物理真實感,但是後面像是毯子自己縮回去了……
還有這個,怎麼感覺是爬了一段沒有意義的樓梯,而且女人右手上的花突然飄到了左手上,就為了右手能扶住樓梯。
整體看下來,Midjourney 的這個影片生成模型在物理真實感、紋路細節、動作流暢程度上表現都很不錯。
但是,如果看過之前 Veo 3 的效果,你會不會覺得 Midjourney 這些影片哪裡有點問題——
沒有音訊功能。
是的,網友們也發現了這一點。
同樣是拉小提琴,Midjourney 這邊只有後期加上去的音樂。
而 Veo 3 卻可以生成小提琴的琴聲。
於是,就有人提出質疑了,Midjourney 這時候進場是不是有點晚了?
不過,就在前兩天,Midjourney 公開進行了公司會議,展示了部分影片生成的演示,並且提到了「動畫化圖片」,似乎是與其他影片生成模型有所區別的功能。
實際上,相比於寫實風格,動畫風格才是 Midjourney 更擅長的。
目前,Midjourney 的影片模型還沒有正式發布,正在做最後的完善。
團隊呼籲大家積極參與影片評分,以幫助模型學習人們在影片中喜歡看到的動作和構圖組合。
並且,Midjourney 還非常有誠意地表示,希望大家提供一些建議,讓定價能夠滿足每個人的需求。
不得不說,這波操作也是非常有誠意了。
Midjourney V7 支援語音生圖
除了影片模型,圖片生成模型 Midjourney V7 也在不斷更新中。
從今年 3 月份開始,Midjourney 不斷呼籲使用者積極參與圖片評分,用於對 V7 進行最終完善。
在 4 月份,Midjourney 發布了 V7 alpha。
有 Relax 和 Turbo 模式兩個版本。
下面是一些效果圖,可以看到,V7 生成的手部紋理是非常逼真的。
V7 的旗艦功能是「草稿模式」。
在使用這個功能時,提示欄將更改為「對話模式」。
例如,告訴它用貓換隼或讓它變成夜晚,它會自動操作提示並開始一項新工作。
點擊「草稿模式」然後點擊麥克風按鈕以啟用「語音模式」——你可以大聲思考,讓圖像如夢境一樣在生成區流動。
也就是說,透過說話就能生成圖像,並且可以生成多圖任君選擇~
草稿模式讓生成成本減半,渲染圖像速度提升了 10 倍。
目前,團隊也已經將「草稿模式」與「對話模式」區分開,你可以自由選擇如何單獨或者組合使用這些功能。
團隊還推出 V7 快速模式,也就是更新了加速的功能。
這意味著在快速模式下模型優化需 40 秒,在 Turbo 模式下將僅耗時 18 秒。
經過團隊不斷努力,目前,Midjourney V7 圖像生成速度提升了約 40%。
快速模式作業渲染時間從 36 秒減少到 22 秒。
Turbo 作業渲染時間從 13 秒減少到 9 秒。
圖像模型 V7 不斷更新,還即將推出影片模型,Midjourney 不愧是視覺霸主!