Midjourney 進軍影片生成，圖像模型 V7 持續更新，視覺霸主實至名歸

圖片生成界的「大魔王」Midjourney 也來搶攻影片生成市場了？！

上面展示的就是一個影片效果。

可以看到跑步動作和人物、空間轉換都非常流暢。

下面這個挖蛋糕的場景不僅逼真，湯匙上還有倒影，非常精細了。

一石激起千層浪，消息一出，Reddit 上的按讚數直接衝到 2.5k。

還引發了網友們的熱烈討論。

有人說「這是我第一次以為是人工拍攝的影片」、「幾乎和現實無法區分」。

不僅影片模型表現良好，Midjourney 的圖像模型 V7 也在不斷更新中。

不僅效果驚人，價格還由你來定

再来看看更多的效果演示。

多人物動作和視角切換都非常流暢。

小貓的動作和人手的動作都很有物理真實感。

小狗溜滑板來了～

汽車甩尾也不成問題。

小貓美甲確實很精細，但更精細的是手部的紋路，手指上竟然還有指紋（雖然有一部分指紋是缺失的）。

不過，也正如上面那位網友所說，有些地方還是不太合理的。

例如，這個疊毯子的場景中，雖然考慮到了手部施力拉扯出的皺褶，給人一定的物理真實感，但是後面像是毯子自己縮回去了……

還有這個，怎麼感覺是爬了一段沒有意義的樓梯，而且女人右手上的花突然飄到了左手上，就為了右手能扶住樓梯。

整體看下來，Midjourney 的這個影片生成模型在物理真實感、紋路細節、動作流暢程度上表現都很不錯。

但是，如果看過之前 Veo 3 的效果，你會不會覺得 Midjourney 這些影片哪裡有點問題——

沒有音訊功能。

是的，網友們也發現了這一點。

同樣是拉小提琴，Midjourney 這邊只有後期加上去的音樂。

而 Veo 3 卻可以生成小提琴的琴聲。

於是，就有人提出質疑了，Midjourney 這時候進場是不是有點晚了？

不過，就在前兩天，Midjourney 公開進行了公司會議，展示了部分影片生成的演示，並且提到了「動畫化圖片」，似乎是與其他影片生成模型有所區別的功能。

實際上，相比於寫實風格，動畫風格才是 Midjourney 更擅長的。

目前，Midjourney 的影片模型還沒有正式發布，正在做最後的完善。

團隊呼籲大家積極參與影片評分，以幫助模型學習人們在影片中喜歡看到的動作和構圖組合。

並且，Midjourney 還非常有誠意地表示，希望大家提供一些建議，讓定價能夠滿足每個人的需求。

不得不說，這波操作也是非常有誠意了。

Midjourney V7 支援語音生圖

除了影片模型，圖片生成模型 Midjourney V7 也在不斷更新中。

從今年 3 月份開始，Midjourney 不斷呼籲使用者積極參與圖片評分，用於對 V7 進行最終完善。

在 4 月份，Midjourney 發布了 V7 alpha。

有 Relax 和 Turbo 模式兩個版本。

下面是一些效果圖，可以看到，V7 生成的手部紋理是非常逼真的。

V7 的旗艦功能是「草稿模式」。

在使用這個功能時，提示欄將更改為「對話模式」。

例如，告訴它用貓換隼或讓它變成夜晚，它會自動操作提示並開始一項新工作。

點擊「草稿模式」然後點擊麥克風按鈕以啟用「語音模式」——你可以大聲思考，讓圖像如夢境一樣在生成區流動。

也就是說，透過說話就能生成圖像，並且可以生成多圖任君選擇～

草稿模式讓生成成本減半，渲染圖像速度提升了 10 倍。

目前，團隊也已經將「草稿模式」與「對話模式」區分開，你可以自由選擇如何單獨或者組合使用這些功能。

團隊還推出 V7 快速模式，也就是更新了加速的功能。

這意味著在快速模式下模型優化需 40 秒，在 Turbo 模式下將僅耗時 18 秒。

經過團隊不斷努力，目前，Midjourney V7 圖像生成速度提升了約 40%。

快速模式作業渲染時間從 36 秒減少到 22 秒。

Turbo 作業渲染時間從 13 秒減少到 9 秒。

圖像模型 V7 不斷更新，還即將推出影片模型，Midjourney 不愧是視覺霸主！

主標籤：人工智慧

次標籤：影片生成、機器學習、Midjourney、圖像生成

上一篇：當 AI 成為你的旅行管家，傳統訂票平台正被 iMeanAI Coyage 悄悄取代

下一篇：2天完成人類12年工作，AI自動更新文獻回顧，準確率碾壓人類近15%

分享短網址

原始網址：https://mp.weixin.qq.com/s/1ZWibAOK3v4Xs-p-fo4KlQ