Midjourney、動画生成に参入、画像モデルV7も継続更新、ビジュアルの覇者確定

画像生成界の「大魔王」Midjourneyが、ついに動画生成にも参戦するのでしょうか?!

画像

上記で示されているのが動画の例です。

走る動きや人物、空間の変換が非常に滑らかであることがわかります。

下のケーキを掘るシーンは、リアルなだけでなく、スプーンに反射があり、非常に細かいです。

画像

このニュースは大きな反響を呼び、Redditでは2.5kの「いいね」を獲得しました。

ネットユーザーの間で激しい議論も巻き起こしました。

画像

「初めて人間が撮影した動画だと思った」「現実とほとんど区別できない」という声もありました。

画像画像

動画モデルの性能が良いだけでなく、Midjourneyの画像モデルV7も継続的に更新されています。

驚きの効果、価格はあなたが決める

画像

さらに多くの効果デモンストレーションを見てみましょう。

複数の人物の動きや視点切り替えも非常に滑らかです。

画像

子猫の動きと人の手の動きは、どちらも物理的なリアルさがあります。

画像

スケートボードに乗った子犬が来たよ~

画像

車のドリフトも問題ありません。

画像

子猫のネイルは確かに非常に精密ですが、さらに細かいのは手のしわや指紋まであることです(一部の指紋は欠落していますが)。

画像

しかし、上記のネットユーザーが言ったように、いくつかの不合理な点もあります。

例えば、この毛布をたたむシーンでは、手の力でできるしわが考慮され、ある程度の物理的なリアル感を与えていますが、その後毛布が自分で縮んでいったように見えます……

画像

これもそうです。なぜか意味のない階段を登っているように見え、女性の右手の花が突然左手に移動し、右手で階段の手すりを掴むためだけに……。

画像

全体的に見て、Midjourneyのこの動画生成モデルは、物理的なリアルさ、テクスチャの細部、動作の滑らかさにおいて非常に優れたパフォーマンスを発揮しています。

しかし、以前のVeo 3の効果を見たことがあれば、Midjourneyのこれらの動画に何か問題があると感じませんか?

オーディオ機能がないのです。

はい、ネットユーザーもこの点に気づいています。

画像

同じバイオリンを弾くシーンでも、Midjourneyの方は後から音楽が追加されているだけです。

一方、Veo 3はバイオリンの音を生成できます。

そこで、Midjourneyの今回の参入は少し遅いのではないかという疑問も浮上しました。

画像

しかし、数日前、Midjourneyは公開会社会議を行い、一部の動画生成デモを披露しました。その中で「アニメーション化された画像」に言及しており、これは他の動画生成モデルとは異なる機能のようです。

実際、リアルなスタイルよりもアニメスタイルの方がMidjourneyは得意としています。

現在、Midjourneyの動画モデルはまだ正式にリリースされておらず、最終的な調整が行われています。

チームは、モデルが動画で人々が好む動きや構図の組み合わせを学習できるよう、積極的に動画の評価に参加するよう呼びかけています。

さらに、Midjourneyは非常に誠意をもって、価格設定がすべての人々のニーズを満たすように、ぜひ意見を寄せてほしいと述べています。

画像

この一連の動きは非常に誠実だと言わざるを得ません。

画像

Midjourney V7は音声からの画像生成をサポート

動画モデルに加えて、画像生成モデルMidjourney V7も継続的に更新されています。

今年3月以降、MidjourneyはV7の最終調整のため、ユーザーに積極的に画像評価に参加するよう継続的に呼びかけています。

画像

4月には、MidjourneyはV7 alphaをリリースしました。

RelaxモードとTurboモードの2つのバージョンがあります。

以下にいくつかの効果画像を示します。V7が生成する手のテクスチャは非常にリアルであることがわかります。

画像画像

V7の主要機能は「ドラフトモード」です。

この機能を使用すると、プロンプトバーが「会話モード」に変わります。

例えば、猫をハヤブサに変える、または夜にするように指示すると、自動的にプロンプトを処理し、新しい作業を開始します。

「ドラフトモード」をクリックし、マイクボタンをクリックして「音声モード」を有効にすると、声に出して考え、イメージが夢のように生成エリアに流れるのを見ることができます。

つまり、話すだけで画像を生成でき、複数の画像から自由に選択できます~

画像

ドラフトモードは生成コストを半減させ、画像レンダリング速度を10倍に向上させます。

現在、チームは「ドラフトモード」と「会話モード」を区別しており、これらの機能を個別に、または組み合わせて自由に選択できます。

画像

チームはさらにV7高速モード、つまりアクセラレーション機能を更新しました。

これは、高速モードでのモデル最適化が40秒かかり、Turboモードではわずか18秒で済むことを意味します。

チームの絶え間ない努力により、現在、Midjourney V7の画像生成速度は約40%向上しました。

高速モードでの作業レンダリング時間は36秒から22秒に短縮されました。

ターボモードでの作業レンダリング時間は13秒から9秒に短縮されました。

画像モデルV7は継続的に更新され、まもなく動画モデルもリリースされます。Midjourneyはまさにビジュアルの覇者です!

メインタグ:人工知能

サブタグ:動画生成機械学習Midjourney画像生成


前の記事:AIがあなたの旅行コンシェルジュになるとき、従来の予約プラットフォームはiMeanAI Coyageに静かに取って代わられている

次の記事:AIが人類の12年分の仕事を2日で完了、文献レビューを自動更新し、精度で人類を15%近く凌駕

短いURLをシェア