Midjourney 2026年5月アップデート：会話モード、AI支援開発、SREF整理

Midjourney 2026年5月14日の Office Hours で重要なのは、単一のモデルパラメータではない。プロダクトの形が「プロンプトを入力して画像を生成する」ものから、「より自然に創作ワークフローを組み立てる」ものへ進んでいることだ。

今回の内容は、Midjourney チームの最近の Q&A をまとめた日本語記事に基づいている。扱われているのは、会話モードの強化、AI支援開発、サイト改修、SREF とタグ整理、Omni-reference、複数キャラクターの一貫性、そしてチーム内での Midjourney 利用だ。

一言で言えば、Midjourney は画像生成を、会話でき、整理でき、継続的に反復できる創作システムに近づけようとしている。

会話モードの重要性が増している

今回もっとも直接的な変化は Conversational Mode、つまり会話モードだ。

これまで Midjourney を使うには、多くの操作がパラメータや固定された書き方に依存していた。アスペクト比、画像参照、スタイル参照、モデルパラメータなどのルールを覚え、それを prompt や UI 設定に入れる必要があった。

新しい会話モードの方向性は、こうした設定をより自然な言葉で指定できるようにすることだ。

たとえば、音声やテキストで次の内容を指定できる。

デフォルトパラメータ。
16:9 のようなアスペクト比。
画像参照。
スタイル参照、つまり --sref。
V7 の Omni-reference。

これは Midjourney が生成品質だけでなく、パラメータ操作の負担も下げようとしていることを示している。

普通のユーザーにとって最大の変化は、コマンドを常に覚えなくてもよくなることだ。ヘビーユーザーにとっては、会話モードが十分安定すれば、自然言語で生成設定を調整する入口になり得る。

AI支援開発が Midjourney チームの反復速度を変えている

もう一つ興味深い点は、Midjourney チーム自身が AI支援開発を大規模に使っていることだ。

元記事によれば、チームは小さな bug、UI 上の摩擦、ワークフロー上の問題を以前よりずっと速く修正できるようになっている。ユーザーとの通話中に製品 bug が見つかり、AI支援でリアルタイム修正し、レビュー後すぐに展開した例も紹介されている。

これは「AI がエンジニアのコードを書く」という話以上に重要だ。

AI 開発ツールが、AI 製品自身の反復方法に影響し始めているということだからだ。

ユーザーフィードバックを修正フローへ早く入れられる。
小さな体験上の問題を処理しやすくなる。
エンジニアはアーキテクチャ、レビュー、設計判断、テストへより多くの力を使える。
プロダクトチームは edge case をより頻繁に整理できる。

Midjourney のような製品には、創作経路、パラメータ組み合わせ、モバイル体験、検索、整理フローが大量にある。多くの問題は「コアモデルが画像を生成できない」ことではなく、入口が使いにくい、操作が一手多い、特殊な状態が気持ちよくない、といったものだ。

AI支援開発は、このような小さく大量にある改善を加速するのに向いている。

サイト改修の重点はワークフローであり、機能削除ではない

Office Hours では、Midjourney の Web サイトが大きく改修中であることも触れられている。

目標は複雑な機能を削ることではなく、創作フローをより直感的にし、新規ユーザーが入りやすくし、ツールと機能をより分かりやすく整理することだ。

これは重要だ。

Midjourney の問題は機能不足ではない。機能が増えるほど、入口、保存、整理、参照、探索、再利用が複雑になる。ライトユーザーにとって難しいのは「どこから始めるか」であり、ヘビーユーザーにとって難しいのは「大量のスタイル、参照、実験結果をどう管理するか」だ。

可能な展開方針としては、次のようなものがある。

新旧インターフェースを並行提供する。
まず alpha テストを行う。
ヘビーユーザーへの影響を避けるため、段階的に移行する。

この方針から、チームが Midjourney を単なる画像生成の玩具とは見ていないことが分かる。多くのユーザーはすでに実際の創作ワークフローに組み込んでおり、UI 変更で既存の習慣を簡単に壊すことはできない。

SREF、スタイル、タグ整理はまだ痛点

SREF とスタイル整理は、今回の Q&A で特に注目すべき部分だ。

ユーザーはよりよい整理システムを求めている。特に次のようなものだ。

ランダム SREF。
スタイル参照。
保存した美学方向。
タグと色付きタグ。
より強いフィルタリング、分類、再利用。

一方でチームは、現在のフォルダーシステムが一つの画像を複数フォルダーに入れられ、無制限のフォルダー数をサポートし、フィルタリングと並び替えもできるなら、タグはフォルダーにない何を提供するのか、という問いも投げている。

これは現実的な問いだ。

多くのプロダクトは、ユーザーがタグを欲しいと言うからタグを追加する。しかしタグシステムの設計が悪いと、別の混乱した分類層になる。フォルダー、タグ、お気に入り、検索、フィルター、プロジェクト、スタイルライブラリの境界が曖昧だと、かえって管理しにくくなる。

そのため Midjourney チームは、より具体的なワークフロー例を集めたいと考えている。ユーザーはどの場面でタグを必要とするのか。なぜフォルダーでは足りないのか。スタイルを素早く組み合わせたいのか、プロジェクトをまたいで再利用したいのか、テーマ、色調、写真スタイル、キャラクター関係で絞り込みたいのか。

Midjourney にとって、整理システムは生成モデルと同じくらい重要になり得る。ユーザーが長期的に創作を始めると、難しいのは一枚の画像を生成することではなく、数千枚の画像、数百のスタイル方向、反復実験の結果を管理することだからだ。

Omni-reference はより複雑なキャラクター制御へ向かう

元記事では、将来の Omni-reference / subject reference システムが、複数のキャラクター参照を同時に扱い、異なる主体をよりよく分離できる可能性にも触れている。

これは AI 画像生成の長年の痛点、つまりキャラクター一貫性と複数キャラクター関係に直結する。

一人のキャラクターを一貫させるだけでも難しい。複数人になるとさらに難しい。よくある問題は次の通りだ。

A の特徴が B に移る。
複数人物の身份が混ざる。
服装、髪型、顔の特徴が画像ごとに安定しない。
参照画像が主体だけでなく全体スタイルへ強く影響しすぎる。

Omni-reference が主体分離をよりうまく扱えるなら、Midjourney は漫画、絵コンテ、広告ビジュアル、キャラクター設定、ゲームコンセプトアート、連続した物語により向くようになる。

これは V7 以降も継続して注目すべき方向だ。

Midjourney は prompt を捉え直している

今回のまとめには、興味深い考え方もある。言語は想像力を圧縮する層だ、というものだ。

これは Midjourney の製品方向をよく説明している。

多くのユーザーは、AI 画像生成の核心はより長く、より正確な prompt を書くことだと思いがちだ。しかし実際の創作では、画像参照、スタイル参照、moodboard、SREF、バリエーション、再生成、後処理の方が、長文 prompt より役立つことが多い。

Midjourney チームの Duncan のワークフローもそれを示している。彼は Midjourney を sketchbook のように使い、moodboard、SREF、少ない文字、高い --r 再生成、強い/微妙なバリエーション、Photoshop レタッチ、外部アップスケールを組み合わせる。

つまり成熟した Midjourney ユーザーは、「魔法のプロンプト」だけで作業しているわけではない。

より現実的な流れは次の通りだ。

少ない言葉で方向を与える。
画像参照で視覚的文脈を与える。
SREF でスタイルを絞る。
多数のバリエーションで空間を探索する。
人間の審美眼で結果を選ぶ。
外部ツールで後処理する。

Prompt は重要だが、すべてではない。

ユーザーにとっての意味

たまに画像を生成するだけなら、今回の更新で最も直接的な影響は会話モードが使いやすくなることだ。将来的には、比率、参照画像、スタイル、パラメータを、コマンドを覚えずに自然に伝えられるかもしれない。

ヘビーユーザーなら、注目すべき方向は三つある。

第一に、整理システム。

SREF、スタイル、フォルダー、お気に入り、タグがどう進化するかは、長期的な創作効率に直結する。

第二に、サイト改修。

新しい UI が探索、整理、再利用、書き出しをつなげられるなら、Midjourney は単一の生成器ではなく、より専門的な創作ツールに近づく。

第三に、キャラクターと主体参照。

Omni-reference が複数キャラクターと主体分離を安定して扱えるなら、Midjourney は単発画像だけでなく、継続プロジェクトにより向くようになる。

まとめ

Midjourney 2026年5月の Office Hours の重点は、派手な単一パラメータではない。プロダクトが引き続き「創作システム」へ進化していることだ。

会話モードは入力のハードルを下げる。AI支援開発は反復速度を上げる。サイト改修はワークフロー再編を目指す。SREF とタグの議論は長期的なアセット管理を示す。Omni-reference はキャラクター一貫性と複雑な主体制御に関わる。

AI 画像生成ツールにとって、モデル能力が重要なのは当然だ。しかし生成品質が一定水準に達したあと、ユーザーが長く残るかどうかを決めるのは、ワークフロー、整理能力、制御性、反復速度であることが多い。

Midjourney はその部分を補い始めている。

参考資料

Midjourney 最新ニュース（2026年5月14 日）｜アキスケ