Midjourney 2026年5月14日の Office Hours で重要なのは、単一のモデルパラメータではない。プロダクトの形が「プロンプトを入力して画像を生成する」ものから、「より自然に創作ワークフローを組み立てる」ものへ進んでいることだ。
今回の内容は、Midjourney チームの最近の Q&A をまとめた日本語記事に基づいている。扱われているのは、会話モードの強化、AI支援開発、サイト改修、SREF とタグ整理、Omni-reference、複数キャラクターの一貫性、そしてチーム内での Midjourney 利用だ。
一言で言えば、Midjourney は画像生成を、会話でき、整理でき、継続的に反復できる創作システムに近づけようとしている。
会話モードの重要性が増している
今回もっとも直接的な変化は Conversational Mode、つまり会話モードだ。
これまで Midjourney を使うには、多くの操作がパラメータや固定された書き方に依存していた。アスペクト比、画像参照、スタイル参照、モデルパラメータなどのルールを覚え、それを prompt や UI 設定に入れる必要があった。
新しい会話モードの方向性は、こうした設定をより自然な言葉で指定できるようにすることだ。
たとえば、音声やテキストで次の内容を指定できる。
- デフォルトパラメータ。
16:9のようなアスペクト比。- 画像参照。
- スタイル参照、つまり
--sref。 - V7 の Omni-reference。
これは Midjourney が生成品質だけでなく、パラメータ操作の負担も下げようとしていることを示している。
普通のユーザーにとって最大の変化は、コマンドを常に覚えなくてもよくなることだ。ヘビーユーザーにとっては、会話モードが十分安定すれば、自然言語で生成設定を調整する入口になり得る。
AI支援開発が Midjourney チームの反復速度を変えている
もう一つ興味深い点は、Midjourney チーム自身が AI支援開発を大規模に使っていることだ。
元記事によれば、チームは小さな bug、UI 上の摩擦、ワークフロー上の問題を以前よりずっと速く修正できるようになっている。ユーザーとの通話中に製品 bug が見つかり、AI支援でリアルタイム修正し、レビュー後すぐに展開した例も紹介されている。
これは「AI がエンジニアのコードを書く」という話以上に重要だ。
AI 開発ツールが、AI 製品自身の反復方法に影響し始めているということだからだ。
- ユーザーフィードバックを修正フローへ早く入れられる。
- 小さな体験上の問題を処理しやすくなる。
- エンジニアはアーキテクチャ、レビュー、設計判断、テストへより多くの力を使える。
- プロダクトチームは edge case をより頻繁に整理できる。
Midjourney のような製品には、創作経路、パラメータ組み合わせ、モバイル体験、検索、整理フローが大量にある。多くの問題は「コアモデルが画像を生成できない」ことではなく、入口が使いにくい、操作が一手多い、特殊な状態が気持ちよくない、といったものだ。
AI支援開発は、このような小さく大量にある改善を加速するのに向いている。
サイト改修の重点はワークフローであり、機能削除ではない
Office Hours では、Midjourney の Web サイトが大きく改修中であることも触れられている。
目標は複雑な機能を削ることではなく、創作フローをより直感的にし、新規ユーザーが入りやすくし、ツールと機能をより分かりやすく整理することだ。
これは重要だ。
Midjourney の問題は機能不足ではない。機能が増えるほど、入口、保存、整理、参照、探索、再利用が複雑になる。ライトユーザーにとって難しいのは「どこから始めるか」であり、ヘビーユーザーにとって難しいのは「大量のスタイル、参照、実験結果をどう管理するか」だ。
可能な展開方針としては、次のようなものがある。
- 新旧インターフェースを並行提供する。
- まず alpha テストを行う。
- ヘビーユーザーへの影響を避けるため、段階的に移行する。
この方針から、チームが Midjourney を単なる画像生成の玩具とは見ていないことが分かる。多くのユーザーはすでに実際の創作ワークフローに組み込んでおり、UI 変更で既存の習慣を簡単に壊すことはできない。
SREF、スタイル、タグ整理はまだ痛点
SREF とスタイル整理は、今回の Q&A で特に注目すべき部分だ。
ユーザーはよりよい整理システムを求めている。特に次のようなものだ。
- ランダム SREF。
- スタイル参照。
- 保存した美学方向。
- タグと色付きタグ。
- より強いフィルタリング、分類、再利用。
一方でチームは、現在のフォルダーシステムが一つの画像を複数フォルダーに入れられ、無制限のフォルダー数をサポートし、フィルタリングと並び替えもできるなら、タグはフォルダーにない何を提供するのか、という問いも投げている。
これは現実的な問いだ。
多くのプロダクトは、ユーザーがタグを欲しいと言うからタグを追加する。しかしタグシステムの設計が悪いと、別の混乱した分類層になる。フォルダー、タグ、お気に入り、検索、フィルター、プロジェクト、スタイルライブラリの境界が曖昧だと、かえって管理しにくくなる。
そのため Midjourney チームは、より具体的なワークフロー例を集めたいと考えている。ユーザーはどの場面でタグを必要とするのか。なぜフォルダーでは足りないのか。スタイルを素早く組み合わせたいのか、プロジェクトをまたいで再利用したいのか、テーマ、色調、写真スタイル、キャラクター関係で絞り込みたいのか。
Midjourney にとって、整理システムは生成モデルと同じくらい重要になり得る。ユーザーが長期的に創作を始めると、難しいのは一枚の画像を生成することではなく、数千枚の画像、数百のスタイル方向、反復実験の結果を管理することだからだ。
Omni-reference はより複雑なキャラクター制御へ向かう
元記事では、将来の Omni-reference / subject reference システムが、複数のキャラクター参照を同時に扱い、異なる主体をよりよく分離できる可能性にも触れている。
これは AI 画像生成の長年の痛点、つまりキャラクター一貫性と複数キャラクター関係に直結する。
一人のキャラクターを一貫させるだけでも難しい。複数人になるとさらに難しい。よくある問題は次の通りだ。
- A の特徴が B に移る。
- 複数人物の身份が混ざる。
- 服装、髪型、顔の特徴が画像ごとに安定しない。
- 参照画像が主体だけでなく全体スタイルへ強く影響しすぎる。
Omni-reference が主体分離をよりうまく扱えるなら、Midjourney は漫画、絵コンテ、広告ビジュアル、キャラクター設定、ゲームコンセプトアート、連続した物語により向くようになる。
これは V7 以降も継続して注目すべき方向だ。
Midjourney は prompt を捉え直している
今回のまとめには、興味深い考え方もある。言語は想像力を圧縮する層だ、というものだ。
これは Midjourney の製品方向をよく説明している。
多くのユーザーは、AI 画像生成の核心はより長く、より正確な prompt を書くことだと思いがちだ。しかし実際の創作では、画像参照、スタイル参照、moodboard、SREF、バリエーション、再生成、後処理の方が、長文 prompt より役立つことが多い。
Midjourney チームの Duncan のワークフローもそれを示している。彼は Midjourney を sketchbook のように使い、moodboard、SREF、少ない文字、高い --r 再生成、強い/微妙なバリエーション、Photoshop レタッチ、外部アップスケールを組み合わせる。
つまり成熟した Midjourney ユーザーは、「魔法のプロンプト」だけで作業しているわけではない。
より現実的な流れは次の通りだ。
- 少ない言葉で方向を与える。
- 画像参照で視覚的文脈を与える。
- SREF でスタイルを絞る。
- 多数のバリエーションで空間を探索する。
- 人間の審美眼で結果を選ぶ。
- 外部ツールで後処理する。
Prompt は重要だが、すべてではない。
ユーザーにとっての意味
たまに画像を生成するだけなら、今回の更新で最も直接的な影響は会話モードが使いやすくなることだ。将来的には、比率、参照画像、スタイル、パラメータを、コマンドを覚えずに自然に伝えられるかもしれない。
ヘビーユーザーなら、注目すべき方向は三つある。
第一に、整理システム。
SREF、スタイル、フォルダー、お気に入り、タグがどう進化するかは、長期的な創作効率に直結する。
第二に、サイト改修。
新しい UI が探索、整理、再利用、書き出しをつなげられるなら、Midjourney は単一の生成器ではなく、より専門的な創作ツールに近づく。
第三に、キャラクターと主体参照。
Omni-reference が複数キャラクターと主体分離を安定して扱えるなら、Midjourney は単発画像だけでなく、継続プロジェクトにより向くようになる。
まとめ
Midjourney 2026年5月の Office Hours の重点は、派手な単一パラメータではない。プロダクトが引き続き「創作システム」へ進化していることだ。
会話モードは入力のハードルを下げる。AI支援開発は反復速度を上げる。サイト改修はワークフロー再編を目指す。SREF とタグの議論は長期的なアセット管理を示す。Omni-reference はキャラクター一貫性と複雑な主体制御に関わる。
AI 画像生成ツールにとって、モデル能力が重要なのは当然だ。しかし生成品質が一定水準に達したあと、ユーザーが長く残るかどうかを決めるのは、ワークフロー、整理能力、制御性、反復速度であることが多い。
Midjourney はその部分を補い始めている。