midjourney指令怎么用全面解析Midjourney参数和指令

2024.05.10

    说到 AIGC 绘画，Midjourney 是无法绕开的话题。易上手、效率高、创意性强和出图质量好，使 Midjourney 在设计师圈中被广泛使用。
    一、初识 Midjourney
    先来看一个案例：

Prompt：a cute cat, 3d, octane render, blender --ar 16:9 --niji 5 --s 400 --style expressive

    其中--ar 16:9 代表着图片的分辨率比例。长宽比为 16:9。
    --niji 5 代表着 niji 5 版本模型。
    --s 400 代表着艺术化风格化，对于 V5 版本来说，支持 0-1000。

输入指令：/settings 发送后，出现下图设置项。

其中下图的 1-5 分别对应 Midjourney 的版本，MJ version 5.1 为当前最新版本。

Niji version 4 和 5 代表着动漫风格的模型。

MJ test 和 MJ test photo 是 Midjourney 的测试模型。

Style low、med、hight、very higt 分别代表着艺术风格化程度，从低、中、高、非常高。Reset Settings 为重置设置。

Public mode 代表着公开模式，生成的图，会出现在其他地方。非 60 美元/月套餐，只能是该模式。

    Stealth mode 代表着秘密模式，仅限 60 美元/月套餐用户使用。
    Remix mode 为混音模式。
    Fast mode 为快速模式。60 美元/月套餐，每个月有 30 个小时快速出图时间。30 美元/月，每个月有 15 个小时快速出图时间。10 美元/月，每个月有 200 张快速出图套餐，200 张额度很快会用完，不推荐此套餐。
    Relax mode 低速模式，快速模式一分钟左右出图，而低速模式可能需要 10 分钟左右，速度比较慢。
    生成的图片下方，有 2 排按钮。

    U = Upscale to max；V = Make Variations，后面的数字代表上方对应的图片序号。
    这里大概说一下每个模型的区别：
    v1 版本画的花朵，比较抽象。v2 版本，花朵细节增加。v3 版本，细节相对于 v2 更加丰富，且创意更好。

在下图，v4 到 v5 版本可以看出猫咪的细节更加真实。v4 看上去像绘画，v5 就更像照片，Test Photo 模型是 Midjourney 照片测试模型：

在下图中，从 Niji4 到 5 可以看出，动漫画风更加高级，更加二次元，从卡通走向成熟，Test 模型是测试模型：

在 v4 版本中有 a、b 和 c（默认），

近期推出了 v5.1 模型，我们的测试模式已经没有了，v5.1 的模型相对 v5 效果更强，简单的关键词也可以产生很好的效果，改善边缘细节，并提升了画面清晰度，v5.1 下还有 raw 模式，该模式可以支持长 prompt，更能准确的理解关键词，生成的图片更加准确，如下图：

因为遇到过有的小伙伴还不会设置自己的个人服务器，我这里也放一个动画示意，告诉大家如何添加服务器和 Midjourney 机器人：

添加 niji 5 机器人，如下示意：

使用 niji 5，输入 /settings 回车（注意要选择绿色/图标的）。

niji 5 里又有 4 种风格：

分别是默认风格、表现力风格、可爱风格和最新出的景观风格，下面放一下风格之间的区别（因为景观风格是刚出的，这里没有放示意，大家可以自己尝试一下）。

    Remix 混音模式
    首先打开混音模式，这里选择了一张官方的图，一堆艺术线稿样式的南瓜，然后选择“Make Variations”。

在弹出窗口中修改或输入新的提示。例如在输入框里输入 pile of cartoon owls（一堆卡通猫头鹰）。

则对应的猫头鹰代替南瓜。

    二、常用命令拆解
    常见的命令有：

--seed：种子值
--q：品质
--c：混乱
--no：负面提示
--iw：权重（0.5-2）
::（多重提示）
-- repeat（重复）
--stop（停止）
--title（无缝贴图：适用于模型版本 1、2、3、5）
--video（过程动画，适用于模型版本 1、2、3、test）
/blend（最多 5 张图片混合）
/describe（以图生文）
--uplight（升频器，放大图片使用，添加适量的细节和纹理，用 v1-v4 的模型时候，或者默认 niji 模型，可以将默认的 256*256 或 512*512，放大为 1024*1024，因为现在我们默认用 v5，已经是 1024*1024 了，所以一般用不到了）
--upbeta（同上，同样也是放大，放大后表面更光滑，且不会添加额外的细节。v4 和默认 niji 模型的时候可以放大到 2048*2048，v1-v3 还是 1024*1024，v5 不支持）
--upanime（同上，niji 4 的默认升频器，适合动漫风格的插画，也是可以放大到 1024*1024，适用于 v1-v4 模型，因为现在 niji 5 默认也是 1024*1024，一般也不用到了，三种升频器都是加到关键词最后，之后点击图片下的 u1、u2、u3、u4 进行使用）
--seed（种子值）

    虽然我们的出图是随机的，但毕竟是程序化的控制，所以我们每张图片都对应着一个 seed 值，使用相同的 seed 值和关键词将产生几乎一样的图片（实际就是一样的）。使用方式“--seed xxxx ” 如“--seed 12345 ” 。
    如下图所示：使用相同 seed 值，生成的两次图片，是同样的结果。

获取 seed 值的方式如下图所示：

第一步：右键-添加反应-显示更多，输入 envelope 选择邮件图标，点击后，在 Midjourney 私聊中获取 seed 值。

    Quality（品质）
    使用方式“--q”或“--Quality” ，这里决定了我们最终生成的图片质量，更高的参数会产生更多的细节，类似我们做三维渲染一样，时间越长，效果会更好，当然同时也会消耗更多的 GPU 分钟数，注意这里的质量设置不会影响图片分辨率。
    如下图所示，分别是：--q .25、--q .5 和--q 1。其中--q.5 对应的模式是 Half quality。-q 1 对应的模式是 Base quality。

    --q .25：最快得到结果。速度提高 4 倍数，GPU 渲染分钟数减少 3/4。
    --q.5：减少细节。速度提高两倍，GPU 渲染分钟数减少 1/2。
    --q 1：默认设置，细节和速度之间的平衡。

注意的是 v5 最高支持 --q 1，就算输入--q 2 也会向下兼容 q 1，如果想使用--q 2，可以使用 v1、2 或者 v3 模型。

    stylize （艺术风格化)
    使用方式“--s”或“--stylize” ，低风格化生成的图像与提示非常匹配，但艺术性较差。高风格化创建的图像非常具有艺术性，创意性更强，但与提示的联系较少。--stylize 的默认值为 100，并且在使用默认 [V4、V5 模型] 时接受 0-1000 的整数值。
    如下图所示：随着风格化数值越高，则画面的细节和表现力越强，细节和层级也越复杂。

v5 版本，风格化数值支持范围 0-1000，默认 100。

    官方标注这里有缺少，最新的 niji 5 中，支持最高到 400 的艺术风格化
    三、命令之间的组合运用
    chaos (混乱)
    使用方式“--c”或“--chaos” ，chaos 的数值影响初始图像，高 chaos 值将产生更多不寻常和意想不到的结果和组合。较低的 chaos 值具有更可靠、可重复的结果，搭配 seed 值使用，将产生相似的图片。
    --chaos 数值范围为 0-100，默认值为 0。
    如下图所示：混乱值越高，则生成一组图片之间的差异性组合越大，可能会出现新的图片，越低则越接近原图，可以用于生成相似人物，数值可以写 5 以内。

    no (负面提示)
    使用方式“--no” ，例:--no plants 尝试从图像中移除植物。
    例如生成了一个卧室的图。

当我不想要床出现在房间里时，则加入 --no bed. 则生成图不会出现床。

    stop (停止)
    使用方式“--stop ” ，--stop 接受值:10-100。默认--stop 值为 100。--stop0 不起作用。
    使用--stop 选择在什么进度结束。较小的百分比结束会产生更糊、不详细的结果。
    下图中，添加--stop 不同的数值，得到对应进度生成图。当 --stop 100，则是就是 100%生成的正常图。

    repeat (重复)
    使用方式“--r”或“--repeat ” 。众所周知，MJ 属于抽卡模式，游戏里大家都知道可以十连抽，那我们的 mj 可以不可以呢？答案是可以的。这里用到的就是重复命令“--repeat”,用这个命令可以一次性生成多次图片，可以加速我们的抽卡环节。
    --r 后输入我们需要出图的次数。要注意的是标准版 30 美元/月订阅者: 2–10 ，Pro版60美元/月订阅者:2–40。

    由于生成图片较多，需要点击 yes 确认；反悔的话，可以点击 cancel all，进行取消。
    :: (多重提示)
    当我们使用 :: 作为分隔符时，可以分别处理两个或多个单独的关键词，而且还可以设置每个关键词的比重。0.5 的时候，0 可以省略，写成.5，如“::.5” 。
    如果关键词是：hot dog，则出现热狗。

如果通过::输入，关键词是：hot:: dog (分开联想创作，热和狗) ：

    这里是缩写，实际 hot:: dog = hot::1 dog::1，等于 1:1。也可以用“,”号来区分，如 hot,dog，也会分开联想，但还是有些区别。
    第二个示意，输入关键词：baby corn（玉米笋）出现对应的玉米笋。

将 baby corn 变为 baby:: corn。baby 和 corn 的权重是 1:1。生成的图如下图所示。

当 baby::2 corn。即婴儿和玉米的权重是 2:1。则玉米出现的占比更小，如图生成出来的图片出现玉米糊。

当 baby::100 corn。即婴儿和玉米的权重是 100:1，生成的画面几乎没有玉米的画面。

    注意，这里::权重的总和必须是正数,最好大于 0.5,等于 0 的时候，生成的图片会出现与关键词无关
    例:baby:: corn = baby::1 corn::1，1+1=2
    由此可以得到：
    baby:: corn::-2 ?
    baby:: corn::-.5 ?
    baby::2 corn::-2 ?
    baby3:: corn::-2 ?
    baby::1.5 corn::-2 ?
    baby::51 corn::-50 ?
    只是示意，大家平时不要写这么刁钻的，可以写成完整的，如::写成::1，-.5 写成-0.5；
    我们用官方示意再解释一下，输入关键词：
    vibrant tulip fields （生机勃勃的郁金香花田）得到如下图所示：

    这里更改关键词：
    vibrant tulip fields:: red::-.5（生机勃勃的郁金香花田,不要红色）得到如下图所示：

    这里“red::-0.5”等同“--no red” 如果“red::2”则“画面全是红色的郁金香”
    iw (图像权重，图生图)
    使用方式，例“--iw 2” 。
    --iw 的数值，会影响我们上传的图像与文本之间的比重；默认--iw 数值为 1，较高的 --iw 值意味着我们上传的图片对生成的结果，影响更大。数值范围为 0.5-2。

垫一张上面的图，加上一点描述:a cute girl sitting in a fantasy world. 当--iw 1（默认）时如下图所示：

    会看到生成的图片动作相近，略有差距
    当--iw 2 时。

    这里会看到生成的图片动作比较接近。
    当--iw 0.5 时候

    此时生成的图片差距比较大。
    /describe (图生文)
    首先，这里我们找一张模特照片（图片来自于 unsplash）：

使用方式，输入框中输入“/describe” ，添加图片后，会得到对应的四组关键词。

选择其中一组关键词生成如下图：

配合前面提到的 seed 值，使用相同 seed 值 + chaos,生成微调画面。如下图所示：

    这里要注意的是，如果开始了混音模式，点图片下的 V 键，生成四组图片时，生成的图片效果效果可能不是很好，卡通人物的话不是很明显。
    下图左侧图片未开启 remix 模式。右侧是开启了 remix 模式。

    然后还是选择一组关键词，用图生图的方式生成图片，加上“--iw 2”
    原图如下：

生成图如下：

    网上很多 mj 控图大法，可以控制生成相同角色的教程，实际效果其实不是很准确。
    Midjourney 的可控性还没那么强。无非就是 seed 值，加 iw 权重，垫图，再 chaos 进行微调，但只能有点相似，细看还是有区别的，做不到一模一样（有个插件可以进行换脸，名字叫 InsightFaceSwap）。
    但可以使用一些命令，在同一张图中，生成相似的图如：
    4 panels withdifferent poses （可以生成 4 个不同表情）

character sheet（可以生成一组相似动漫角色）：

    three views of an image, generate three views, namely the front view, the side view, and the back view. （三视图，还是需要垫一张三视图，效果才会出来）
    /blend (混合)
    使用方式，输入框中输入“/blend” 。该命令下，可以上传 2-5 张图像，并将它们合并成一个新的图像。

例如上传一张空鱼缸图片和一张金鱼，就可以生成一张有鱼的鱼缸。

    tile (无缝贴图)
    使用方式“--tile ” ，可用作重复拼贴的图像，创建壁纸或纹理的无缝图案。适用于模型版本 v 1、2、3 和 5。

    video (动画)
    使用方式“--video” ，用于获取图像生成的过程动画，效果如下

    {} (排列组合)
    使用方式，例 {red,yellow} ，可以修改部分关键词的同时，快速创建多次作业最多可以创建 40 个作业。
    假如我们要生成三张不同颜色的花，正常需要输入三组命令：

a red flower.
a green flower.
a yellow flower.

    这里只需要输入：
    a {red, green, yellow} flower
    则会生成三组图片；也可用于尺寸 ar、模型版本、艺术风格等，如：
    --ar {3:4,16:9} --v {3,4,5,niji} --s {50,250,750} --iw {.5,1.5,2}
    或者组合使用，如：
    Prompt: a {red, green, yellow} flower. --ar {3:4,16:9} --s {50,100}
    或 Prompt: A {girl,boy,cat} is standing in the {classroom,bedroom} --ar {3:4,16:9} --s {50,100,800}
    如何需要用到 2 个单词来形容一组画面，在排列组合里,可以用反斜杠“\”来分割，如下：
    Prompt: a {red,Cartoon \, yellow} flower.
    则会生成一朵红色花，和一黄色卡通花：

    /prefer suffix (默认后缀)
    使用方式，输入框输入“/prefer suffix” ，指定文字或命令，添加到关键词末尾，再次输入“/prefer suffix”，取消设置。可以定义每次出图的后缀。

    如输入关键词，Prompt: a cat. 则会自动加上后缀：
    Prompt: a cat, 8k, high detail. --ar 3:4
    /settings 可以看到我们设置默认后缀，如下图：

    缺点:但不能在关键词后加入任何命令，如“a cat. --s 200”,否则无法出图。
    群里看到很多人遇到过，明明关键词没问题，别人都正常出图，就自己不行，这里可能就是自己不小心误操作，设置了默认后缀。
    因为我们的 MJ 默认命令只能在最后，如果你加入了“--s 250”，那出来的结果关键词就是 --s 250 8k,high detail,则不能识别。
    /prefer option set (预设)
    上面的方式局限性比较大，但我们还可以用预设来方便我们生成图片。使用方式，输入框输入“/prefer suffix”
    创造一个预设，option 设置名称，如 fg1(风格 1，可以自定义习惯的英文，或者贴合 mj，如 P、K)，value 类型里写--s 250 --ar 3:4。

    这样只要后缀输入我们预设，则会自动加上设置的后缀命令，使用方法：
    Prompt: a cat --fg1 = Prompt: a cat --s 250 --ar 3:4
    可以创建多个预设，省去输入的时间。
    注：最多可以设置 20 个预设， /prefer option list 可以查看所有预设。
    四、延展
    Midjourney 会员购买：
    访问官网，或者输入框输入“/info” ，回车后打开得到的链接。点击右侧的 Manage Sub（订阅管理）。

会有三中类型的会员选择，10 美刀可以生成大约 200 张图片，30 美刀可以生成越 1000 张，这里推荐个人买 30 刀的，公司可以买 60 刀的，可以支持 Relaxed 模式，无限低速模式出图，下图为各类型的区别：

关于支付方式，之前支持银联的信用卡，目前有的人已经不行了，推荐使用 visa，国内的 visa 卡就行，有信用卡的小伙伴可以直接再申请一张免年费的单币 visa 卡。

    最后给大家推荐几个网站。
    由于 Midjourney 生成的尺寸大小有限制，通常默认 1024*1024，或者 2048*2048，图为官方尺寸示意：

    如果想要图片分辨率变得更大，则可以下面两个网站。
    https://bigjpg.com/：每月免费次数 20 张，支持 png。付费用户可以使用 8 倍和 16 倍放大，最低 500 张每个月。
    https://www.upscayl.org/：免费、本地，适用于公司设计稿不能对外发的场景。
    素材管理软件，除了我们常用的 Eagle，也可以使用 Billfish（免费）和 Connecter（免费）。其中 Connecter 本地目录，不创建文件夹，可预览图片或 3d 文件格式，如 psd、tiff 和 c4d、max 等等。

Connecter 也可以快速预览多个文件，如果我们有很多个文件夹，里面有若干个图片文件，这样就可以用软件，一键预览所有文件，更加方便我们找到素材，我这里做了个示意动画：

    有一些 logo 或图标，格式是 jpg 或者 png 格式。可以使用 https://vectorizer.ai/ 快速图片转矢量。
    快速抠图网站：
    https://pixian.ai/
    https://www.remove.bg/zh