AI图像生成这东西听起来很玄乎,但用起来其实就那么几步。很多人觉得需要懂代码或者会画画才行,其实完全不是那么回事。说白了,你只要会打字,就能让AI给你画画。
先搞明白AI画画是怎么回事
你可能听过Midjourney、Stable Diffusion这些名字,它们就是现在很火的AI绘画工具。这些工具的原理,简单说就是你给它一句话,它根据这句话生成一张图片。

这句话,在圈子里叫“提示词”(Prompt)。比如,你输入“一只戴着墨镜的猫,坐在沙滩上喝汽水”,AI就会努力理解你的意思,然后画出对应的图像。它能画成什么样,完全取决于你给它的指令有多具体。
这背后是一套复杂的算法,叫“扩散模型”(Diffusion Model)。你可以把它想象成一个学了海量图片的学生。它先是把无数张清晰的图片打上马赛克,弄成一堆噪点,然后再学习怎么把这些噪点还原成清晰的图片。学得多了,它就掌握了从一堆随机噪点中“创造”出全新图像的能力。你给的提示词,就是告诉它你想让这堆噪点最终变成什么样子。
选哪个工具?
市面上工具很多,免费的、收费的都有。新手入门,没必要一下子就上最专业的,先找个顺手的玩起来。
1. Midjourney:效果好,但要花钱
Midjourney是目前公认的、出图效果最惊艳的工具之一,尤其是在艺术感和细节处理上。它生成的图片通常都很好看,很有风格。
但是,它现在已经没有免费试用版了,必须付费订阅才能用。 它的使用方式也跟别的工具不太一样,需要通过一个叫Discord的聊天软件来操作。你得先注册一个Discord账号,然后加入Midjourney的官方服务器,在指定的聊天频道里输入指令来生成图片。 整个过程对于新手来说,可能稍微有点绕。
2. Stable Diffusion:免费、强大,但折腾
Stable Diffusion是开源的,意思就是你可以免费下载模型,在自己的电脑上运行。这是它最大的优点,自由度极高,网上有无数别人训练好的模型(叫Checkpoints或LORA),可以生成各种特定风格的图片,比如二次元、写实、水墨画等等。
缺点也很明显:对电脑配置有要求。你的电脑最好有一张不错的独立显卡,不然出图速度会很慢,甚至跑不起来。 安装和配置也需要花点时间,对于不爱折腾的人来说,这可能就是个门槛。当然,现在也有很多网站提供了在线版的Stable Diffusion,可以直接在网页上用,有些是免费的,有些要按量收费,这倒是省去了本地部署的麻烦。
3. DALL-E 3:集成在ChatGPT里,简单直接
DALL-E 3是OpenAI开发的产品,现在直接集成到了付费版的ChatGPT Plus里面。它的最大好处是理解能力超强。你不用像用Midjourney那样去凑各种复杂的关键词,直接用大白话跟它说就行。
比如,你可以直接说:“帮我画一张图,一个宇航员在土星环上悠闲地钓鱼,背景是深邃的宇宙和遥远的地球。”它能很好地理解这种复杂的场景描述。对于想快速把想法变成图片,又不想花时间研究提示词技巧的人来说,DALL-E 3很合适。
给新手的建议:
- 如果你愿意花点小钱,追求最好的出图质量和艺术感,可以试试Midjourney。
- 如果你不介意折腾,电脑配置又还行,或者想体验各种风格的模型,那就玩Stable Diffusion。
- 如果你已经是ChatGPT Plus用户,或者想用最自然、最简单的方式跟AI沟通,那直接用DALL-E 3就行了。
- 除此之外,还有很多免费的网页工具,比如Leonardo.Ai、SeaArt等,它们通常每天会提供一定的免费额度,足够新手尝鲜了。
核心步骤:怎么写提示词(Prompt)?
选好工具后,就到了最关键的一步:写提示词。这是决定你图片质量的核心。AI不是你肚子里的蛔虫,你必须把话说清楚,它才能画出你想要的东西。
一个好的提示词,通常包含下面几个部分,你可以像搭积木一样把它们组合起来。
公式:主体 + 细节 + 环境 + 风格
1. 主体(Subject): 你要画什么?这是最基本的部分。
例子: “a girl”(一个女孩)、“a dragon”(一条龙)、“a futuristic city”(一座未来城市)。
2. 细节(Details): 主体长什么样?有什么特征?在做什么?
例子: “a girl with long blue hair, wearing a red dress”(一个长着蓝色头发、穿着红色连衣裙的女孩)。
例子: “a majestic dragon with golden scales, breathing fire”(一条雄伟的金鳞巨龙,正在喷火)。
3. 环境(Environment/Scene): 主体在什么地方?背景是什么?
例子: “in a dark forest at night”(在夜晚的黑暗森林里)。
例子: “on top of a skyscraper, overlooking the city at sunset”(在摩天大楼的顶上,俯瞰日落时的城市)。
4. 风格(Style/Art Form): 你希望这张画是什么风格的?
例子: “Studio Ghibli style”(吉卜力工作室风格)、“cyberpunk”(赛博朋克)、“oil painting”(油画)、“realistic photo”(写实照片)。
把这些组合起来,就是一个比较完整的提示词了。
完整例子:
“A girl with long blue hair, wearing a red dress, standing in a dark forest at night, Studio Ghibli style.”
(一个长着蓝色头发、穿着红色连衣裙的女孩,站在夜晚的黑暗森林里,吉卜力工作室风格。)
你看,这样一来,AI得到的信息就非常具体,生成的图片也更容易接近你的想象。
一些让图片变更好的小技巧
掌握了基本公式,你就可以开始尝试一些进阶技巧了。
1. 使用“权重”调整
有时候,你希望提示词里的某个元素更突出一些。在Midjourney或Stable Diffusion里,你可以给关键词加上权重。
- 在Midjourney里,你可以用
::符号。比如hot dog::2就会让“热狗”这个词的权重加倍,AI会更关注它。 - 在Stable Diffusion里,通常用括号和冒号。比如
(red dress:1.3)意思就是把“红色连衣裙”的权重增加30%。多加几层括号,比如((red dress)),也能起到加权的效果。
2. 善用“负面提示词”(Negative Prompt)
除了告诉AI你想要什么,你还可以告诉它你不想要什么。这就是负面提示词的作用。这对于规避一些常见的AI绘画错误(比如画出手指出问题、画面畸形等)很有用。
几乎所有的AI绘画工具都有一个专门的负面提示词输入框。你可以在里面填上:
低质量词汇: low quality, worst quality, blurry, jpeg artifacts (低质量,最差质量,模糊,JPEG压缩痕迹)
不想要的内容: ugly, deformed, extra limbs, extra fingers (丑陋,畸形,多余的肢体,多余的手指)
不想要的风格: cartoon, anime (如果你想要写实风格,就可以把卡通和动漫排除掉)
加上负面提示词,能有效提高出图的成功率。
3. 控制构图和镜头
想让你的图片更有电影感?可以试试加入一些摄影术语。
- 视角:
from above(俯视),from below(仰视),eye-level shot(平视)。 - 景别:
close-up shot(特写),medium shot(中景),full-body shot(全身),wide shot(远景)。 - 镜头类型:
85mm lens(85毫米镜头,常用于人像),wide-angle lens(广角镜头)。 - 光照:
cinematic lighting(电影光),dramatic lighting(戏剧性光照),rim light(轮廓光),soft light(柔光)。
例子:
“Close-up shot of a detective in a dimly lit office, dramatic lighting, rain streaking down the window, realistic photo, 85mm lens.”
(特写镜头,一个侦探在光线昏暗的办公室里,戏剧性的光照,雨水划过窗户,写实照片,85毫米镜头。)
这样的提示词,能让AI更精确地控制画面的构图和氛围。
不断修改和尝试
最后,也是最重要的一点:不要指望一次就能生成完美的图片。
AI绘画是一个不断尝试和调整的过程。你第一次生成的图片可能不理想,这很正常。你需要做的是:
- 固定随机种子(Seed): 大多数工具允许你使用同一个“随机种子”来生成图片。固定种子后,只要你的提示词不变,每次生成的图片都会基本一样。这样,你就可以在原有图片的基础上,微调你的提示词,看看哪个词的变化带来了你想要的效果。这对于学习和控制画面很有帮助。
- 图生图(Image-to-Image): 当你生成一张比较满意的图片后,可以用“图生图”功能。你把这张图作为“底稿”,再给一个新的提示词,让AI在这张图的基础上进行修改。比如,你可以给一个人物换身衣服,或者改变背景。
- 局部重绘(Inpainting): 如果你对一张图的某个局部不满意,比如脸画得不好,或者手上多了一根手指,可以用“局部重绘”功能。你把不满意的区域涂掉,然后输入新的提示词,只让AI重新绘制这个小区域,画面的其他部分保持不变。
说到底,用AI画画就像跟一个语言不通但很会画画的艺术家沟通。你需要耐心、清晰地表达你的想法,并且不断地给它反馈,直到它画出你心中的那幅画为止。这过程本身也挺有意思的。

技能提升网