市面上的AI图片生成工具太多,听起来都差不多,到底哪个好用?很多人看了一堆推荐,结果还是不知道怎么选。这篇笔记不讲废话,直接告诉你几个主流工具的特点、适合谁用、花多少钱,帮你做决定。

Midjourney:艺术感和图片质量的标杆
如果你追求图片效果,希望生成的东西有独特的艺术风格,那Midjourney基本是首选。 它生成的图片在构图、光影和细节上常常让人惊讶,有很强的“作品感”,而不是简单的“AI生成图”。很多专业设计师和艺术家都用它来找灵感或者直接创作。
但是,它的缺点也很明显。
第一,操作麻烦。Midjourney没有自己的网站或软件,你必须通过一个叫Discord的聊天软件来使用。 整个过程就像跟一个机器人聊天,你要输入文字指令,然后机器人在对话框里给你发图片。 这个流程对新手来说很不直观,需要花时间适应。
第二,不便宜,而且已经没有免费试用了。 想要用就必须付费。它的套餐分好几个等级,最基础的每月10美元,能生成的图片数量有限。 如果你要大量使用,或者想让图片生成速度快一点,就需要买更贵的套餐,比如每月30美元的标准版。 对于专业用户,还有60美元和120美元的套餐。
第三,隐私问题。在便宜的套餐里,你生成的所有图片都是公开的,任何人都能在Midjourney的社区里看到。 如果你想让自己的作品保密,就必须买更贵的专业版(Pro Plan)套餐,这个套餐里才有“隐身模式”(Stealth Mode)。
简单来说,如果你是专业人士,或者对图片质量有很高的要求,愿意花钱并且能接受它那个有点怪的操作方式,那就选Midjourney。对于只是想随便玩玩的人来说,它可能不是最合适的。
Stable Diffusion:最自由,也最复杂
Stable Diffusion和Midjourney完全是两种思路。它是一个开源模型,意思是任何人都可以免费下载和使用它的核心代码。 这带来了巨大的灵活性。
它的最大优点是自由度高。你可以把它部署在自己的电脑上运行,完全免费,想生成多少张就生成多少张。 因为是开源的,全世界的开发者都在为它做贡献,所以出现了很多针对特定风格的“微调模型”(Fine-tuned Models)。 比如,你想生成逼真的亚洲人像,或者二次元动漫风格,都可以找到专门优化过的模型来用,效果比通用模型好得多。
但是,自由的代价就是复杂。要在自己电脑上运行Stable Diffusion,对电脑配置有要求,特别是显卡。而且安装和配置的过程对不懂技术的人来说是个不小的挑战。
当然,你也可以不用自己部署。现在有很多网站和服务都集成了Stable Diffusion,让你可以在网页上直接用,降低了使用门槛。 比如DreamStudio就是官方提供的一个平台。 这些服务通常会提供一些免费额度,用完之后再付费购买点数。
另一个需要注意的点是版权。因为很多社区训练的模型用的图片数据来源不明,可能会有版权争议,如果你打算把生成的图片用于商业用途,需要特别小心。
总结一下,如果你喜欢折腾,有一定的技术基础,想完全控制生成过程,或者预算有限,那Stable Diffusion是你的不二之选。 如果你只是想简单快速地出图,最好还是用那些商业化的工具。
DALL-E 3 和 Microsoft Copilot (Bing Image Creator):最容易上手,整合度高
DALL-E 3是开发ChatGPT的公司OpenAI做的图片生成模型。 它最大的特点是和ChatGPT以及微软的产品深度整合。
如果你已经是ChatGPT Plus(付费版)的用户,那么你就可以直接在和ChatGPT对话的窗口里让它生成图片,每月20美元的订阅费就包含了这个功能。 这种体验很流畅,你用自然语言描述画面,它就能理解并画出来。DALL-E 3对自然语言的理解能力很强,你说得越具体,它生成的结果就越接近你的想法。
如果你不想花钱,也有办法免费用上DALL-E 3的核心技术。微软的Copilot(以前叫Bing Image Creator)就免费集成了DALL-E 3模型。 你只需要一个微软账户,就能在Copilot的网页或Edge浏览器里免费生成图片。 每天会有一些“加速点数”,用完了速度会变慢,但仍然可以继续使用。
它的优点是简单直接。 不需要任何复杂的设置,打开网页就能用,对新手非常友好。生成的图片质量也很不错,虽然可能在艺术感上比不上Midjourney的顶级水平,但对于日常使用,比如做个PPT配图、博客插图或者社交媒体图片,完全足够了。
缺点是可控性比较差。你基本只能通过修改文字描述来调整图片,没有太多高级选项给你设置。
所以,如果你是ChatGPT的付费用户,或者只是想找一个免费又好用的工具,偶尔做几张图,那直接用Copilot就行了。
Leonardo.Ai:游戏美术师的最爱
Leonardo.Ai是这几年冒出来的一个很强的竞争者,很多人觉得它的图片质量可以和Midjourney媲美。 这个平台一开始就瞄准了游戏开发和概念艺术领域,所以在生成角色、道具、场景这些游戏素材方面特别出色。
和Midjourney不同,Leonardo.Ai有自己的网站,操作界面很直观。 它和Stable Diffusion有点像,也提供了很多训练好的模型让你选,比如照片写实、动漫、像素艺术等风格。
它最强大的功能之一是“训练你自己的模型”。 你可以上传几十张自己喜欢的图片,让AI学习这种风格,然后用这个专属模型来生成图片。 这对于需要保持风格一致性的项目,比如一个游戏或者一套插画,非常有用。
Leonardo.Ai每天会给免费用户一些点数(tokens),大概能生成几十张图,对于普通用户来说够用了。 如果你需要更多,也可以付费升级。
总的来说,如果你是游戏设计师、概念艺术家,或者希望对生成风格有更强的控制力,甚至想训练自己的专属模型,Leonardo.Ai是个非常值得尝试的工具。
Ideogram:最擅长在图片里加文字
大部分AI图片生成工具都有一个共同的毛病:不识字。你让它在图片里生成一行字,出来的结果基本都是拼写错误或者乱码。Ideogram就是为了解决这个问题出现的。
它在生成包含文字的图片方面,比其他所有工具都强。 比如你想设计一个海报、Logo或者T恤图案,上面需要有清晰、准确的文字,那Ideogram是目前最好的选择。
它的操作也很简单,有一个免费套餐,每天可以生成一些图片,不过生成速度会慢一点,而且图片是公开的。 付费后可以享受更快的速度和隐私保护。Ideogram由一些前Google Brain的研究人员创立,技术实力很强。
如果你有在图片里加文字的强需求,那就不用犹豫了,直接试试Ideogram。
怎么选?一个简单的决策流程
- 追求极致艺术效果和图片质量? 选 Midjourney。前提是你不差钱,也不怕麻烦。
- 喜欢自己动手,想要最大自由度和免费? 选 Stable Diffusion。前提是你得有点技术基础,并且不介意花时间研究。
- 完全的新手,想免费、简单地生成图片? 用微软的 Copilot (Bing Image Creator)。
- 你是ChatGPT付费用户? 直接在ChatGPT里用 DALL-E 3 就行了。
- 做游戏设计或需要训练特定风格的模型? 试试 Leonardo.Ai。
- 需要在图片里加上漂亮的文字? Ideogram 是你的首选。

技能提升网