哪个AI可以生成图片？一篇笔记让你选对工具！

市面上的AI图片生成工具太多，听起来都差不多，到底哪个好用？很多人看了一堆推荐，结果还是不知道怎么选。这篇笔记不讲废话，直接告诉你几个主流工具的特点、适合谁用、花多少钱，帮你做决定。

Midjourney：艺术感和图片质量的标杆

如果你追求图片效果，希望生成的东西有独特的艺术风格，那Midjourney基本是首选。它生成的图片在构图、光影和细节上常常让人惊讶，有很强的“作品感”，而不是简单的“AI生成图”。很多专业设计师和艺术家都用它来找灵感或者直接创作。

但是，它的缺点也很明显。

第一，操作麻烦。Midjourney没有自己的网站或软件，你必须通过一个叫Discord的聊天软件来使用。整个过程就像跟一个机器人聊天，你要输入文字指令，然后机器人在对话框里给你发图片。这个流程对新手来说很不直观，需要花时间适应。

第二，不便宜，而且已经没有免费试用了。想要用就必须付费。它的套餐分好几个等级，最基础的每月10美元，能生成的图片数量有限。如果你要大量使用，或者想让图片生成速度快一点，就需要买更贵的套餐，比如每月30美元的标准版。对于专业用户，还有60美元和120美元的套餐。

第三，隐私问题。在便宜的套餐里，你生成的所有图片都是公开的，任何人都能在Midjourney的社区里看到。如果你想让自己的作品保密，就必须买更贵的专业版（Pro Plan）套餐，这个套餐里才有“隐身模式”（Stealth Mode）。

简单来说，如果你是专业人士，或者对图片质量有很高的要求，愿意花钱并且能接受它那个有点怪的操作方式，那就选Midjourney。对于只是想随便玩玩的人来说，它可能不是最合适的。

Stable Diffusion：最自由，也最复杂

Stable Diffusion和Midjourney完全是两种思路。它是一个开源模型，意思是任何人都可以免费下载和使用它的核心代码。这带来了巨大的灵活性。

它的最大优点是自由度高。你可以把它部署在自己的电脑上运行，完全免费，想生成多少张就生成多少张。因为是开源的，全世界的开发者都在为它做贡献，所以出现了很多针对特定风格的“微调模型”（Fine-tuned Models）。比如，你想生成逼真的亚洲人像，或者二次元动漫风格，都可以找到专门优化过的模型来用，效果比通用模型好得多。

但是，自由的代价就是复杂。要在自己电脑上运行Stable Diffusion，对电脑配置有要求，特别是显卡。而且安装和配置的过程对不懂技术的人来说是个不小的挑战。

当然，你也可以不用自己部署。现在有很多网站和服务都集成了Stable Diffusion，让你可以在网页上直接用，降低了使用门槛。比如DreamStudio就是官方提供的一个平台。这些服务通常会提供一些免费额度，用完之后再付费购买点数。

另一个需要注意的点是版权。因为很多社区训练的模型用的图片数据来源不明，可能会有版权争议，如果你打算把生成的图片用于商业用途，需要特别小心。

总结一下，如果你喜欢折腾，有一定的技术基础，想完全控制生成过程，或者预算有限，那Stable Diffusion是你的不二之选。如果你只是想简单快速地出图，最好还是用那些商业化的工具。

DALL-E 3 和 Microsoft Copilot (Bing Image Creator)：最容易上手，整合度高

DALL-E 3是开发ChatGPT的公司OpenAI做的图片生成模型。它最大的特点是和ChatGPT以及微软的产品深度整合。

如果你已经是ChatGPT Plus（付费版）的用户，那么你就可以直接在和ChatGPT对话的窗口里让它生成图片，每月20美元的订阅费就包含了这个功能。这种体验很流畅，你用自然语言描述画面，它就能理解并画出来。DALL-E 3对自然语言的理解能力很强，你说得越具体，它生成的结果就越接近你的想法。

如果你不想花钱，也有办法免费用上DALL-E 3的核心技术。微软的Copilot（以前叫Bing Image Creator）就免费集成了DALL-E 3模型。你只需要一个微软账户，就能在Copilot的网页或Edge浏览器里免费生成图片。每天会有一些“加速点数”，用完了速度会变慢，但仍然可以继续使用。

它的优点是简单直接。不需要任何复杂的设置，打开网页就能用，对新手非常友好。生成的图片质量也很不错，虽然可能在艺术感上比不上Midjourney的顶级水平，但对于日常使用，比如做个PPT配图、博客插图或者社交媒体图片，完全足够了。

缺点是可控性比较差。你基本只能通过修改文字描述来调整图片，没有太多高级选项给你设置。

所以，如果你是ChatGPT的付费用户，或者只是想找一个免费又好用的工具，偶尔做几张图，那直接用Copilot就行了。

Leonardo.Ai：游戏美术师的最爱

Leonardo.Ai是这几年冒出来的一个很强的竞争者，很多人觉得它的图片质量可以和Midjourney媲美。这个平台一开始就瞄准了游戏开发和概念艺术领域，所以在生成角色、道具、场景这些游戏素材方面特别出色。

和Midjourney不同，Leonardo.Ai有自己的网站，操作界面很直观。它和Stable Diffusion有点像，也提供了很多训练好的模型让你选，比如照片写实、动漫、像素艺术等风格。

它最强大的功能之一是“训练你自己的模型”。你可以上传几十张自己喜欢的图片，让AI学习这种风格，然后用这个专属模型来生成图片。这对于需要保持风格一致性的项目，比如一个游戏或者一套插画，非常有用。

Leonardo.Ai每天会给免费用户一些点数（tokens），大概能生成几十张图，对于普通用户来说够用了。如果你需要更多，也可以付费升级。

总的来说，如果你是游戏设计师、概念艺术家，或者希望对生成风格有更强的控制力，甚至想训练自己的专属模型，Leonardo.Ai是个非常值得尝试的工具。

Ideogram：最擅长在图片里加文字

大部分AI图片生成工具都有一个共同的毛病：不识字。你让它在图片里生成一行字，出来的结果基本都是拼写错误或者乱码。Ideogram就是为了解决这个问题出现的。

它在生成包含文字的图片方面，比其他所有工具都强。比如你想设计一个海报、Logo或者T恤图案，上面需要有清晰、准确的文字，那Ideogram是目前最好的选择。

它的操作也很简单，有一个免费套餐，每天可以生成一些图片，不过生成速度会慢一点，而且图片是公开的。付费后可以享受更快的速度和隐私保护。Ideogram由一些前Google Brain的研究人员创立，技术实力很强。

如果你有在图片里加文字的强需求，那就不用犹豫了，直接试试Ideogram。

怎么选？一个简单的决策流程

追求极致艺术效果和图片质量？ 选 Midjourney。前提是你不差钱，也不怕麻烦。
喜欢自己动手，想要最大自由度和免费？ 选 Stable Diffusion。前提是你得有点技术基础，并且不介意花时间研究。
完全的新手，想免费、简单地生成图片？ 用微软的 Copilot (Bing Image Creator)。
你是ChatGPT付费用户？ 直接在ChatGPT里用 DALL-E 3 就行了。
做游戏设计或需要训练特定风格的模型？ 试试 Leonardo.Ai。
需要在图片里加上漂亮的文字？ Ideogram 是你的首选。

哪个AI可以生成图片？一篇笔记让你选对工具！

Midjourney：艺术感和图片质量的标杆

Stable Diffusion：最自由，也最复杂

DALL-E 3 和 Microsoft Copilot (Bing Image Creator)：最容易上手，整合度高

Leonardo.Ai：游戏美术师的最爱

Ideogram：最擅长在图片里加文字

怎么选？一个简单的决策流程

AI老卡

相关推荐

评论抢沙发

最新文章

最新提问

切换注册登录

切换登录注册

Midjourney：艺术感和图片质量的标杆

Stable Diffusion：最自由，也最复杂

DALL-E 3 和 Microsoft Copilot (Bing Image Creator)：最容易上手，整合度高

Leonardo.Ai：游戏美术师的最爱

Ideogram：最擅长在图片里加文字

怎么选？一个简单的决策流程

AI老卡

相关推荐

评论 抢沙发

最新文章

最新提问

切换注册登录

切换登录注册

评论抢沙发