欢迎光临
我们一直在努力

什么AI可以生成图片?这几个工具帮你实现创意!

现在想用AI搞点图出来,其实门槛已经很低了。市面上一堆工具,有些点几下鼠标就能用,效果还好得出奇。关键是要知道哪个适合你,以及怎么跟它“说话”才能得到你想要的东西。

Midjourney:效果为王,但有点“怪癖”

先说Midjourney,这家伙绝对是目前图片生成领域的头牌之一。它生成的图片质量和艺术感,很多时候真的能以假乱真,特别是那种充满想象力的画面,效果很惊艳。

但是,它用起来稍微有点麻烦。你得先有个Discord账号,然后加入它的官方服务器才能开始玩。 这对不熟悉Discord的人来说,可能得先研究一下那个软件。

用起来的流程大概是这样的:

  1. 加入服务器:先注册并登录Discord,然后通过邀请链接加入Midjourney的服务器。
  2. 找到“新手村”:进去之后,左边会有一列频道,找一个名字类似“newbies”的频道点进去。 这里就是大家一起“施法”的地方,你能看到别人发的指令和AI生成的图。
  3. 开始写指令:在聊天框里,输入 /imagine ,然后按一下回车,后面就会出现一个 prompt 的框。你就在这个框里用英文单词或短句描述你想要的画面,然后发送。 比如,你想画“一只穿着宇航服的猫在月球上喝牛奶”,就可以写“a cat in astronaut suit, drinking milk on the moon”。
  4. 选图和优化:发送后,机器人会很快给你四张草图。图片下方有两排按钮,U1到U4代表放大第一到第四张图,V1到V4代表以第一到第四张图为基础,再生成四张风格类似的。 如果你对其中一张比较满意,就点对应的U按钮把它放大,得到一张更高清的大图。如果觉得大方向对了,但还想再多看几个版本,就点V按钮。

用Midjourney的关键在于把你的想法拆解成精准的关键词。比如你想让画面有电影感,就可以加上“cinematic lighting”(电影感灯光);想要某个艺术家的风格,可以直接写上“in the style of Van Gogh”(梵高风格)。多用描述性的词,AI才能更好地理解你。

虽然现在也有网页版了,操作更直观了一些,但核心还是没变:用文字和AI沟通。 它没有免费试用,想用就得付费。

Stable Diffusion:技术宅的“核武器”,完全免费但折腾

如果你喜欢自己动手,想完全控制整个过程,而且不想花钱,那Stable Diffusion就是你的菜。它是开源的,意思是你可以在自己的电脑上部署和运行,完全免费。

Stable Diffusion最大的好处就是自由度。你可以加载各种社区大神训练好的模型(Model),这些模型专门用来生成特定风格的图片,比如二次元、写实照片、水墨画等等。有了这些模型,你就能很轻松地生成特定领域的专业级图片。

但是,自由的代价就是折腾。在自己电脑上安装Stable Diffusion需要一些技术基础:

  1. 硬件要求:首先你得有一张不错的NVIDIA显卡,显存至少要8GB以上,不然跑起来会很慢或者直接跑不动。
  2. 安装环境:需要安装Python、Git这些编程工具,并且按照教程一步步配置好环境。
  3. 下载和运行:从GitHub上下载Stable Diffusion WebUI(这是一个方便操作的图形界面),然后下载你喜欢的模型文件,放到指定的文件夹里,最后通过命令行启动。

整个过程对于新手来说,跟着教程走也可能会遇到各种报错,需要点耐心去解决。

一旦部署好了,用起来就简单多了。它的界面叫WebUI,就是一个网页。 你在网页的输入框里写提示词(Prompt)和反向提示词(Negative Prompt)。提示词就是你想要画面里出现的东西,反向提示词就是你不希望出现的东西,比如“畸形的手”、“多余的手指”这些。 然后调整一下图片尺寸、采样步数之类的参数,点一下“生成”按钮就行了。

Stable Diffusion还有一个强大的功能叫“图生图”(img2img)。 你可以上传一张自己的照片或者草图,然后用文字描述你想怎么修改它,AI就会在你原图的基础上进行创作。

总的来说,Stable Diffusion适合爱折腾、有一定技术基础,并且追求高度自定义和免费的用户。

DALL-E 3:最会“理解人话”的工具,简单易用

DALL-E 3是开发ChatGPT的公司OpenAI搞出来的东西。 它最大的特点就是对自然语言的理解能力特别强。 你不用像玩Midjourney那样费劲去凑关键词,直接像平时说话一样,用一个完整的句子描述你的想法,它就能给你生成很不错的图片。

比如,你可以直接对它说:“画一个小孩在雨后的街道上踩水坑,水花溅起来的样子要很开心,风格要像日本动画电影。”它能准确理解这里面的场景、情绪和风格要求。

目前用DALL-E 3最方便的渠道就是通过ChatGPT Plus。如果你是付费会员,在GPT-4模型下就可以直接让它画图。 另外,微软的作图工具现在也用了DALL-E 3的技术,有些可以免费使用。

怎么用呢?超级简单:

  1. 打开对话框:在支持DALL-E 3的平台(比如ChatGPT Plus),直接打开对话框。
  2. 描述画面:像聊天一样,输入你想画的内容。说得越具体,效果越好。
  3. 生成和调整:AI会生成几张图片让你选。 如果不满意,你可以继续跟它对话来调整,比如“让天空再蓝一点”或者“把主角换成一个小女孩”。

DALL-E 3特别适合那些不想研究复杂指令,只想快速把脑子里想法变成现实的用户。它的出图质量也很高,尤其是在生成带有准确文字的图片方面,比很多工具要强。

Leonardo.Ai:游戏美术师的好帮手,还带社区

Leonardo.Ai这个工具,一开始主要是面向游戏开发者的,用来生成游戏里的各种素材,比如角色、道具、场景之类的。 但现在也发展成了一个功能很全面的图片生成平台。

它最大的优点是把很多功能都集成在了一个网站上,操作很直观。 你不需要在Discord里操作,直接在网页上就能完成所有事。而且它有免费额度,每天会给你一些点数(Tokens),用完了第二天又会补充,对于轻度用户来说基本够用。

Leonardo.Ai有几个很有意思的功能:

  • 社区模型:平台上有很多用户训练和分享的模型,你可以直接用别人的模型来生成特定风格的图片。
  • AI画布(AI Canvas):这是一个强大的在线编辑工具,你可以在一张画布上无限扩展你的图片,或者局部修改画面的某个部分,AI会自动帮你衔接好。
  • 训练自己的模型:你可以上传几十张自己画的图或者特定风格的图片,让Leonardo帮你训练一个专属的模型。以后你就能用这个模型稳定地生成同样风格的图片了。

使用Leonardo.Ai的步骤也很清晰:

  1. 注册登录:用邮箱或者谷歌账号就能直接注册登录。
  2. 选择模型:在主页上选择一个官方提供的基础模型,或者去社区里找一个你喜欢的风格模型。
  3. 输入指令生成:在图片生成页面,输入你的提示词,选择图片数量和尺寸,然后点击生成。 它也支持反向提示词。

总的来说,Leonardo.Ai对新手很友好,功能又多又强大,还有免费额度可以玩,是一个非常值得尝试的工具。

赞(0)
分享到

评论 抢沙发

登录

找回密码

注册