关于 FLUX.1
由「Stable Diffusion」的开发者创办的 Black Forest Lab 黑森林实验室,最近推出了一款令人兴奋的文生图模型——「FLUX.1」。这款新模型支持中文输入,并展现了卓越的语言理解和文本控制能力。FLUX.1 提供了三种不同的图片生成模型,其中两种是开源的,为不同用户提供了多种选择。
FLUX.1 模型概述
- FLUX.1 [pro]:闭源版本,需通过 API 调用,适合专业用户。
- FLUX.1 [dev]:开发版模型,采用非商业许可开源,适合开发者和个人使用。
- FLUX.1 [schnell]:基础版精简模型,运行速度快,使用 Apache 2 许可证,支持商业用途。
模型性能对比
我们对 FLUX.1 Pro 与 Midjourney 最新的 v6.1 模型进行了对比。虽然 FLUX.1 在艺术风格和多样性上不及 Midjourney,但在图像清晰度、细节真实感和复杂场景生成方面,FLUX.1 Pro 的表现与 v6.1 不相上下,甚至在一些方面超越了 v6.1。特别是在处理复杂英文文本、多人的场景和提示词理解上,FLUX.1 Pro 的表现显著优于 v6.1。FLUX.1 Pro 能够准确处理多人场景,避免面部和手部的细节失真,生成超长文本时内容和排版都非常标准,同时有效防止提示词泄露问题。
一键整合包
「FLUX.1」一键整合包基于 Stable Diffusion WebUI forge,使用 nf4 量化版轻量模型。与 nf8 模型相比,nf4 在更小体积下实现了更好的生成效果。经过实测,使用 6G 显存可流畅运行,生成一张图片大约需要 30 秒。下载后,只需解压并运行 “启动webui.bat” 文件,即可自动跳转到 webui 界面。然后选择 FLUX.1 的 nf4 模型进行生成。
在线体验
如果你的电脑配置无法支持「FLUX.1」模型,你仍然可以通过在线平台体验这款文生图工具。无论是 pro、dev 还是 schnell 版本,你都可以输入文本内容,设置图像比例,生成所需的图片。
在线体验:
https://replicate.com/black-forest-labs