Stable Diffusion

50 系显卡跑 sd1.5 的兼容性问题解决指南！

2025-11-20T15:21:01Z

由于 50 系显卡的架构是新架构，sd1.5 默认安装的依赖都是不兼容的，然后我就去 ai 解决，结果被人工智障（说的就是你 chatGPT ）忽悠了一晚上还没有解决兼容性问题，一直跟我胡扯一大堆没有的版本号 cu121 ，什么 sm89 sm128 的依赖，各种虚拟环境，全局环境都弄了一遍都没成功，最后把报错直接用搜索引擎搜，答案一下就出来了，我真的是服了。已经不想碰它了！！！解决地址：aHR0cHM6Ly93d3cuYmlsaWJpbGkuY29tL3ZpZGVvL0JWMWlxRU56TUVhTD92ZF9zb3VyY2U9ZDMwOTBkMTE1ZDBkMWZlNTY3ODAzZGExMzdlZGJmYmImc3BtX2lkX2Zyb209MzMzLjc4OC5wbGF5ZXIuc3dpdGNoJnRyYWNraWQ9d2ViX3JlbGF0ZWRfMC5yb3V0ZXItcmVsYXRlZC0yMjA2NDE5LTJrcXFxLjE3NjM2NTEyNjc3MDYuOTQ0

SD 要生成满意的图比我想象的难很多

2025-10-28T00:52:41Z

我的需求就是 1:1 复刻我喜欢的动漫角色，因此我一直对于那种写一些提示词，生成八竿子打不着的图片没有任何兴趣，也许对某些人的写文配图是有用的。SD 可以自己训练 lora 使我看到了福音，因此就尝试了一下。

第一步我只求还原度，跟原作一毛一样最好；第二步可以加些我想要的动作；第三步才是尝试 yellow 风。

但是现在第一步我都觉得相当难了，为了还原我都是用 SD1.5 ，配原版动漫截图，生成出来的效果还是不满意。

仔细想想，标签，图源，底模，提示词，采样方法那些杂七杂八的参数都会影响结果。随机性真是太大了，不愧是炼丹。我现在在想要不要放弃，这个学习成本都快赶上 3D 建模了。

[求解答] 学习 sd 等精确绘图是否已经过时？

2025-10-14T17:39:01Z

本人是即将步入研一的学生，专业遥感

因为很早以前就了解过 sd 、flux 、comfy ui 的复杂但精确的绘图，但是一直没有深入的学习。

也接触过豆包绘图、即梦、chatgpt4o 生图等“用嘴画图”。还有一些集成平台，比如哩布哩布。

之前有人说过没有一种画图方法比类似 sd 、flux 等精确提示词的画图方法好，因为他们一方面可以本地部署，隐私安全且可以生成自己想要的不用担心被拦截（比如涩涩），另一方面精确的指令可以精确画出画师心中理想的形象，而且还可以精细的改。这两条优势是没有其他渠道可以替代的。

但是随着 ai 画图技术的发展，似乎有人说用嘴改图会是未来的发展趋势，一定会替代 sd 等。

我对 ai 绘图很感兴趣，不知道想要实现辅助生成一些科研的插图或者示意图是否可以通过“用嘴画图”自然语言实现，还是说尽管现在自然语言画图蒸蒸日上但是还是有必要学习 sd 等精细画图？求大佬解答

ComfyUI 如何变现

2025-07-07T05:07:38Z

ComfyUI 两个半月，运营了两个小红书号，一个涨粉到 2500 ，另一个也有 500 多啦，现在已经能接些广告，不过活动还没结束，收益暂时没拿到。我还把学习 ComfyUI 的经验、总结整理成内容，发在微信公众号，目前积累了 400 左右粉丝。现在想探索更多变现路径，有没有过来人给支支招，或者交流下玩法呀

模型商用的定义是什么？

2025-05-13T06:30:58Z

最近看到 liblib 上有很多可以生成小红书风格图片的模型，并且小红书也会看到很多明显是 ai 生成的。但是我看模型一般都会标注禁止商用。这里我想问下关于模型商用的定义具体是什么呢？抛去最明显的售卖服务，或图片这种。用来经营小红书的这种算吗？还有用来生成小红书模特卖衣服的这种算吗？如果不是直接通过图片收益，带广告，带货这种又算吗？

文生图大模型都不是很大？

2025-03-08T02:47:11Z

浅搜了一下，比较大的模型好像就是 FLUX.1 12b Stable Diffusion 3.5 Large 8b

开源权重还有更大的吗

有办法通过给一幅人像，换成指定图片的服装吗？

2025-02-24T16:38:56Z

利用 Stable Diffusion ，有办法通过给一幅人像，换成指定的服装吗？也就是输入两张图（人+衣服），输出一张图。我看网上的教程基本都是：

Inpaint Anything：蒙版 + 衣服（文字提示）
ControlNet （ IP-Adapter ）：只能在文生图里，输入衣服图。

我希望：图生图中，输入：原图+衣服蒙版+衣服参考图。

有大佬了解这个吗？

一个基于 SDXL 的可以生成 Apple 风格 emoji 的模型

2025-01-01T07:13:12Z

https://huggingface.co/fofr/sdxl-emoji

可以在这个 space 里直接试用：

https://huggingface.co/spaces/feuer33/Apple_Memoji

触发词是 a TOK emoji of

比如用这样的提示词：

a TOK emoji of owl

得到的结果：

也可以在本地用 gradio 直接跑起来。

macOS Stable Diffusion ？

2024-11-13T17:40:29Z

请问 m3 16G 能搞 sd 吗？会不会超级卡 sd 的 macos 版本跟 win 有区别吗？

Stable Diffusion 自建共享站

2024-11-09T10:52:46Z

https://sd.hanh.me/?__theme=dark

轻度试用 o 大佬们，请不要修改一些配置和重启 ui

轻度炼丹，佛佛佛。。

分享 GPT-4o mini 和 Stable Diffusion 3 等模型白嫖网站

2024-11-03T01:16:23Z

目的

为了拉点人头，每位邀请人和被邀请人都能获得 150 电量（电量是使用模型的基础）。

支持的模型

GPT-4o mini: 1 电量 = 1 次提问
Claude 3.5 Sonnet: 3 电量 = 1 次提问
GPT 4o: 4 电量 = 1 次提问
GPT 4: 20 电量 = 1 次提问
Stable Diffusion 3: 0 电量 = 1 次提问（尝试其他 prompt 需要 2 电量）
Claude 3.5 3K Token: 0 电量 = 1 次提问

特色

支持私有机器人，添加 10 个以内的知识库，选择不同模型预设 Prompt 。
每月送高级月卡，高级月卡每天 210 电量，低于 210 电量每小时加 8 电量，相当于无限续杯了。
高级月卡——>app 商店——>奖励兑换——>当前赛季里面领取
还有其他高级玩法需要自己研究

注意事项

这是币圈的网站，积分每个赛季可以兑换成积分。不过现在可能晚了，主要是为了白嫖 GPT 。

点击这里访问 myshell

刚开发了个免费不限次数 Stable Diffusion 3.5 图片生成器

2024-10-26T10:53:56Z

最近 SD3.5 发布了，抽空做了个小站SD Image，免费生成 SD3.5 图像，欢迎使用。（还在持续开发中）网址：https://sdimage.net/

欢迎试用，反馈。(之前免费被黑客打了，产生了较高账单，这个加了限制，一个人每 1 分钟只能生成一张，看看能不能防护住哈哈)

做了一个 AI 图片站，最近比较热的 Stable Diffusion 3.5

2024-10-23T15:47:04Z

网址： https://stablediffusion35.org ，欢迎免费体验

求 AI 生图教程推荐, 以及学习路线 Stable Diffusion | Flux

2024-09-29T11:29:03Z

工作上要做 AI 生图相关的, 具体是做家装效果图生成. 搜了下相关教程, 有 Stable Diffusion 以及 Flux 模型, 还有很多插件要学习. 以及 Stable Diffusion Web UI 和 ComfyUI 界面.

请问各位大佬有没有系统化的学习路线, 或者推荐的课程与讲师? 感谢!

赐教: 可否通过本地 PC 替代云端实现 Stable Diffusion 生图，降低本？

2024-09-25T02:01:24Z

公司计划使用 Stable Diffusion 实现 AI 生图功能，但发现云服务器的成本较高，一年下来至少一万。相比之下，个人 PC 的配置似乎更划算。

我的设想是：当服务器需要处理 AI 生成图片时，可以将计算任务转交给本地 PC ，生成完成后再将结果上传至服务器。想请教大家，这种方案是否可行

另外，如果使用 32G/64G 内存的 Mac 来处理 Stable Diffusion 生成任务，在生图性能上相比 PC 有优势吗?

感谢各位大佬的建议和指导！

flux1 模型整个体验下来，感觉比 Stable Diffusion 和 Midjourney 都厉害-Flux1ai

2024-08-23T00:12:15Z

从我自己的体验来看，FLUX1 模型简直强的可怕。尤其是对文字的控制方面。现在似乎已经开始有一些 lora 模型做这方面的应用了。我自己也跟风搭建了一个，欢迎大家去体验：

网址： https://flux1ai.net/ - FLUX.1 AI: Advanced Text-to-Image Generation Model

写了一个目前最快的离线 AI 图像生成安卓 APP

2024-08-19T11:51:21Z

背景

离线 AI 图像生成安卓 APP 实际上有不少了：

但是由于单纯使用 CPU 的话，模型的推理速度是非常慢的。因此，我开发了一个能够调用高通 NPU 的图像生成安卓 APP ，能做到在生成 512x512 图像时在一秒左右完成一次迭代（生成一张图片至少需要 20 次迭代），支持以下的高通芯片：

6 Gen 1 、780G 、778G 、7 Gen 1 、7+ Gen 2 、7+ Gen 3 、888 、888+、8 Gen 1 、8+ Gen 1 、8 Gen 2 、8s Gen 3 、8 Gen 3

演示视频

[世界上最快的离线图像生成 APP ] （哔哩哔哩）

在 8Gen2 芯片上使用 20 步生成图像只需要 30 秒，8Gen3 甚至会更快一些，当然更精美的图像需要更多的步数。

下载地址

Google Play
APKCombo（如果没有安装 Google Play 的卷）

后续计划

支持更多样化的 checkpoint 或者 LoRA ，而不仅限于官方原版模型
支持批量生成和后台运行，方便尝试多个随机种子选片

据说是比 Stable Diffusion 和 Midjourney 都厉害的开源图像生成模型 → FLUX.1

2024-08-04T11:16:08Z

前几天新出了个牛逼的开源图像生成模型，自己搭了个小网站，欢迎感兴趣的朋友试玩~

以下为我司优秀员工 Claude 3.5 对 FLUX.1 的相关介绍

FLUX.1 AI 是由 Black Forest Labs 开发的先进文本到图像生成模型。它提供卓越的图像质量、准确的提示词遵循和多样的风格。FLUX.1 AI 擅长将详细的文本描述转化为高质量、多样化和复杂的图像,涵盖各种风格和宽高比。

主要特点:
- 卓越的视觉质量: 生成具有出色细节和清晰度的顶级图像。
- 精确的提示词遵循: 准确地将文本提示转化为匹配的视觉输出。
- 多样化的风格: 支持广泛的艺术风格,提供创作灵活性。
- 复杂场景生成: 创建精细详尽的场景,推动文本到图像合成的边界。

FLUX.1 AI 提供三种变体: FLUX.1 [pro]用于最高性能, FLUX.1 [dev]用于非商业应用,以及 FLUX.1 [schnell]用于快速本地开发。无论您是数字艺术家、UX 设计师还是营销专业人士,FLUX.1 AI 都能以前所未有的准确性和质量,为您提供将创意愿景变为现实的工具。

体验地址： https://flux1ai.com/

花费一个月时间，做了一款管理 Stable Diffusion 的工具

2024-07-31T05:52:02Z

可以对 Stable Diffusion 生成的任务进行管理，并且把生成的图片进行本地或者云端存储。

功能

图片列表瀑布流展示
自动同步 SD 生成任务
图片本地或者云端存储
可以多个用户统一协作，并且生成的图片进行统一管理
任务数据统计展示

欢迎 Star： https://github.com/tabelf/ai-gallery

有问题欢迎提出，进行交流！

有偿求助 Stable Diffusion 生产艺术二维码。

2024-07-28T06:55:43Z

类似这样的

一张可以出到一瓶水溶 c100 + 😊🧐

[开源自荐] 自动同步和保存你的 Stable Diffusion 作品

2024-07-22T11:57:57Z

仓库地址： https://github.com/tabelf/ai-gallery

背景介绍

最近一直在使用 Stable Diffusion 工具进行创作，每当我想要找到回之前生成的某张图片时进行参考时，却发现之前的参数都无法找到。为了解决这个问题，我开发了一款全新的插件，专门用于自动同步和保存您的 Stable Diffusion 创作。

主要功能

自动同步作品：每当你在 SD 中进行生成绘画时，插件会自动将其图片同步到存储服务器，确保每个任务都能得到妥善保存。

保留生成参数：插件不仅同步您的画作，还会详细记录每次创作的生成参数。无论是色彩选择、纹理设置还是其他关键细节，所有信息都将完美保存，方便您日后回顾和再创作。

简化工作流程：不再需要手动上传和记录创作过程中的细节。我们的插件一键搞定，帮助您节省宝贵时间，将更多精力投入到艺术创作中。

优势

保留生成参数：插件会详细记录每次创作的生成参数，确保您可以轻松回溯并证明每个作品的原创性。这不仅有助于保护您的知识产权，防止侵权，也确保您的作品不会被他人轻易复制。

支持多用户：我们的插件不仅支持个人用户，还提供强大的多用户管理功能，特设管理员权限便于团队管理和监督，通过数据汇总与分析轻松跟踪创作进度和优化资源分配。

随时访问：无论身处何地，只需登录您的账户，就能随时访问和下载所有创作作品和详细参数信息。

好了，简单介绍完毕，请您动动小手给个 star 吧。

Stable Diffusion 写实人物模型，怎么让他不出 X 图？

2024-07-22T03:40:43Z

试过很多种大模型包括二次原人物，都会有概率出裸图，这个要怎么避免？大佬们有经验吗？

做了一个 Stable diffusion 提示词生成工具

2024-06-26T01:01:30Z

做了一个网站 SD 提示词生成工具，可以将输入的 Stable diffusion 提示词进行扩展。 https://stablediffusionpromptgenerator.net/

分享一款刚刚对外开放的在线的免费 Stable Diffusion 3 生图工具产品

2024-06-12T17:40:33Z

Free Stable Diffusion 3 Online 工具介绍

各位好，晚上睡前刚好看到有群友分享了一个 Hugginface 搭建的 Stable Diffusion 3 的在线体验工具，而且推荐采用 iframe 的方式，让大家可以快速上线 Stable Diffusion 3 的免费体验产品。所以灵机一动，马上注册了域名：stable-diffusion-3.online, 完成了一个免费的在线 Stable Diffusion 3 体验工具：Free Stable Diffusion 3 Online, 欢迎大家免费体验使用。

介绍下 Stable Diffusion 3 的一些特征

1. 高级图像生成

Free Stable Diffusion 3 Online 基于最新的 Stable Diffusion 3 模型，能够从文本提示生成高质量的图像。无论是复杂的空间关系、构图元素、动作还是风格，它都能准确理解并生成符合要求的图像。

2. 照片级真实感

该工具克服了手部和面部常见的伪影问题，生成高质量的图像，无需复杂的工作流程。

3. 文本生成

借助我们的 Diffusion Transformer 架构，Free Stable Diffusion 3 Online 在生成文本时达到了前所未有的效果，没有伪影和拼写错误。

4. 资源高效

由于其低显存占用，Free Stable Diffusion 3 Online 非常适合在标准消费者 GPU 上运行而不会性能下降。

5. 精细调整

它能够从小数据集中吸收细微的细节，非常适合定制化需求。

使用方法

访问 Free Stable Diffusion 3 Online 网站。
输入您的文本提示。
生成并查看高质量的图像。

完全免费

Free Stable Diffusion 3 Online 完全免费使用。您可以随时访问我们的在线平台，体验最先进的文本生成图像技术。

欢迎大家留言交流，希望这款产品可以给大家带来 Stable Diffusion 3 的乐趣。

简易 AI 图片 prompt 查看器 Stable Diffusion Prompt Reader v1.3.5

2024-06-06T13:45:06Z

Stable Diffusion Prompt Reader v1.3.5

一个独立的简易 AI 图片 prompt 查看器，用于在不依赖 webui 的情况下提取由 Stable Diffusion 生成图片内包含的 prompt

不需要任何额外环境 /命令行 /浏览器，双击 app 把图片拖入即可

有任何建议或者使用问题请告诉我

Github Repo | 简体中文

一些题外话

前一段时间有许多内容创作者主动用不同语言撰写和制作介绍和推广相关的文章和视频，说真的我很震撼。最近主 repo 的 stars 也快 1k 了，十分感谢大家的支持。

我其实很好奇国内的正经 Stable Diffusion 社区究竟在哪儿，感觉我能找到的那些全都非常封闭，更新也不太及时。基本就是把外面东西搬运一下做个整合包写个教程之类的。而且材料也都是 A1111 相关的，很少有 ComfyUI 这些的相关的东西。如果有群或者社区平台请务必告诉我，非常感谢。

前几个版本都没有在 V2EX 发主要是因为中文用户比较少，加上没有添加特别重要的新功能。具体的 changelog 可以看release ~~（虽然没写中文版）~~

另外，大家可能不太相信，但这个 GUI 确实是 Tkinter 写的，为了能做到这个美观度我真的废了好大的劲。主要用了 CustomTkinter ，部分模块自己魔改了一下。配色用的是苹果的 guideline ，功能图标是谷歌的 Material Symbols ，app 图标是用 SD 生成的。至于为什么不用 Qt 写，qml 在我的 Mac 上会有迷之 bug ，而且几个打包工具作者对 PySide 的支持比较迟缓 ~~（提的 issue 等我用 Tkinter 写完之后全修复了..感觉自己像个怨种）~~。有兴趣的话可以看一下代码，但是个人强烈建议千万别用 Tkinter 写任何东西，里面全是坑。

重要更新

SD Prompt Reader 现在可作为 ComfyUI 节点使用。查看 ComfyUI Prompt Reader Node 了解更多信息。
从 v1.3.5 开始，每个平台都添加了命令行工具，具体可以看命令行介绍

功能

支持 macOS 、Windows 和 Linux
提供图形界面和命令行两种交互方式
简单的拖放交互
复制 prompt 到剪贴板
去除图片中的 prompt
导出 prompt 到 txt 文件
编辑或导入 prompt 到图片
竖排显示以及根据字母排序
检测生成工具
支持多种格式
支持系统深色和浅色模式

支持格式

格式	PNG	JPEG	WEBP	TXT*
A1111's webUI	✅	✅	✅	✅
Easy Diffusion	✅	✅	✅
StableSwarmUI*	✅	✅
StableSwarmUI (0.5.8-alpha 之前的版本)*	✅	✅
Fooocus-MRE*	✅	✅
NovelAI (stealth pnginfo)	✅		✅
NovelAI (旧版)	✅
InvokeAI	✅
InvokeAI (2.3.5-post.2 之前的版本)	✅
InvokeAI (1.15 之前的版本)	✅
ComfyUI*	✅
Draw Things	✅
Naifu(4chan)	✅

* 见格式限制.

如果你使用的工具或格式不在这个列表中, 请帮助我支持你的格式: 将你的工具生成的原始图片文件上传到 issues, 谢谢.

对于 ComfyUI 用户，SD Prompt Reader 现在可作为 ComfyUI 节点使用。 ComfyUI Prompt Reader Node 是本项目的一个子项目，建议在你的工作流程中嵌入其中的 Prompt Saver node 以确保最大的兼容性。

下载

Windows 用户

从 GitHub Releases 下载可执行文件

macOS 用户

从 GitHub Releases 下载可执行文件

通过 Homebrew Cask 安装

你也可以通过 Homebrew cask 安装 SD Prompt Reader.

brew install --no-quarantine receyuki/sd-prompt-reader/sd-prompt-reader

使用 --no-quarantine 参数是因为目前 SD Prompt Reader 并未签名, 具体原因请查看这里

Linux 用户 (不定期测试)

ComfyUI Prompt Reader Node

这是 SD Prompt Reader 的一个子项目。它帮助你从 SD Prompt Reader 支持的任何格式的图像中提取元数据，并保存带有额外元数据的图像，以确保与 Civitai 等网站上的元数据检测兼容。

Github Repo

安装说明

通过 ComfyUI Manager 安装和更新（推荐）

在 ComfyUI Manager 中搜索 SD Prompt Reader 并安装。

手动安装

请确保在安装主库的同时安装子模块。

cd 到 custom_node 文件夹

Clone 这个 repo

git clone --recursive https://github.com/receyuki/comfyui-prompt-reader-node.git

安装依赖

cd comfyui-prompt-reader-node pip install -r requirements.txt

请教一下 Stable Diffusion 的问题

2024-05-14T03:37:37Z

我需要用 SD 生成一些创意图片，但有时无法生成想要的主体

比如我输入：Superman is holding up a car
它总是无法正确的生成，请问应该要怎么调整？

模型：dreamshaperXL

小白都能上手的 Stable Diffusion 在线生成器，有没有？

2024-04-26T08:07:30Z

我们做电商的，需要模特图，场景图，听说 Stable Diffusion 很好，但是自己搭建和学习成本都非常高。

于是我就在想：有没有小白都能上手使用的 Stable Diffusion 在线生成器，尤其支持图生图，像素高。我们愿意付费

想研究下 stable diffusion，收一台 Windows 整机

2024-04-09T02:51:50Z

手上的 m1 MacBook Air 玩着太累了，想收个整机玩下 stable diffusion 。// 顺便玩玩游戏😏；

坐标深圳宝安，预算 6.5K ，不带显示器；可以自提，有兄弟只有板 U ，显卡（显存越大越好）单出的话，也可以跟我联系；

张小龙：Y2hhdmluMTk5Mg==

求各位大佬，推荐个 ai 绘画的电脑配置

2024-03-27T06:13:48Z

公司的电脑，1 万以内。

主要是设计，ps ，ai ，和 stable diffusion

要求:

显卡：不知道，想尽量多点预算给显卡

内存:32g

硬盘:1t

其他的都不懂。。。

stable diffusion 使用同样的参数，似乎不能百分百复现别人的图片？

2024-03-25T09:17:11Z

最近折腾 SD ，发现一个现象，从 civitai 站看人家的图片给出的生成信息，把所有参数，从模型到关键词到 lora 全部对进去后，生成的图，99%相似，但是仍然会有一些细微的区别，主要体现在有光照的部分，光照部分的颜色和轮廓，会有细微的变化，这到底是正常的还是不正常？原因到底是什么呢？

Stable Diffusion 桌面应用

2024-03-20T11:31:22Z

目前不定期慢速更新中，不过相比半年前还是完善了不少，有兴趣的可以试用看看。https://vivy.liriliri.io/zh/

Fooocus —— 将 Stable Diffusion 和 Midjourney 设计相结合的开源模型

2024-03-05T11:29:45Z

github： https://github.com/lllyasviel/Fooocus
网站： https://fooocus.one/

Stable Diffusion 3 发布了，都没人讨论吗？

2024-02-23T12:35:20Z

各位都用 stable diffusion 做过啥有意思的事情

2024-02-23T03:53:10Z

初期我体验各种 lora 画了很多图，后面看多了 ai 美女就没有激情了。

搞了一个可以体验 Stable Cascade 模型的网站： https://stablecascade.net

2024-02-22T01:37:37Z

据官方称，StableCascade 对比 Stable Diffusion ，可以减少生成过程中的不确定性和噪声。体验下来，速度确实快了很多。

站点地址： https://stablecascade.net

前端：NextJS 14 App Router + Tailwind CSS 部署：Vercel

注：本来用 clerk 做了登录功能，结果上线后提交到 Google search console 一直提示 401 ，还没找到原因

感谢

第一次在 V 站发帖，环境大家体验网站和提意见。关于 cleark 的 401 问题。如果有用过的大佬请留言，虚心请教，谢谢！

ai 绘画如何画多张人物保持一致的图片

2024-02-18T03:54:01Z

如题，我用 chatgpt 的 dall-e 画的时候，每画一次就是一个全新的人物形象，甚至发两次一模一样的描述，但是画出来的却是两幅截然不同的人物形象，能不能让它画出几张人物固定，只是背景变化的图片？如果 chatgpt 做不到的话，应该用 stable diffusion 还是 midjourney 才能做到?

玩过 stable diffusion 作图的大佬们，可以分享下你们的心得吗

2023-12-10T01:13:08Z

使用开源的 stable diffusion 本地离线生成 ai 图片可以拿去卖吗？

2023-12-02T16:31:59Z

我本地设置关键词，人工挑选一些优质的图片，拿去卖会不会有版权问题吗？

本地生成的图片版权算不算我的呢？

求助各位大佬

Stable-Video-Diffusion Img to Videos

2023-11-27T02:04:24Z


img	videos

URL: stable-video-diffusion-webui

Stable Video Diffusion 发布已经几天了，看看 X 上的人怎么玩花活的。

2023-11-26T08:05:00Z

Stable Video Diffusion Tweets Explore ( https://www.stablevideodiffusion.online/explore) 🚀
可以直接在 PlayGround 上玩下 🔥 ，不过应该比较慢。

花了 2 小时，快速做了一个 stable video diffusion 静态页面

2023-11-25T17:32:46Z

关于 stable video diffusion 的一个静态页面

https://stable-video-diffusion.com/

注意，目前还没有对接后端，太晚了，明天起来再继续对接后端。

这个好玩，基于 stable diffusion 的涂鸦转大作

2023-11-25T14:41:07Z

https://stablediffusionweb.com/Realtime-Scribble-Diffusion#ai-art-generator

苹果官方出的 ML Stable Diffusion 效果怎么样？

2023-11-24T01:29:04Z

https://github.com/apple/ml-stable-diffusion

这个和 AUTOMATIC1111c 的 stable-diffusion-webui 有啥区别？

AI Tool: One Image to Generate a Video

2023-11-24T00:00:19Z

Stable Video Diffusion can playing the new ai video generator online. Try it ouout!

Stable Diffusion 二次开发 OR AI 测肤

2023-11-23T01:35:59Z

具体详谈

联系 V:bHZsaW54aWFvMjAyMw==

关于 Stable Video Diffusion，做个了小页面

2023-11-22T11:22:49Z

只做了单页面 https://www.stable-video-diffusion.net
请各位大佬多提提意见

原创：旗舰游戏显卡(980Ti,1080Ti,TiTan V,2080Ti,3090,4090)， AI 画图 stable diffusion)和大模型(chatglm2-6b)推理性能横评

2023-10-24T16:24:09Z

前言：自从去年 10 月份以 ChatGPT 和 stable diffusion 的发布引发了一波生成式 AI 浪潮，但很多人特别是某些领导整天在会议上说人工智能带来的各种风险和不足，其实自己几乎没用过 ChatGPT 和 stable diffusion ，对生成式 AI （ AIGC ）只有偏见！缺少实践对新生事物的理解和抓住机会是有害的，由于这一波 AI 浪潮带着复杂难懂的各种专业术语和昂贵的平台，给习惯了点击购买云主机的 IT 从业者和个人开发者带来了不小的门槛，加之最近美国实体名单居然把游戏显卡 RTX4090 都加入禁止出售给中国的实体清单，我觉得有必要在”廉价”游戏显卡上把大模型对话和 stable diffusion 画小姐姐的生成式 AI 在自己的 PC 机上跑起来！这样才能谈后面的体验和带来的机会。以下评测数据都是自己花钱、花时间原创测试得到，希望给所有开发者实践大模型和 AI 画图予参考，有帮助和喜欢的朋友请收藏、关注和点赞，让人人都能够参与的 AI 才是真正的 AI

详细内容参看： https://zhuanlan.zhihu.com/p/663179436

Stable Fast: 超轻量级 Stable Diffusion 推理优化框架

2023-10-17T10:26:22Z

本人第一个正式开源项目，欢迎大家关注！聚焦于推理优化领域，希望能帮助到有相关模型推理加速需求的朋友，或者希望学习这方面知识的朋友。

项目主页

这是什么？

stable-fast 是一个为 HuggingFace Diffusers 在 NVIDIA GPUs 上的超轻量级推理优化库。 stable-fast 通过利用一些关键技术和特性提供超快的推理优化：

__CUDNN 卷积融合__：stable-fast 为各种组合的 Conv + Bias + Add + Act 计算模式实现了一系列功能齐全且完全兼容的 CUDNN 卷积融合运算符。
__低精度 & 融合的 GEMM__：stable-fast 实现了一系列使用 fp16 精度的融合 GEMM 运算符，这比 PyTorch 的默认设置更快（以 fp16 读取和写入，以 fp32 计算）。
__NHWC & 融合的 GroupNorm__：stable-fast 使用 OpenAI 的triton实现了高度优化的融合的 NHWC GroupNorm + GELU 运算符，消除了内存格式排列运算符的需要。
__完全追踪的模型__：stable-fast 改进了 torch.jit.trace 接口，使其更适合追踪复杂模型。几乎每一部分的 StableDiffusionPipeline 都可以被追踪并转换为 __TorchScript__。它比 torch.compile 更稳定，并且比 torch.compile 的 CPU 开销明显小，并支持 ControlNet 和 __LoRA__。
__CUDA Graph__：stable-fast 可以将 UNet 结构捕获到 CUDA Graph 格式，当批量大小小时可以减少 CPU 开销。
__融合的多头注意力__：stable-fast 仅仅直接使用 xformers 并使其与 TorchScript 兼容。

与其他加速库的差异

__快速__：stable-fast 是专门为 HuggingFace Diffusers 优化的。它在所有库中都实现了最佳性能。
__简约__：stable-fast 作为 PyTorch 的一个插件框架工作。它利用现有的 PyTorch 功能和基础设施，并与其他加速技术兼容，以及流行的微调技术和部署解决方案。

性能比较

A100 SXM 80GB (SD v1.5, 512x512, fp16)

框架	性能
Vanilla PyTorch	23 it/s
AITemplate	44 it/s
TensorRT	52 it/s
OneFlow	55 it/s
Stable Fast (与 xformers & triton 共同工作)	60 it/s

RTX 3090 Ti (SD v1.5, 512x512, fp16)

框架	性能
Vanilla PyTorch	16 it/s
AITemplate	31 it/s
TensorRT	33 it/s
OneFlow	39 it/s
Stable Fast (与 xformers & triton 共同工作)	38 it/s

一个基于 Stable Diffusion web UI API 重新编写用户界面的桌面应用

2023-10-16T02:42:53Z

前段时间玩了下 Stable Diffusion web UI ，其生成效果对我这种没接触过 AI 的小白十分震撼。可惜 UI 使用起来不太方便，对新手来说也很难上手，看到它有提供 API 接口就想着重新写个好用点的用户界面。

目前只支持文生图，功能还比较基础，有兴趣的可以下载试用看看，支持 mac arm 和 windows x64 ，如果有任何建议或者使用问题可以直接在仓库中反馈。

https://github.com/liriliri/vivy-docs

特性：

内置 Stable Diffusion web UI
提示词编辑高亮显示
提示词编辑 Danbooru 标签补全提示
提示词格式化
提示词一键翻译中文
粘贴生成参数
读取图片生成参数
图片生成任务队列
方便的图库浏览
可调整的用户界面
应用 CPU 和内存占用监控
模型文件管理

应用界面：