AI 生成 PPT 方案请教 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
jsxyzb
V2EX    程序员

AI 生成 PPT 方案请教

  jsxyzb 1 月 30 日 2722 次点击
这是一个创建于 72 天前的主题,其中的信息可能已经有所发展或是发生改变。

最近公司安排做 AI Slides ,我看了下 GitHub 上 ai-slides 这个 topic ,目前活跃的项目基本就两个:

  • banana-slidesGitHub):用 Nano Banana 模型生成 PPT 页面图片,视觉效果不错,但导出的.pptx本质是图片嵌入,无法编辑文字或调整布局;
  • Xpptxxpptx.com):能直接生成结构化的可编辑 PPT 。

我现在的问题是:有没有办法把 banana-slides 生成的那种高质量页面图,自动转换成真正的可编辑 PPT ?比如识别出标题、正文、图表区域,还原成原生文本和形状?

求教有没有现成工具或技术方案。

20 条回复    2026-02-07 13:03:47 +08:00
Natumsol
    1
Natumsol  
   1 月 30 日 via Android
试试 lovart ,满足你的诉求
hanssx
    2
hanssx  
   1 月 30 日
banana 生成 html ,html->ppt
leeg810312
    3
leeg810312  
   1 月 30 日
第二个不是 github 的吧?我看不少工具都是生成 html 当作 ppt 用,可能更通用,用浏览器打开看
laowu2012
    4
laowu2012  
   1 月 30 日
banana-slides 不是有选文字分层解析吗
loopinfor
    5
loopinfor  
   1 月 30 日
第一个感觉很惊艳,不是说视觉效果很酷炫,而是完全没 AI 味。
市面上很多 AI PPT 做出来的排版都是文字很小、图标巨大,跟普通中文 PPT 模板差异很大。
yrom
    6
yrom  
   1 月 30 日
apacheinsky
    7
apacheinsky  
   1 月 30 日   2
让 AI 生成 latex ( beamer ),可编辑度绝赞爆表!
CandyMuj
    8
CandyMuj  
   1 月 30 日 via Android
可以试试 skills
love060701
    9
love060701  
   1 月 30 日
https://codia.ai/noteslide/

OCR+inpaint ,把图片变成可编辑的 PPT 文件。但是用过你就知道了,还是 AI 生成更方便,现在 Banana 改图会出现字错乱的情况,最多半年就能解决,到时候就是完全 AI 生成和编辑 PPT ,始终是图片格式。
TonyG
    10
TonyG  
   1 月 31 日
全自动方案一般效果都不行,vibe coding 16:9 的 html ,引入各种 chart, tailwind css, fontawsome, npm 引入 cheerio ,pptxgenjs ,puppeteer 生成 html 生成截图、生成 ppt 页面的 node 命令,html 用提示词微调不足,图片用各种大模型免费生图形成插入图、背景图,结合 qwen image edit 微调图片内容。然后你就可以得到很漂亮的 ppt 了。
yayoec
    11
yayoec  
   1 月 31 日
banana-slides 有导出可编辑的功能,虽然做不到完美,但是确实能用
youyouzi
    12
youyouzi  
   1 月 31 日
有个技术问题咨询一下各位大佬:
gemini 生成的是图片,他如何做到可以把图片转为 ppt 以后,下载以后可以编辑呢?纯图片》可编辑 ;这个过程是提示词让 gemini 做了什么吗?
hackpro
    13
hackpro  
   1 月 31 日
蹲一个 NotebookLM 转可编辑 ppt 方案
syferie
    14
syferie  
2 月 1 日
我前段时间设计了一个方案,先利用 NanoBananaPro 来生成 PPT 图片,效果与 banana-slides 类似。
之后实现可编辑,核心思路是利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,从而生成遮罩。
然后利用纯色填充+渐变填充来实现移除文字。
移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

https://github.com/MoonWeSif/NextCreator
syferie
    15
syferie  
PRO
   2 月 1 日
@youyouzi 可以参考我这里的开源思路,核心利用了 Gemini 的视觉思维能力去识别图片中的文字位置和内容样式,生成遮罩。
然后利用纯色填充+渐变填充来实现移除文字。
移除之后将上面识别到的文字与样式放置到对应位置,组装为一个完整 PPT ,从而达到可编辑文字的 PPT 效果。

核心还是考虑到作为一个桌面端应用,尽量轻量化,原先是 OCR+Inpaint 的思路,但是依赖外部需要部署的服务,过于繁琐了,现在的话下载即用。
zerovoid
    16
zerovoid  
   2 月 1 日
题外话,我在想什么不直接用网页替代 PPT 来做演示呢,PPT 能做的事,网页都能做(上下页切换,各种动画效果,浏览器也能全屏),以前用 PPT ,只是很多办公人员不会写代码罢了,现在都交给 AI 写,我看 PPT 可以直接淘汰了。
coobin
    17
coobin  
   2 月 2 日
banana 可以生成 google 的 slides ,slides 可以导出为 pptx
youyouzi
    18
youyouzi  
   2 月 2 日
@syferie #15 所以是通过提示词让他生成的时候分离背景图片和文字吗?
Jannok
    19
Jannok  
   2 月 2 日
我觉得 kimi 的其实还可以,notebooklm 那种很炫酷但是不能编辑,kimi 的是传统 ppt 那种有排版布局的,实用性挺高的,用来做年终总结汇报啥的还蛮好的。
syferie
    20
syferie  
PRO
   2 月 7 日
@youyouzi 不是,都是自己处理的。上面说的原理应该挺清晰的。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5727 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 27ms UTC 06:44 PVG 14:44 LAX 23:44 JFK 02:44
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86