做了个小而美的 AI 产品,根据照片匹配古诗词,生成分享卡片 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
fgt
V2EX    分享创造

做了个小而美的 AI 产品,根据照片匹配古诗词,生成分享卡片

  •  
  •   fgt
    gui66497 2024-06-27 10:27:58 +08:00 4684 次点击
    这是一个创建于 471 天前的主题,其中的信息可能已经有所发展或是发生改变。

    介绍

    大家好,这是我打算成为独立开发后的第一款 AI 应用

    应用名称:诗境

    访问地址: https://photo2poem.top/

    主要功能就是根据用户上传的图片分析主体和意境,匹配诗句,最终生成漂亮的卡片

    需求来源

    不知道你们有没有遇到过,就是拍了一幅很美的照片,想吟诗一首再发个朋友圈,奈何文化程度有限,往往想半天最后配了段大白话。

    这时候诗境就能派上用场,把图片喂给她,让她给你配个最符合当前画面意境的诗。

    界面截图

    e5ae49be89328ca1b841a05daa52c02b.jpeg

    主体功能流程

    1. 前置工作:古诗词向量化
    2. 用户上传照片,后台通过多模态接口分析图片主体和意境,格式化输出
    3. 根据上面的输出去向量库中匹配,返回 Top N 诗句
    4. 根据诗句反查得到整诗返给前端
    5. 前端呈现

    技术栈

    • 前端:Vue 、Tailwind CSS 、DaisyUI
    • 后端:Python 、Mysql
    • AI:Gemini 、LangChain 、m3e 、chroma
    • 登录鉴权:Clerk
    • 支付:独角数卡

    关于编码这块,AI 真的有大用途,我前端 WebStorm 和后端 Pycharm 都装了 Copilot 插件,有好多代码都是直接"提示"出来的;然后界面框架借助 ScreenshotToCode 、V0 等应用,真的能节省很多开发时间,这里就不展开讲了。

    关于支付这块,我也看了一些国际上主流的付款 Saas ,Strpe 需要公司资质,门槛太高,Lemon Squeezy 申请了,看我地址里出现中国,直接拒了(以美国禁令为由),各位大佬如果有更好的途径欢迎分享。

    特色

    • 使用目前主流的 UI 设计,简约美观
    • 一次性匹配 5 首诗,不满意可切换
    • 提供导出功能,一键导出图配诗,方便发圈装逼
    • 页面支持自定义,可以配置是否显示日历、边框、标题、作者和朝代等,支持调整诗句字体大小

    独立开发的思考

    我之前一直都是做 Java 的,现在这个行情大家也都知道,说不定哪天就毕业了,想着技多不压身,现在最火的就是 AI 了,就找了教程跟着学了,但光看是浮于表面的,就想练练手,于是这个项目就应运而生了。

    虽然是个很简单的项目,但奈何都是比较陌生的技术,真的是一边学一边开发,陆陆续续花了 3 周,这里我要吐槽一下,整个开发过程前端开发至少占了 7 成,后端接口写好之后基本就不用动了,前端细节太多了,经常调一个诡异的样式调半天。

    我感觉做独立开发,只能瞄准一些小众需求,让大厂觉得利益有限不屑于竞争,然后尽量将产品做精,做到真正的"小而美",和同质化产品拉开差距。

    最后

    产品还处于试用阶段,登录就送额度,有人感兴趣的话我下面会发激活码,谢谢大家~

    第 1 条附言    2024-06-27 12:20:34 +08:00
    感谢大家捧场~
    ff9e503b-a7ea-4253-b796-f8017d51c422
    528ce82f-bbd0-49c0-9f25-07e678771172
    88b52541-96f6-4fb8-af2d-0773f166e8c8
    b50cad96-287d-4edb-bd04-1684fe908d77
    26a14092-0f05-484a-9a85-7cd428f20cb3
    6a07dc06-9e3f-45e2-a4e8-8b6210e458e5
    137f458e-1153-4ff6-be3d-43d41376783c
    c1e36d40-47cc-4525-bfb8-329c1eb2a7e0
    44e6e737-a1f7-4cd6-b0ed-eca846940b04
    00a365da-d2b4-4291-8bb3-87700a96f1fd
    b2de60af-f60e-49a7-9e26-0d194becc656
    94bcbf95-3aaa-4285-ae5c-4c64723b249f
    609ad60e-747c-4782-bb86-a84789de1641
    8da5a07e-b192-4667-af23-d424f1f456bb
    b1294113-a17e-457e-a8be-dba91cc566f5
    第 2 条附言    2024-06-27 13:06:20 +08:00
    我看了下后台,报错主要有两大原因
    1. 原始图片太大,尽管我有做压缩但有的图还是有 2~4MB ,调 Gemini 接口超时了
    2. 图片敏感,只要稍微上传点 nsfw 的内容,Gemini 接口直接就报错了
    52 条回复    2025-07-31 09:55:49 +08:00
    chenzhengjian
        1
    chenzhengjian  
       2024-06-27 10:40:35 +08:00
    创意不错,体验欠佳
    fgt
        2
    fgt  
    OP
       2024-06-27 10:44:00 +08:00
    @chenzhengjian 哈哈,目前还处于半成品,还有很多优化空间,延迟现在至少都要 7 秒,我看大部分时间都花在了调用 Gemini 上,后面想办法把他换掉
    xuyihao
        3
    xuyihao  
       2024-06-27 10:48:37 +08:00
    已经崩了
    authony2020
        4
    authony2020  
       2024-06-27 10:51:31 +08:00
    想法挺好的, 照片是不是可以选择风格美化下。我试了一下报错啊
    fgt
        5
    fgt  
    OP
       2024-06-27 11:15:46 +08:00
    @authony2020 确实,大部分人发圈之前都要再美化下;服务重启了,应该好了
    sL83OdzP0RtI2l31
        6
    sL83OdzP0RtI2l31  
       2024-06-27 11:45:22 +08:00

    挺好的,求点额度玩一下,[email protected]
    AiBoy
        7
    AiBoy  
       2024-06-27 12:33:14 +08:00
    激活码错误
    jiejia
        8
    jiejia  
       2024-06-27 12:39:05 +08:00
    感觉这种应用直接在 gpts 商店更适合一些
    fgt
        9
    fgt  
    OP
       2024-06-27 12:44:35 +08:00
    @AiBoy 错误应该就是被用掉了,留邮箱吧
    Alexf4
        10
    Alexf4  
       2024-06-27 13:17:50 +08:00
    如果中文的可以试试国内的千问,或者省心整个 gpt-4o, 估计会省事很多?
    codebs
        11
    codebs  
       2024-06-27 13:18:02 +08:00
    求额度
    Ynp1OTUyN0BnbWFpbC5jb20=
    TabGre
        12
    TabGre  
       2024-06-27 13:21:05 +08:00 via iPhone
    怎么可以直接发朋友圈的?
    fgt
        13
    fgt  
    OP
       2024-06-27 13:37:24 +08:00
    @TabGre 需求+1 ,加个一键分享功能,目前只能右上角导出图片
    09EdgqomQp5z019t
        14
    09EdgqomQp5z019t  
       2024-06-27 13:48:13 +08:00
    有没有对比直接用 GPT-4o 的 prompt 的效果的差距?
    fgt
        15
    fgt  
    OP
       2024-06-27 14:03:41 +08:00
    @digd 我尝试过直接让大模型返回,但还是避免不了幻觉问题,他会给你凭空捏造一首诗,就算不是捏造的,标题和作者也经常搞错
    fgt
        16
    fgt  
    OP
       2024-06-27 14:04:35 +08:00
    @codebs 已发~
    TabGre
        17
    TabGre  
       2024-06-27 14:05:45 +08:00 via iPhone
    web 可以分享为朋友圈吗? 小程序都木有见过类似功能
    yb2313
        18
    yb2313  
       2024-06-27 14:19:13 +08:00


    好好好
    yb2313
        19
    yb2313  
       2024-06-27 14:23:01 +08:00
    @yb2313 何以销烦暑,端居一院中。
    眼前无长物,窗下有清风。
    热散由心静,凉生为室空。
    此时身自得,难更与人同。
    fgt
        20
    fgt  
    OP
       2024-06-27 14:47:30 +08:00
    @yb2313 我试了下,第二首也不错,哈哈
    ![9e1c26e6e9efff89fc444168415e9c1f.png]( https://i3.mjj.rip/2024/06/27/9e1c26e6e9efff89fc444168415e9c1f.png)
    fgt
        21
    fgt  
    OP
       2024-06-27 15:05:38 +08:00
    @yb2313 貌似 v2 只能预览 imgur 的图床
    09EdgqomQp5z019t
        22
    09EdgqomQp5z019t  
       2024-06-27 15:08:57 +08:00
    很赞的点子,求额度 ZHVkb2dAb3V0bG9vay5jb20=

    现在那种“可怜现在文化低,只能卧槽”太多了
    wonderfulcxm
        23
    wonderfulcxm  
       2024-06-27 15:11:38 +08:00 via iPhone
    @fgt 不错,讲了一个失足妇女的故事
    fgt
        24
    fgt  
    OP
       2024-06-27 15:17:57 +08:00
    @digd 已发~
    Pepega
        25
    Pepega  
       2024-06-27 16:33:07 +08:00
    天才!连个公众号你无敌了啊
    tomdddd
        26
    tomdddd  
       2024-06-27 16:37:53 +08:00
    求问下这种分享卡片技术上是怎么实现的,能分享下么
    我也是 java 的独立开发选手,目前做了 2-3 款产品,希望加个 v 15889666941 多多交流~
    huang86041
        27
    huang86041  
       2024-06-27 16:48:20 +08:00
    有反过来,在有诗的情况下,配图,然后分享的吗?
    huang86041
        28
    huang86041  
       2024-06-27 16:53:50 +08:00
    求额度:aHVhbmc4NjA0QGdtYWlsLmNvbQ==
    fgt
        29
    fgt  
    OP
       2024-06-27 16:54:05 +08:00
    @tomdddd 基本就是用 tailwindcss+daisyui 手搓出来的,网页导出成图片有现成的库 html2canvas
    tomdddd
        30
    tomdddd  
       2024-06-27 16:56:00 +08:00
    @fgt 加个联系方式吧~看到有些小 bug 跟你反馈下哈哈 15889666941
    fgt
        31
    fgt  
    OP
       2024-06-27 17:03:16 +08:00
    @huang86041 发了~ 你这个也是个思路啊,先用大模型分析诗句,生成图像提示词,然后用 sd 或者 mj 生成图片
    zzzyyysss
        32
    zzzyyysss  
       2024-06-27 17:23:34 +08:00
    给图片列表把 view-transition 加上吧
    x007xyzabc
        33
    x007xyzabc  
       2024-06-27 17:30:59 +08:00
    想法不错
    fgt
        34
    fgt  
    OP
       2024-06-27 17:44:14 +08:00
    @zzzyyysss 很酷炫的效果啊,我去学习下怎么用
    ivyliner
        35
    ivyliner  
       2024-06-27 18:58:53 +08:00
    话说, 你这个和 诗片 APP 啥关系啊 ? 我怎么感觉你是再抄袭人家 ?
    carrie999
        36
    carrie999  
       2024-06-27 19:01:23 +08:00
    有兴趣合作做 ios 吗 可以联系我的 wx:771685809
    yhxx
        37
    yhxx  
       2024-06-27 19:17:30 +08:00
    和诗片好像啊
    UI 几乎都一样
    fgt
        38
    fgt  
    OP
       2024-06-27 20:02:46 +08:00 via Android
    @ivyliner 界面框子我是用 V0 生成的,就两个页面,这应该算是这类应用的设计范式了吧,就像各家大模型的对话界面基本都有 OpenAI 的影子
    而且我们平台也不一样,诗片那个只有 ios 上有
    yb2313
        39
    yb2313  
       2024-06-27 20:42:36 +08:00
    @fgt #20 怎么就给我识别成荡子妇了, 你管管你家 ai 啊
    yb2313
        40
    yb2313  
       2024-06-27 20:43:40 +08:00
    @wonderfulcxm 那种事情, 不要啊
    zhigangwu
        41
    zhigangwu  
       2024-06-27 20:47:32 +08:00
    求交流,也是独立开发 wx: d3pnXzA3MjA=
    fgt
        42
    fgt  
    OP
       2024-06-27 22:03:15 +08:00
    @yb2313 哈哈,不过这个女主确实有点败犬的感觉
    ivyliner
        43
    ivyliner  
       2024-06-28 07:08:37 +08:00
    @fgt #38 UI 和 创意基本上都一样, 你看看 37 楼也是这么觉得. 用 V0 生成也不能保证生成的配色和文案 "选择我的照片" 一样吧.
    zhiyu1998
        44
    zhiyu1998  
       2024-06-28 13:08:10 +08:00
    我擦 很有创意 帮你推荐到了我的第三期周刊《水母绚舞》了

    https://rrorangeandfriends.site/posts/2024/003#%E8%AF%97%E5%A2%83
    fgt
        45
    fgt  
    OP
       2024-06-28 14:04:53 +08:00
    @zhiyu1998 多谢分享,订阅你的周刊了
    dawangyezi
        46
    dawangyezi  
       2024-06-28 15:04:37 +08:00
    挺好玩儿
    linyongxin
        47
    linyongxin  
       2024-06-29 08:45:06 +08:00
    挺好的创意,如果能指定诗句也很不错。
    页面 css 或 js 有点问题,多了个 position: absolute; 导致遮罩不居中,页面设置后,遮罩无法关闭,也没看到确认按钮,全部不能动,非常难用。
    carrie999
        48
    carrie999  
       2024-06-29 12:00:23 +08:00
    @huang86041 这个用 midjourney
    fgt
        49
    fgt  
    OP
       2024-06-30 10:00:40 +08:00 via Android
    @linyongxin 你用的是什么浏览器,我这边倒没遇到,能截个图我看看吗
    weiseeu
        50
    weiseeu  
       2024-07-01 15:21:48 +08:00
    fishlium
        51
    fishlium  
       2024-07-11 17:15:34 +08:00
    可以说一下古诗词向量化是用的什么吗,谢谢
    Devmc
        52
    Devmc  
       72 天前
    接口 404 了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     892 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 20:21 PVG 04:21 LAX 13:21 JFK 16:21
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86