一天上线「图像标记」功能: AI 让我这个前端小白也能做复杂交互 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
lemonvip
V2EX    分享创造

一天上线「图像标记」功能: AI 让我这个前端小白也能做复杂交互

  •  
  •   lemonvip 6 天前 820 次点击
    一天上线「图像标记」功能:AI 让我这个前端小白也能做复杂交互

    最近给自己的产品做了一个新功能:图像标记( Image Marking )。

    简单说就是:用户可以在图片上写字/划线标记想改的位置,然后在提示词里说“把鸟加到我标记的地方”,AI 就能比较精准地只改那一块。

    更离谱的是从想到这个点子到上线可用,我基本在一天之内搞定。我是个技术小白,前端交互一直不算强,这次算是被 AI “抬”上去了。

    为什么要做这个功能?

    很多人用 AI 修图都会遇到一个痛点:
    提示词写得很清楚,但模型还是改错地方,甚至改全图。

    所以我想要一个“人类表达更直接”的方式:
    在图片上直接指出位置,再让 AI 按位置执行。

    结果做出来之后,用户上手也更快:

    标记“bird” → prompt 写“在标记处加鸟,并把标记文字去掉” → 出图就对了

    不需要来回试“左上角/右边一点/再靠上一点”这种玄学描述

    我是怎么在 1 天内做完的?

    我把整个过程拆成了 6 步,几乎每一步都离不开 AI 。

    Step 1:想到想法 → 用 ChatGPT 调研可行性

    我先问 ChatGPT 进行联网搜索:

    “网页端图片标记一般怎么做?”

    这一步最大的收益是:快速定方向,少走弯路。

    Step 2:画原型图(越粗糙越好,但要表达清楚)

    我会用非常粗糙的方式画:

    点击 Edit → 弹出标记层

    支持画线/文字

    Done 保存 → 回到生成器继续写 prompt

    原型图的目的不是漂亮,是为了让 AI 和自己都能对齐“最终长什么样”。

    Step 3:用 Codex 5.2 Max High 写技术方案

    我让 Codex 直接输出一个“可落地的方案”,包括:

    组件结构怎么拆

    关键数据结构(标记内容如何存储)

    事件逻辑(绘制、撤销、保存、导出)

    以及和生成器的串联方式

    对我这种前端不熟的人,这一步相当于:
    把脑内想法翻译成工程语言。

    Step 4:用 Claude Code 执行落地

    方案有了之后,我就让 Claude Code 直接开始写:

    UI 和交互逻辑

    标记弹窗

    保存/读取标记数据

    和生成页面连接起来

    这一步是“体力活”,cc 非常适合做。

    Step 5:遇到 bug → 用 Cursor 拉来三位“大神”会诊

    中间肯定会遇到各种 bug (比如坐标错位、缩放偏差、事件冲突等)。
    我在 Cursor 里同时调模型来排查:

    Gemini 3 Pro

    Claude Opus 4.5

    GPT o3


    这一步最大的体感是:
    以前搞不定的 bug ,现在像“多人结对编程”一样,小白也能搞定。

    Step 6:上线 + 测试

    最后就是:

    自己跑一遍真实流程


    做完之后的感受

    这次让我最震撼的是:

    AI 真的可以把一个前端小白,短时间内“拉升”到能做复杂交互功能的水平。要敢想敢做。

    当然,不是说全程躺平。
    更像是:你负责方向、拆解、判断; AI 负责产出、补全细节、加速迭代。

    欢迎体验

    网站:
    https://nanobanana.co

    产品介绍博客(英文):
    https://nanobanana.co/blog/Precisely-Edit-Images-with-Image-Marking

    产品介绍博客(中文):
    https://nanobanana.co/zh/blog/Precisely-Edit-Images-with-Image-Marking

    欢迎大家试用,也欢迎拍砖:

    你觉得这种“标记 + prompt”的交互是否更适合大众?
    第 1 条附言    2 天前
    https://nanobanana.co/zh
    中文网站链接,更友好
    1 条回复    2025-12-18 14:21:48 +08:00
    Aleks
        1
    Aleks  
       6 天前
    套壳赚信息差。网页也是满满 AI 味道,审美太糙了。AI 生成的代码都是一个模子,以后手工匠人代码,反而有可能变得有竞争力了。真是黑色幽默了
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5206 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 21ms UTC 08:08 PVG 16:08 LAX 00:08 JFK 03:08
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86