求技术合伙人一名!(副业可选) - 我的 MVP 产品已有上千用户正在使用 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ujfj1986
V2EX    创业组队

求技术合伙人一名!(副业可选) - 我的 MVP 产品已有上千用户正在使用

  •  
  •   ujfj1986 128 天前 3616 次点击
    这是一个创建于 128 天前的主题,其中的信息可能已经有所发展或是发生改变。

    背景:一个非技术 PM 用 AI 工具( Windsurf+Claude )搭建了 Ries 的应用

    大家好,我是 Orion ,Ries 的 founder 。

    我是一个十年的产品经理,最近用 AI 编程工具(主要是 Windsurf 配合 Claude )把自己的一个想法实现成应用。大约 50%的代码是 AI 生成的,后期也有一位联合创始人加入。

    上周,因为我们初期技术方案不成熟,一些热情的 V 站朋友体验后,服务器直接宕机了。

    能亲手实现想法感觉很棒,但也因为我是技术新手,这次服务器宕机就是个教训,暴露了架构上的许多问题。

    应用简介(为求助提供上下文):

    简单说,这个应用是为了解决英语学习中“接触太少”的问题,核心思路是“实时创造英语接触”。

    它会在用户日常浏览中文内容(如 V2EX )或观看视频(如 B 站、YouTube )时,根据用户的英语水平,智能地将少量中文替换为英文或补充英文表达,帮助用户在无痛、无感、不中断娱乐的情况下,逐步拓宽英语边界。

    (如果想了解应用细节,可以参考我之前的介绍帖,这里主要求助就不赘述了:t/1134678

    [核心求助] AI 已不足以支持下一步,卡在“用户语言图谱”构建上了:

    目前最大的技术瓶颈是构建一个动态、准确的“用户语言图谱”。我们需要这个图谱来了解:

    • 用户当前认识哪些词汇、短语、句式?
    • 用户对一句话的理解程度如何?
    • 基于此,应用应如何智能调整内容的替换/补充策略?

    我们已经实现了初步方案,但效果不够准确。

    因此,真心请教各位技术大佬:

    1. 数据与建模:如何更有效地通过用户行为数据(如对替换内容的反馈、查词记录、收藏等),更准确、及时地构建和更新这个“语言图谱”?
    2. 算法选择:在算法层面,是否有更先进或更适合此类场景的模型/方法,能帮我们精确评估用户的语言边界和理解程度?(比如,需要考虑哪些关键特征?如何平滑学习曲线?)
    3. 工程与性能:这个图谱既要保证准确性,又不能过于复杂导致计算资源消耗过大,尤其用户量增长后,如何平衡准确性、实时性和系统性能?(例如,有没有轻量级且有效的图谱构建或更新机制?)

    我作为技术“门外汉”,很多方面确实力不从心。任何方向性的指点、相关的关键词、或者成熟方案的提示,对我来说都至关重要。

    如果恰好有朋友对这个领域(个性化语言学习、用户建模)感兴趣,或认同我们想做的事情,非常欢迎各种形式的交流,乃至“技术共创”。


    联系方式: 微信:OrionTyce (欢迎探讨技术问题或交个朋友)

    再次感谢大家花时间看完我的求助!希望能得到宝贵的建议。

    43 条回复    2025-06-13 11:46:07 +08:00
    ujfj1986
        1
    ujfj1986  
    OP
       128 天前
    在线求大佬支招~
    AmandaloveYang
        2
    AmandaloveYang  
       128 天前
    数据与建模可以学习市面上所有的英语学习 app ,几乎殊途同归。
    WispZhan
        3
    WispZhan  
       128 天前
    交个朋友,另外提一个功能需求: 希望能支持 YouTube 自动字幕,类似 Dualsub 这种的,它是可以根据自动(auto-generated)字幕做双语。 但是目前 Ries 好像还不支持 auto-generated 形式的字幕? 反正我每次用都是 disabled ,打不开。也可能是插件冲突。
    ujfj1986
        4
    ujfj1986  
    OP
       128 天前
    @WispZhan 感谢反馈,Youtube 的字幕增强是可以的啊?难道有什么异常,我们今天会更新一版,之前 Youtube 有时候在提取字幕做改造的时候会被判定成 bot ,拿不到字幕,我们优化了一下获取方式~
    ujfj1986
        5
    ujfj1986  
    OP
       128 天前
    @AmandaloveYang 英语学习 app ?指哪些呀?我们也不知道他们具体的底层做法呀。。
    0xLittleFi
        6
    0xLittleFi  
       128 天前   1
    好像挺不错的,我老婆也是英语培训的老师,先试试产品
    th00000
        7
    th00000  
       128 天前
    产品想法不错,但是试用过之后还是用回沉浸式翻译了
    提两点建议把,谢谢 OP 的产品可以免费体验
    一方面是崩溃确实很影响体验,是有消费冲动的想法的,但是止于崩溃
    一方面体验过后发现 AI 给我标注的 “生词” 并不 “生”,而且一些专业词汇其实并不需要被翻译,翻译了反而不知道他是什么东西了,导致我需要反复切换原文,很容易打断看文档的节奏,反而降低了效率

    可能针对每个人 AI 还是需要慢慢调教吧,调教个一两个月没准就准了,但是考虑到 OP 的技术水平可能我调教了两个月,直接给弄没了也是很正常的。
    linshuizhaoying
        8
    linshuizhaoying  
       128 天前
    有 bug 我想禁用某个站点 网页 不生效
    ujfj1986
        9
    ujfj1986  
    OP
       128 天前
    @0xLittleFi 太好了,试试试试~
    ujfj1986
        10
    ujfj1986  
    OP
       128 天前
    @linshuizhaoying 可能数据同步存在某些问题,您是什么浏览器呀?您可以在 settings 里设置一下~
    ujfj1986
        11
    ujfj1986  
    OP
       128 天前
    @th00000 您说的崩溃是什么呀?页面停止响应吗?

    专业词汇不需要翻译这个。。感谢反馈,确实忘记考虑到这个点了,请问是什么类型的,能给我个 url 样本么~
    linshuizhaoying
        12
    linshuizhaoying  
       128 天前
    @ujfj1986 #10 chrome
    sss15
        13
    sss15  
       128 天前
    1. 浏览器的 A 链接无法进行选中,即无法划词,有没有考虑过在下划线上悬浮后能触发划词翻译呢?
    2. 划词翻译中,音标后面希望能加入语音朗读,考虑一下不会认音标的人群。(这样我就可以卸载豆包翻译插件了)
    bojue
        14
    bojue  
       128 天前
    @th00000 这个需求很好,虽然我不搞这类产品
    ujfj1986
        15
    ujfj1986  
    OP
       128 天前
    @linshuizhaoying Chrome 不应该呀。。您试试在 settings 里添加看看呢。。我也测试一下,可能数据同步确实有点问题,block 后可能没存上,您也可以尝试一下白名单增强模式
    ujfj1986
        16
    ujfj1986  
    OP
       128 天前
    @bojue 佬,如果有技术思路也可以指一下路哟~
    ujfj1986
        17
    ujfj1986  
    OP
       128 天前
    @sss15 that's on the way, bro. 排队开发中,hover 解释+发音
    linshuizhaoying
        18
    linshuizhaoying  
       128 天前
    @ujfj1986 #15 就有点麻烦了 其实对用户来说 我更新一键开关而不是去每次配东西
    ujfj1986
        19
    ujfj1986  
    OP
       128 天前
    话说,有没有算法或模型大佬能给指指路,怎么搞高质量的个性化的语言图谱
    ujfj1986
        20
    ujfj1986  
    OP
       128 天前
    @linshuizhaoying 嗯嗯,这个 bug 我们会检查一下尽快给修复了~
    hytex
        21
    hytex  
       128 天前
    1.在 B 站使用的时候,字幕和视频本身的字幕有一定的差异。
    2.有些站我并不想翻译,但是没有第一时间找到关闭翻译的按钮/入口(上方插件栏我习惯不显示,不知道在插件栏里是否有关闭选项)
    3.另外,翻译的字幕由于背景的原因,直接挡住了原视频(被迫学习了属于是/doge)
    ujfj1986
        22
    ujfj1986  
    OP
       128 天前
    @hytex 感谢反馈!!

    关于您提到的问题,是这样的:
    1. 我们是基于 B 站提供的字幕做的改造,可能确实会有一些谐音错别字出现。。很难完全避免。。
    2. 您可以试试我们的快捷键进行手动增强或显示原文的切换,另外我们有提供黑名单和白名单,以及完全手动增强 3 种增强方式,您可以在 settings 里看看哦,选择您合适的~
    3. 这个遮挡您指的是字幕的背景太黑太大了么?还是说我们的遮罩功能给挡住了?可以给我说说我看看怎么优化交互体验~
    hytex
        23
    hytex  
       128 天前
    @ujfj1986 #22 好的,那我回复下第三个回答。
    是的,字幕的背景太黑太大了,直接挡住了视频本身
    1gzNr
        24
    1gzNr  
       128 天前   1
    想法不错的 给你点赞
    ujfj1986
        25
    ujfj1986  
    OP
       128 天前
    @hytex ok ,了解了~我记录一下,支持一下个性化调整字幕大小~

    感谢佬的反馈
    ujfj1986
        26
    ujfj1986  
    OP
       128 天前
    @jiezaichan thanks!!
    ujfj1986
        27
    ujfj1986  
    OP
       128 天前
    感谢 V2EX 让我今天遇到了 3 个超级好的站友~哈哈哈
    ninjaJ
        28
    ninjaJ  
       128 天前
    1 、“如何更有效地通过用户行为数据” 我之前听说过一种根据用户滚动速度/滚动距离/停留时长来分析用户对哪些内容感兴趣的做法。
    2 、语言图谱这个东西底层就是一个图数据库,构建不是一步到位,有点像 LLM 的缓存机制,边用边更新,命中率越来越高。查词和生词本是很多语言学习都有的功能,就是因为它能带来增量反馈。但是话说回来,我感觉您说的这个“图谱”可能不是“那个图谱”。
    3 、性能问题,我理解的 MVP 是越小越好,越快越好,边开车边换轮子做架构升级。软件一棵有生命力的树,你没办法刚种下他就决定它长什么样,它只要在生长,就需要不停地修剪。但是按照我的经验,您现在的用户量完全到不了需要考虑性能的程度(没有任何损 OP 的意思)。
    另外,用大模型太吃性能(性能=成本)了,可以考虑换个思路,其实在大模型出来之前,很多传统算法已经能做很好了,再不济还有专门的小模型,并且在某些专业领域,小模型的输出质量一定是高于大模型的。
    我之前简单用过您的产品,没有太深入,当时脑子里的第一个问题就是您提到的最核心问题,如果决定翻译哪些单词或者句子。当时您的帖子说用的大模型 API ,我的第二个问题是:那得多费钱呀!
    wqhui
        29
    wqhui  
       128 天前
    有意思,不过有点卡
    qocja
        30
    qocja  
       128 天前
    1. 确实如楼上 ninjaJ 所说,你们的语言图谱可能不是个图谱,可能更像一个用户画像,是不是做个单词本/短语本就好了
    2. 目前确实没考虑到合适的,可以先用大模型做评估,积累到用户数据之后再自己做 Fine-tuning ,这里面核心的问题是用户画像如何给到模型做评估,这里倒是可以参考 RAG 的思路
    3. 这个确实不是现阶段要考虑的问题
    ujfj1986
        31
    ujfj1986  
    OP
       128 天前
    @ninjaJ 是挺费钱的。。但既然是要做 AI 产品,肯定得用 LLM 做驱动呀。。不然未来可玩性就很低了,其实我们也试过不用大模型,直接用翻译引擎做。。基本没法用,非常生硬,而且还只能做极少数的 1 ,2 个效果,实时的短语,俚语注解啥的就都做不了。。
    ujfj1986
        32
    ujfj1986  
    OP
       128 天前
    @wqhui 卡?哪里卡呀。。貌似我这儿还好呀。。
    ujfj1986
        33
    ujfj1986  
    OP
       128 天前
    @qocja 你的这个 opinion 非常的正确! RAG 是我们已经使用的 trick ,但核心问题是提供什么样,什么形态的数据或 context 来尽可能准确的让 model 明白用户的图谱或者“画像”
    核心的问题是用户画像如何给到模型做评估
    wqhui
        34
    wqhui  
       127 天前
    @ujfj1986 #32 选中词看翻译大概要几秒,初次设置个人英语水平那几步也是,也可能是我网络问题吧
    ujfj1986
        35
    ujfj1986  
    OP
       127 天前
    @wqhui 哦哦,划词翻译这个目前是访问的一个外部服务,速度是有点慢,我们正在优化,准备做到本地,hover 直接出来
    airfans
        36
    airfans  
       127 天前
    感觉要做口语相关的更好,阅读其实对于咱们来说并不是什么困难
    ujfj1986
        37
    ujfj1986  
    OP
       127 天前
    @airfans 口语竞争有点激烈,不过未来也必然需要做~
    HanMeiM
        38
    HanMeiM  
       123 天前
    合不合伙人的暂且不说,先来点年付优惠好吗哥 @ujfj1986
    sss15
        39
    sss15  
       121 天前
    我冲了一个 Plus 版的年费,才用 2 天 2 万积分就用了 16%了,一天 8%,那就顶多能用 12 天,消耗太大了
    ujfj1986
        40
    ujfj1986  
    OP
       121 天前
    @sss15 我们的产品特性导致我们的处理请求量确实比较大,我们目前还专注在优化体验,成本优化上用户自己本地 cache 是一个可能性,但由于我们人手有限,所以可能需要您稍微多等我们一下,实在抱歉~
    ujfj1986
        41
    ujfj1986  
    OP
       121 天前
    @HanMeiM 有啊,你加我一下给我说一下账号~
    jefferyJQ
        42
    jefferyJQ  
       121 天前   1
    产品很不错,有考虑过支持安卓手机的 app 吗?比如抖音,个人感觉对于这块使用时长会久一些
    ujfj1986
        43
    ujfj1986  
    OP
       121 天前
    @jefferyJQ 额,mobile 我们正在研究如何做~ 我们希望能覆盖尽可能多的日常生活场景~
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2534 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 04:32 PVG 12:32 LAX 21:32 JFK 00:32
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86