老板想做一个根据关键词自动生成报告的软件,不知道大概要多少钱? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wontoncc
V2EX    问与答

老板想做一个根据关键词自动生成报告的软件,不知道大概要多少钱?

  •  
  •   wontoncc 2018-01-10 12:54:23 +08:00 4495 次点击
    这是一个创建于 2883 天前的主题,其中的信息可能已经有所发展或是发生改变。

    大概需求如下:

    1. 用户输入关键词,软件在数据库中筛选出命中率最高的几篇文章;
    2. 以这几篇文章为基础,截取目标句型的句子(如 XX 是…,XX 将会导致…,XX 即… 等 5W1H 类句子);
    3. 组合所截取的句子生成专题报告初稿( Word 文档)。

    完全不了解市场,想求问一下找团队或个人开发这样一个应用大概需要多少钱?先行谢过提供信息的各位。

    第 1 条附言    2018-01-10 23:00:20 +08:00

    谢谢各位,看了回复都是觉得需求不够清晰,那我再整理叙述一下:

    背景

    是文秘部门需要向上的各级领导汇报及向下发布专题报告,所以数据库的材料来源是有限且相对固定的,主要包含 公司的发文、管理体系的叙述性文件、近期所发布的生产政策叙述性文件等

    需求

    目前,文秘人员撰写专题报告时,一般会就某个关键词进行展开,展开的内容通常涉及5W1H。当前文秘人员在着手解决这个问题时,是这样做的:

    1. 先搜集所有涉及到此关键词的资料;
    2. 再对这些收集到的资料进行阅读,筛选,摘抄;
    3. 再通过整合删减,最终完成报告的初稿。

    希望通过软件,来简化甚至自动化实现这一个过程。其中,流程1、2是希望能够尽可能完成的,即按照原PO要求尽可能精准的采集数据库中的材料,并针对所提及的目标句型进行归类。因为这类型公文的行文风格相对统一,所以自然语言理解的需求我相信是比较低的。而流程3最好能够做到初步表达所有5W1H要素(即如回复提及的自动写稿);这个我个人感觉相对困难,老板也认为软件早期的版本这个功能可以完成度低一些,因为最终还是需要文秘人员进行润色的。

    15 条回复    2018-01-11 16:37:45 +08:00
    fengchang
        1
    fengchang  
       2018-01-10 14:05:28 +08:00   2
    我觉得看效果吧,如果对报告的质量没什么要求一千万应该就够了
    stevenhan
        2
    stevenhan  
       2018-01-10 14:19:30 +08:00
    现有技术生成的初稿再好也要人工润色,既然要雇有能力润色的人工,那他做文章提取也很容易。
    感觉现有的信息检索就够搞定 1, 雇人做 23 不错。
    murmur
        3
    murmur  
       2018-01-10 14:27:40 +08:00
    这不就最早舆情分析的原型吗
    后来发现这种系统用没有,管事的还是检测到关键字就删帖
    所以要么就简单粗暴卵用没有,要么就靠专业写手
    wontoncc
        4
    wontoncc  
    OP
       2018-01-10 16:01:22 +08:00
    @stevenhan 其实我也觉得既然都要人最后润色,那么做个软件意义也不大,然而老板想要… :x
    TimePPT
        5
    TimePPT  
    PRO
       2018-01-10 16:13:47 +08:00
    wontoncc
        6
    wontoncc  
    OP
       2018-01-10 17:15:59 +08:00 via Android
    @TimePPT 有点像,但是比他这个简单了,应用场景也不同。
    mlhorizon
        7
    mlhorizon  
       2018-01-10 17:17:34 +08:00
    三句话需求的项目,风险系数要 X 10。
    wontoncc
        8
    wontoncc  
    OP
       2018-01-10 17:21:15 +08:00 via Android
    @mlhorizon 有个详细的文档,不过主要是想先了解一下价格,所以也没搬上来。感觉说的也是这些话,看来我整理一下再 APPEND 一下比较靠谱。
    TimePPT
        9
    TimePPT  
    PRO
       2018-01-10 17:38:24 +08:00
    @wontoncc 感觉想要的即使自动写稿机器人……
    TimePPT
        10
    TimePPT  
    PRO
       2018-01-10 17:38:43 +08:00
    @TimePPT 纠错 即使>就是
    schoolers
        11
    schoolers  
       2018-01-10 17:40:22 +08:00
    我这里有成型的系统,可以免费给你们用,可以联系我,昵称就是微信,备注 v2ex
    shoumu
        12
    shoumu  
       2018-01-10 17:54:13 +08:00
    说得太泛了

    面向具体的领域还是开放域?
    数据库的大小?数据库的获取方式?
    截取目标句型是直接抽取文章中的句子?还是需要一定的自然语言理解?
    。。。还涉及到很多的问题吧

    之前在实验室的时候给外面的公司做过类似的系统 http://buzz.yeesight.com/ ,和你的这个需求有相似的地方,但是细节问题太多了,你给的这个需求太简单了

    至于钱,看你要做成什么样子了
    schoolers
        13
    schooler  
       2018-01-10 20:20:24 +08:00
    @shoumu 你这个获取的是原有的文章,只是采集加清洗。而需求我认为是偏向于自动写稿的。
    wontoncc
        14
    wontoncc  
    OP
       2018-01-10 23:00:56 +08:00
    @schoolers
    @shoumu

    是的,倾向于自动写稿。跟 @shoumu 给出的系统感觉差点比较远。我在 APPEND 里面补充了一些细节,烦请两位还帮我看一看。
    shoumu
        15
    shoumu  
       2018-01-11 16:37:45 +08:00
    @schoolers
    我没有说清除,这个系统里有根据关键词生成报告的功能的,对于生成报告这块,我关心的是抽取式的还是生成式的,难度差得挺多的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5217 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 05:48 PVG 13:48 LAX 21:48 JFK 00:48
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86