网站一般怎么做简体/繁体切换呢?内容怎么保存?搜索怎么处理? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
roricon
V2EX    编程

网站一般怎么做简体/繁体切换呢?内容怎么保存?搜索怎么处理?

  •  
  •   roricon 2015-02-12 15:51:18 +08:00 5120 次点击
    这是一个创建于 3894 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我简单的想法是,统一保存简体内容,使用繁简切换的JS库。
    搜索时候转换成简体,返回结果再用JS处理一遍。

    我觉得肯定有更好的解决方式,希望大家能给点想法。

    10 条回复    2015-02-12 19:32:06 +08:00
    Agromania
        1
    Agromania  
       2015-02-12 15:56:03 +08:00   1
    如果内容不多,对准确要求高,建议维护简繁两个版本的内容,程序转换是不靠谱的。

    比如简体“后”,解释是古代君主或帝王的妻子的时候,繁体是“后”,解释是空间或时间上与“前”相对的时候,繁体是“後”

    这种情况非常之多。维护一个大词典,做分词和猜测意思,能够从某种程度上解决这个问题,但是古文中很多单字为句的,要联系上下文还要具备专业知识才能判断,不是程序能搞定的。
    roricon
        2
    roricon  
    OP
       2015-02-12 15:59:45 +08:00
    @Agromania
    看来我想的还是简单了。
    lichao
        3
    lichao  
       2015-02-12 16:03:09 +08:00   1
    举个简单的例子

    我们说 软件,他们说 (软体)
    我们说 缓存,他们说 快取

    除非你的转换程序足够智能,否则还是维护两套内容吧
    Agromania
        4
    Agromania  
       2015-02-12 16:15:50 +08:00
    如果内容是你自己维护的,又要追求准确,最好是简体繁体分别维护。

    字典转换的库很不准确,转换出来的繁体在真正使用繁体的人眼里可能是笑话百出的
    词典准确性要好的多,比如楼上说的,你对简体内容做分词,根据词典做单元匹配,把“软件”转换成“”。这个词典会非常大,我记得看过一个,词数是千万条的量级。应该要放在后端处理,JS搞不定。但是还是会遇到一些无法分词匹配不上的情况,

    比如“过年了,我家门上贴了一个 ‘发’ 字”
    这里应该转成,如果转成就要闹笑话了。

    这个诗词网 http://sou-yun.com
    有一个简繁转换的功能http://sou-yun.com/STConvert.aspx
    也许不适用你的场景但是希望能对你有所启发,他们在转换的时候碰到1对多的情况 会分别告诉用户什么意思,让用户自己选择。
    seki
        5
    seki  
       2015-02-12 16:18:52 +08:00   1
    opencc
    wikipedia 也维护有一个较大的简繁转换库

    这些也都不重,但是要 js 完成的话总得把一个数据库传输到用户浏览器里,我国的窄带网玩不动啊
    Kilerd     6
    Kilerd  
       2015-02-12 17:40:15 +08:00 via Android
    直接做好i18n就好啦,
    shiny
        7
    shiny  
       2015-02-12 17:41:49 +08:00
    简体转繁体会有比较多的错误,繁体转简体问题会少很多。
    tmqhliu
        8
    tmqhliu  
       2015-02-12 17:49:07 +08:00
    曾经用过繁体中文版的 Windows XP,用了一周时间,觉得界面有点乱,然后就果段重装……
    abelyao
        9
    abelyao  
       2015-02-12 19:12:05 +08:00
    曾见过一个简繁切换做得非常好的网站,它是这样的:
    cn.domain.com 为简体中文页面,面向大陆用户;
    hk.domain.com 为香港繁体页面,面向香港用户;
    tw.domain.com 为台湾繁体页面,面向台湾用户;

    如果当前你在访问 cn.domain.com/abc/xyz.html 页面,然后点击切换到香港繁体,会直接进入 hk.domain.com/abc/xyz.html 去,页面的外观样式完全一样,但是接下来你就是在 hk 这个子域继续浏览了,体验很赞。

    另外如果访问 domain.com 或者 www 的话,会根据 IP 地址所在地区自动跳入 cn / hk / tw。
    blacktulip
        10
    blacktulip  
       2015-02-12 19:32:06 +08:00
    楼主应该分开维护,非要维护一个的话,维护繁体比较靠谱
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1033 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 18:25 PVG 02:25 LAX 11:25 JFK 14:25
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86