各位 V 友,在 Linux 中下载的中国知网论文,标题是乱码,请教简便地如何使标题恢复正常 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
Gandum
V2EX    Linux

各位 V 友,在 Linux 中下载的中国知网论文,标题是乱码,请教简便地如何使标题恢复正常

  •  
  •   Gandum 2015-03-28 17:07:22 +08:00 10536 次点击
    这是一个创建于 3851 天前的主题,其中的信息可能已经有所发展或是发生改变。

    例如,我想下载一篇题为《数学归纳法的发展历程》的论文,下载工具是Chrome,但是下载下来的文件会变成§é¨ú_.pdf

    目前已经想出一种方法:先压缩成zip文件,然后设定LANG=C用7z解压,解压后再转换编码

    zip a.zip *
    LANG=C 7z x a.zip
    convmv -f gbk -t utf8 --notest -r .

    压缩再解压这种方法无疑过于繁琐,而且文件数量多的话肯定不合适,毕竟这应该是一个只涉及到重命名文件的问题,不知各位V友有什么简便的方法。

    本人知识背景:非程序员,希望能够用Shell或者Python解决这个问题

    非常感谢!

    19 条回复    2018-11-22 21:40:05 +08:00
    xinhugo
        1
    xinhugo  
       2015-03-28 17:41:40 +08:00
    limbo0
        2
    limbo0  
       2015-03-28 18:21:28 +08:00
    许多论文没有pdf!
    许多pdf里面都是乱码!
    Gandum
        3
    Gandum  
    OP
       2015-03-28 18:22:29 +08:00
    @xinhugo 额。。兄台这不是答非所问么
    muzuiget
        4
    muzuiget  
       2015-03-28 18:28:48 +08:00   6
    这种烂网站几乎都是坚守 GBK 编码的,我老早前就喷过了,还写了个 Firefox 扩展

    http://qixinglu.com/post/redisposition.html

    至于本地的乱码文件名呢(解压一些 zip 经常遇到),自己撸了个 Python 脚本解决。

    https://github.com/muzuiget/python-scripts/blob/master/utf8-filename.py

    $ ls
    §é¨ú_.pdf
    $ utf8-filename *
    数学归纳法的发展历程_冯进.pdf
    Goooogle
        5
    Goooogle  
       2015-03-28 18:33:54 +08:00   2
    @limbo0
    硕士博士论文只是没有直接提供下载链接而已
    http://a-nerd.info/?p=1795
    lusyoe
        6
    lusyoe  
       2015-03-28 19:16:46 +08:00 via Android
    如果用的是Ubuntu可以下一个nautilus扩展解决这个问题,nautilus-filename-repairer
    Gandum
        7
    Gandum  
    OP
       2015-03-28 19:17:45 +08:00
    @muzuiget 多谢,您的脚本十分好用!
    xinhugo
        8
    xinhugo  
       2015-03-28 19:22:31 +08:00
    @Gandum 第一条搜索结果,就是解决方案,怎么答非所问了?
    hitsmaxft
        9
    hitsmaxft  
       2015-03-28 19:25:55 +08:00 via iPhone
    alas cOnvmv=convmvfunc(){mv $1 "$(echo $1|iconv -f gbk)" }

    大概这样,手机上不好验证
    s51431980
        10
    s51431980  
       2015-03-28 19:26:27 +08:00
    试试 convmv

    ```
    sudo apt-get install convmv
    man convmv
    ```
    Gandum
        11
    Gandum  
    OP
       2015-03-28 19:28:16 +08:00
    @lusyoe 从网站下载后文件已经被认定为UTF-8编码,这个扩展不起作用的。Thank you anyway.
    RecursiveG
        12
    RecursiveG  
       2015-03-28 20:16:22 +08:00   1
    echo -n '§é¨ú_.pdf' | iconv -f utf8 -t iso-8859-1 | iconv -f gbk -t utf8
    ynyounuo
        13
    ynyounuo  
       2015-03-28 20:33:29 +08:00
    @RecursiveG
    正想说可以用 iconv
    kongdeyuan
        14
    kongdeyuan  
       2015-03-29 01:53:27 +08:00
    解决的办法 确实很多学习了,感谢。我这条回复属于垃圾信息吗。。。
    xieyudi1990
        15
    xieyudi1990  
       2015-03-29 08:36:24 +08:00 via iPhone
    每次在Linux下用tar打包文件名带中文的文件时, 发给用gbk的中文Windows的人解压也是各种问题.
    hitsmaxft
        16
    hitsmaxft  
       2015-03-29 10:27:25 +08:00   1
    @hitsmaxft 最后来个完整版本
    ```
    convmv(){ mv "$1" $(echo -n "$1" | iconv -f UTF-8 -t ISO-8859-1 | iconv -f gbk)}
    ```

    ```
    convmv '§é¨ú_.pdf'
    ```
    vjnjc
        17
    vjnjc  
       2015-03-29 23:41:36 +08:00
    enca -L zh_CN -x UTF-8 file1
    试试这个,我一直用它来搞定gbk乱码的
    yanwen
        18
    yanwen  
       2016-07-02 15:21:10 +08:00
    @muzuiget 你好啊 你网站 http://qixinglu.com/post/redisposition.html 打不开了。。。 这个扩展还有不??求一份 y4nwen#gmail.com
    wangzilinn
        19
    wangzilinn  
       2018-11-22 21:40:05 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2486 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 42ms UTC 15:28 PVG 23:28 LAX 08:28 JFK 11:28
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86