40M 的超大 txt, 10 亿+字符,怎么打开? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zxq2233
V2EX    问与答

40M 的超大 txt, 10 亿+字符,怎么打开?

  •  
  •   zxq2233 2019-03-17 13:01:07 +08:00 15858 次点击
    这是一个创建于 2452 天前的主题,其中的信息可能已经有所发展或是发生改变。
    同事把她给我的语音转换成了 base64,存储在在一个 txt 中,我想解码这段语音

    我尝试过用 windows 的记事本打开它的话,电脑会卡死,用 EditPlus 打开僵死一阵子之后就崩溃了,用 NotePad++打开就是提示文件太大不能打开,Eclipse 更不行。以前曾据说 UltraEdit 行,试了下却不行。
    有没有办法打开啊
    第 1 条附言    2019-03-17 14:10:37 +08:00
    此帖终结
    谷歌找到了解码工具
    https://sourceforge.net/projects/base64-binary/
    99 条回复    2024-05-06 22:56:58 +08:00
    edgnoz
        1
    edgnoz  
       2019-03-17 13:05:49 +08:00
    Large Text File Viewer
    试试这个?
    Judoon
        2
    Judoon  
       2019-03-17 13:07:11 +08:00 via Android
    vim
    alvin666
        3
    alvin666  
       2019-03-17 13:07:18 +08:00 via Android   2
    你用记事本 notepad++能解码??
    用解码工具啊

    “我有个 5g 大小的视频不能用记事本打开怎么办?”
    用视频软件打开啊
    Ansen
        4
    Ansen  
       2019-03-17 13:08:48 +08:00 via iPhone
    好久 40M 也算大了……经常打开 4g 的 log 文件
    win10 上 gvim/sublime/vscode 都没问题,排名分先后
    webdisk
        5
    webdisk  
       2019-03-17 13:08:59 +08:00   12
    40M 就算超大了么?
    解码的话不用打开啊, 直接 base64 -d 40M.txt > x.mp3 就行了
    alex321
        6
    alex321  
       2019-03-17 13:09:03 +08:00
    试过用 VSCode 打开过几百兆的 txt。po 主可以试试。
    blless
        7
    blless  
       2019-03-17 13:09:15 +08:00 via Android
    base64 好处理啊 按 4 的倍数读字节就好了啊
    zxq2233
        8
    zxq2233  
    OP
       2019-03-17 13:09:18 +08:00
    @alvin666 我需要把 base64 文本提取出来 decode
    Athrob
        9
    Athrob  
       2019-03-17 13:10:14 +08:00 via iPhone   2
    emeditor
    MoHen9
        10
    MoHen9  
       2019-03-17 13:12:49 +08:00 via Android
    Windows 的话 sublime,上 G 也没问题,Linux 可以用 vim
    PureWhiteWu
        11
    PureWhiteWu  
       2019-03-17 13:13:57 +08:00
    @zxq2233 直接写个代码读取并解码不好么……
    RyuZheng
        12
    RyuZheng  
       2019-03-17 13:15:07 +08:00 via iPhone
    写个 Python 呀,花一点点时间搜索和学一下。
    ruiowe
        13
    ruiowe  
       2019-03-17 13:15:55 +08:00
    40T 才勉强算得上超大
    penisulaS
        14
    penisulaS  
       2019-03-17 13:19:19 +08:00
    你同事到底想干嘛,不直说
    lzvezr
        15
    lzvezr  
       2019-03-17 13:20:51 +08:00 via iPhone
    楼主是要打开以后 Ctrl+A,Ctrl+C,Ctrl+V 复制到在线解码网站上?
    pkokp8
        16
    pkokp8  
       2019-03-17 13:23:10 +08:00 via Android
    打不开就切割成两个
    KgM4gLtF0shViDH3
        17
    KgM4gLtF0shViDH3  
       2019-03-17 13:24:42 +08:00 via iPhone
    ( ;Д`)撩妹都要会这个技能吗
    iyuli
        18
    iyuli  
       2019-03-17 13:31:43 +08:00   1
    UltraEdit,内存要够大
    ljspython
        19
    ljspython  
       2019-03-17 13:35:20 +08:00   1
    不用解了,一般这种情况都可以直接上...不好意思粗俗了...直接表白了
    AlisaDestiny
        20
    AlisaDestiny  
       2019-03-17 13:36:55 +08:00
    你怕是用了个假的 nodepad++.
    https://notepad-plus-plus.org/community/topic/12869/what-is-the-max-file-size-for-v7x64/2

    根据上面的帖子和他们贴出的源码,notepad++的上限是 2G。
    MiaRunis
        21
    MiaRunis  
       2019-03-17 13:38:25 +08:00
    40M 太简单了 notepad++解决。
    不行的话换
    PilotEdit Lite
    nanaw
        22
    nanaw  
       2019-03-17 13:39:48 +08:00 via Android
    vscode 应该可以。首次打开会提示文件过大是否以大内存模式重启
    wukongkong
        23
    wukongkong  
       2019-03-17 13:40:09 +08:00 via Android
    @kzfile 感觉 love you .没那么大……
    murmur
        24
    murmur  
       2019-03-17 13:43:23 +08:00
    40m 怎么也算不上大。。
    ThirdFlame
        25
    ThirdFlame  
       2019-03-17 13:45:59 +08:00
    log view pro
    AwayEM
        26
    AwayEM  
       2019-03-17 13:46:49 +08:00 via iPhone
    vim emacs vscode 应该都可以
    nimrc
        27
    nimrc  
       2019-03-17 13:47:02 +08:00 via iPhone
    40m 一点都不大 算小文件
    ll3027
        28
    ll3027  
       2019-03-17 13:50:56 +08:00
    nodepad++
    geekdada
        29
    geekdada  
       2019-03-17 13:58:07 +08:00
    是你会裸眼解码还是怎么着吗,为什么要打开他
    isnowify
        30
    isnowify  
       2019-03-17 13:59:14 +08:00 via iPad
    sublime 无压力啊
    zxq2233
        31
    zxq2233  
    OP
       2019-03-17 14:02:19 +08:00
    @geekdada 是一个 json 文件。我需要读取某个 key 的值,必须删掉格式
    mikeguan
        32
    mikeguan  
       2019-03-17 14:02:21 +08:00 via Android
    不明白为什么需要打开啊,直接解码不就可以了。
    PS:40M 文件真的不大,几百 G 的文本都见过
    longline
        33
    longline  
       2019-03-17 14:03:42 +08:00 via Android
    几百兆 VScode 没问题
    swsh007
        34
    swsh007  
       2019-03-17 14:25:25 +08:00 via Android
    ultraedit
    第一次测试的时候可以打开 30m 的 log 文件
    那是 1997 年
    goodboy886
        35
    goodboy886  
       2019-03-17 14:28:33 +08:00 via iPhone
    notepad++无压力啊
    wtks1
        36
    wtks1  
       2019-03-17 14:34:16 +08:00 via Android
    win 上 ue 经常打开过 g 的文件没问题啊
    yksoft1ex
        37
    yksoft1ex  
       2019-03-17 15:04:56 +08:00
    40M 而已,记得当年网易泄露的那个,好多个几个 G 大的 SQL 文件。大站的数据库导出来,几十上百个 G 小菜一碟吧。。
    不过如果仅仅是解码 base64,不用打开吧,可以直接流式解码
    Quaintjade
        38
    Quaintjade  
       2019-03-17 15:05:12 +08:00
    为啥 10 亿+字符的 txt 只有 40MB ?还是说压缩之后 40MB ?
    Quaintjade
        39
    Quaintjade  
       2019-03-17 15:06:09 +08:00   1
    顺便高亮一下第一句话的“她”字
    peteryzy
        40
    peteryzy  
       2019-03-17 15:12:44 +08:00 via Android
    py 写个就行
    opengps
        41
    opengps  
       2019-03-17 15:14:07 +08:00
    写个程序,逐行读取
    moln
        42
    moln  
       2019-03-17 15:25:50 +08:00   1
    就我一个人关心女同事说了啥?
    Greatshu
        43
    Greatshu  
       2019-03-17 15:31:44 +08:00
    40M 真的不大,$$Tap 有一次在程序目录下生成了一个 50 多 GB 的.log 文件,我用的是 glogg
    https://glogg.bonnefon.org/description.html
    alakey1989
        44
    alakey1989  
       2019-03-17 15:33:49 +08:00
    @Quaintjade 你坐下
    Ediacaran
        45
    Ediacaran  
       2019-03-17 15:48:24 +08:00 via iPhone   1
    40m,读了本小说吗?
    freefcw
        46
    freefcw  
       2019-03-17 16:15:17 +08:00
    问题不是大,应该是一行太长了
    binux
        47
    binux  
       2019-03-17 16:32:46 +08:00 via Android
    @zxq2233 那就 jq 啊
    Dragonish3600
        48
    Dragonish3600  
       2019-03-17 16:35:55 +08:00 via iPhone
    Emeditor,专业打开大文件
    notreami
        49
    notreami  
       2019-03-17 16:52:25 +08:00
    才 40M。。楼主下次要问 40GB,这才有意思。
    styang
        50
    styang  
       2019-03-17 17:08:45 +08:00
    sublime text
    mmdsun
        51
    mmdsun  
       2019-03-17 17:11:07 +08:00 via Android
    tail -f - n
    alect
        52
    alect  
       2019-03-17 17:48:10 +08:00
    我很好奇她给你说的什么东西还要转码成 txt,码农的乐趣吗?
    killerv
        53
    killerv  
       2019-03-17 18:22:07 +08:00
    我还以为多大……
    zhujinliang
        54
    zhujinliang  
       2019-03-17 18:33:11 +08:00 via iPhone
    @Ansen 排名分先后好评
    ETiV
        55
    ETiV  
       2019-03-17 18:37:15 +08:00
    等等,40MB 的 base64 编码,不就应该是 400 万 个字符而已吗。怎么 1 亿+的
    valorachen
        56
    valorachen  
       2019-03-17 18:52:38 +08:00 via Android
    解码这段语音跟打开这个文件有啥关系?打开了能看到懂直接人工转码?写个代码直接转换才是解决方法吧
    zhtttyecho
        57
    zhtttyecho  
       2019-03-17 19:01:45 +08:00
    异性的各种看不懂的暗示都按表白算
    skadi
        58
    skadi  
       2019-03-17 19:17:44 +08:00
    她? 表白?
    UN2758
        59
    UN2758  
       2019-03-17 19:26:40 +08:00
    @AlisaDestiny #20 但是实际上 300mb 左右的文档就会打不开了
    hundan
        60
    hundan  
       2019-03-17 19:28:12 +08:00 via Android   1
    异性乱码皆表白?
    wlh233
        61
    wlh233  
       2019-03-17 19:43:39 +08:00   1
    知道是 base64 了还打开干嘛 ?
    base64 -d voice.txt | ffplay -i pipe:0
    yidinghe
        62
    yidinghe  
       2019-03-17 19:44:57 +08:00 via Android
    everedit
    jianghu52
        63
    jianghu52  
       2019-03-17 20:14:34 +08:00
    我用 emediter 打开过 4g 的 sql。他可以分段显示。但是对于这种解码的,不知道行不行
    immutable
        64
    immutable  
       2019-03-17 20:39:49 +08:00 via Android
    vim
    sampeng
        65
    sampeng  
       2019-03-17 21:18:53 +08:00 via iPhone
    base64 -d xxx.txt > xxx.mp4 很难么…
    churchmice
        66
    churchmice  
       2019-03-17 21:31:17 +08:00
    linux 下我用 vim 开过 1G 的日志文件无压力
    aristotll
        67
    aristotll  
       2019-03-17 21:45:34 +08:00
    vim
    miaotaiz
        68
    miaotaizi  
       2019-03-17 21:49:55 +08:00 via iPhone
    活该你单身
    EscYezi
        69
    EscYezi  
       2019-03-17 22:30:58 +08:00 via iPhone
    虽然 40MB 不大,但是 base64 编码后的字符串只有一行,文本编辑器打开确实会崩
    Shynoob
        70
    Shynoob  
       2019-03-17 22:40:14 +08:00
    你打开又不能解码。。当然是找解码工具啊
    Azure42
        71
    Azure42  
       2019-03-17 22:51:40 +08:00
    EmEditor,对大文件有优化,分块加载,经常用它看几百兆的 log
    yghack
        72
    yghack  
       2019-03-17 22:54:31 +08:00
    vim 10G 无压力
    13160919135
        73
    13160919135  
       2019-03-17 23:00:49 +08:00
    写个方法,用 nodejs 读取
    Yien
        74
    Yien  
       2019-03-17 23:47:33 +08:00 via iPhone   3
    没人好奇她说的什么?
    id7368
        75
    id7368  
    PRO
       2019-03-18 03:53:48 +08:00
    比较奇怪 40M,Editplus 怎么会卡的,我是 Editplus N 年老用户了,以前下载的各种文本型数据库都是用这个打开的,几个 G 的文件基本几十秒就可以加载出来了,但是内存消耗的确实比较大
    sm0king
        76
    sm0king  
       2019-03-18 08:40:45 +08:00
    没人好奇她说的什么?
    shyrock
        77
    shyrock  
       2019-03-18 08:41:04 +08:00
    po 主的 notepad++必须是假的,我日常用来打开的日志文件都是 80M+啊
    billwang
        78
    billwang  
       2019-03-18 08:54:27 +08:00
    40M ?哈哈,真的不算大,几个 G 的文本文件在服务器上真的很常见。
    thfurior
        79
    thfurior  
       2019-03-18 09:04:29 +08:00 via Android
    vscode,打开过 1g 的 sql
    winiex
        80
    winiex  
       2019-03-18 09:10:40 +08:00
    这里出现打不开的问题应该不是 40M 大小的问题,很可能是这 40M 文本只有一行,这样导致编辑器的渲染算法不太好高效率地处理它。

    如果 40M 文本包含许多行文本,那基本上常见的 Text Editor 都是可以轻松加载的。
    log4geek
        81
    log4geek  
       2019-03-18 09:32:41 +08:00
    可能楼主是 1G 内存的电脑。。
    a4854857
        82
    a4854857  
       2019-03-18 09:32:46 +08:00
    我用记事本都打开过 500m 的 txt..当时是一个字符动画来着
    EdwardL
        83
    EdwardL  
       2019-03-18 09:33:27 +08:00
    干嘛要打开?直接写个两行 py 解不就好了吗。。。。
    ymj123
        84
    ymj123  
       2019-03-18 09:34:43 +08:00 via Android
    40M 的 TXT 不大,至于你这个卡死,估计是电脑太垃圾?
    a226679594
        85
    a226679594  
       2019-03-18 09:44:47 +08:00
    上个 i9
    la9998372
        86
    la9998372  
       2019-03-18 09:44:50 +08:00
    有点意思。
    huiyadanli
        87
    huiyadanli  
       2019-03-18 09:53:15 +08:00
    Emeditor 20G 的文本都能打开。。。
    wqzjk393
        88
    wqzjk393  
       2019-03-18 09:54:51 +08:00
    纯文本处理 win7 下直接 gvim 就可以了。需要更具体的处理可以 pandas 或者开个 access。
    zhila
        89
    zhila  
       2019-03-18 09:58:43 +08:00
    才 40m,大吗
    taobibi
        90
    taobibi  
       2019-03-18 10:02:50 +08:00
    notepad++了解一下
    jkjoke
        91
    jkjoke  
       2019-03-18 10:07:43 +08:00
    所以到底说了什么
    crayygy
        92
    crayygy  
       2019-03-18 10:20:55 +08:00
    曾经做论文的时候一个数据文件 10G 的我愣头愣脑的用 sublime 打开了,居然还真的能打开...
    paouke
        93
    paouke  
       2019-03-18 10:26:47 +08:00
    经常用 nodepad++打开 100 多 M 日志啊,你是文本都在一行,估计就炸了
    liuxey
        94
    liuxey  
       2019-03-18 10:27:41 +08:00
    这是女程序员新的考验方式吗?
    Orciorc
        95
    Orciorc  
       2019-03-18 10:47:41 +08:00 via Android
    akelpad
    XxxxD
        96
    XxxxD  
       2019-03-18 10:49:03 +08:00
    @crayygy 300MB 的 json 文件用 sublime 打开,等待约 30s, 无法想象你的电脑配置
    dyxLike
        97
    dyxLike  
       2019-03-18 11:32:53 +08:00
    所以说到底为啥打不开? 单行过长吗?
    SekiBetu
        98
    SekiBetu  
       2020-11-24 01:56:02 +08:00
    2020 年回来看看,现在这个问题有一个软件解决了,叫 emeditor,200G 的也能打开
    MatthewHan
        99
    MatthewHan  
       2024-05-06 22:56:58 +08:00
    @Greatshu 好用,在 十几 G 的情况下,比 Emeditor 打开和检索速度差一点,但是够轻量,比 Emeditor 舒服点。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5187 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 48ms UTC 05:47 PVG 13:47 LAX 21:47 JFK 00:47
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86