从日本一个 ftp 拉 3T 的数据过来,速度很慢 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhuzhe1983
V2EX    DevOps

从日本一个 ftp 拉 3T 的数据过来,速度很慢

  •  
  •   zhuzhe1983 2016-12-09 10:49:11 +08:00 19592 次点击
    这是一个创建于 3231 天前的主题,其中的信息可能已经有所发展或是发生改变。
    尝试走美国或者日本的主机建立代理,但是带宽还是不是很理想,不知道大家之前有处理过类似的问题,有可能走哪个国家主机借道快一点?

    代理速度峰值 200k 。

    迅雷本地直接下最快 1M ,但是之后要走定义同步(估计每 10 分钟 300M 这样),所以不大可能一直用迅雷搞。
    106 条回复    2016-12-29 16:34:34 +08:00
    1  2  
    shenxian
        1
    shenxian  
       2016-12-09 11:02:23 +08:00
    aria2 起十个进程下载?
    mrjoel
        2
    mrjoel  
       2016-12-09 11:03:53 +08:00 via iPhone
    ftp 本身在日本,速度应该不慢,代理中转如果愿意给流量费可以试试 aws ,直连试试 QQ 旋风离线。
    duobei
        3
    duobei  
       2016-12-09 11:04:44 +08:00   2
    拷贝到一个盘,寄回来,这样可能比较快
    waye
        4
    waye  
       2016-12-09 11:05:39 +08:00
    @duobei 哈哈 我也想这么说
    kokutou
        5
    kokutou  
       2016-12-09 11:06:03 +08:00 via Android
    挂个线路牛逼的 ss 。。。
    zhuzhe1983
        6
    zhuzhe1983  
    OP
       2016-12-09 11:10:13 +08:00
    @kokutou 有试过 ss ,但是 ss 在美国和日本速度都不理想
    Laynooor
        7
    Laynooor  
       2016-12-09 11:10:59 +08:00   1
    日本主机 → Oneprovider 香港 → 国内移动线路
    geeksu
        8
    geeksu  
       2016-12-09 11:11:02 +08:00
    拷盘寄+1
    simapple
        9
    simapple  
       2016-12-09 11:11:04 +08:00   4
    亚马逊 已经论证了,用卡车运数据其实更快。。。
    zhuzhe1983
        10
    zhuzhe1983  
    OP
       2016-12-09 11:11:34 +08:00
    @duobei 是在不行的话是打算这么弄~但是增量数据还是希望能够快点,不然 300*1024/200 > 10min
    zhuzhe1983
        11
    zhuzhe1983  
    OP
       2016-12-09 11:12:51 +08:00
    @shenxian 估计也是要下很久的~而且后续稳定链路也比较麻烦。
    zhuzhe1983
        12
    zhuzhe1983  
    OP
       2016-12-09 11:13:07 +08:00
    @Laynooor 多谢,一会弄个香港主机试试看。
    Laynooor
        13
    Laynooor  
       2016-12-09 11:14:31 +08:00
    接 7 楼
    测试 IP : 27.0.232.1
    https://ooo.0o0.ooo/2016/12/09/584a2183e69f6.png
    ericbize
        14
    ericbize  
       2016-12-09 11:15:07 +08:00
    楼主不放心别人的话就自己先搞到香港,再跑去香港搬回来。放心的话就让外面的给带回来或者邮寄回来~~~
    yoke123
        15
    yoke123  
       2016-12-09 11:15:48 +08:00
    我擦 3T 的数据 厉害啊 我的哥 开专线?
    firefox12
        16
    firefox12  
       2016-12-09 11:15:57 +08:00
    3T 的数据 你应该考虑 数据一致性的修复和验证。
    ericbize
        17
    ericbize  
       2016-12-09 11:15:57 +08:00
    阿里云隧道打通(国内国外各一台),包带宽?
    cc930415
        18
    cc930415  
       2016-12-09 11:17:21 +08:00
    如果是企业宽带可以问下是否有外网加速服务(电信精品网,联通企业都有,每个月要加钱)
    个人的话可以尝试用微林转发加速走 NTT 线路, 20 元 /24G ,速度可达到 20M ( 2.5 ),但是流量费要 3K 了,可以试着问下客服?,而且根据以往经验,加密大流量会被 GFW 封端口。。。
    wenymedia
        19
    wenymedia  
       2016-12-09 11:17:48 +08:00 via Android
    3T … 飞日本自取可能都比下载快… 两小时航程 往返撑死 3 天
    zhuzhe1983
        20
    zhuzhe1983  
    OP
       2016-12-09 11:18:31 +08:00
    @yoke123 科研数据~体积比较大
    mcfog
        21
    mcfog  
       2016-12-09 11:20:36 +08:00   4
    永远不要低估满载硬盘的卡车的带宽
    zhuzhe1983
        22
    zhuzhe1983  
    OP
       2016-12-09 11:23:47 +08:00
    @firefox12 首先多谢提醒。多文件一共 3T ,单文件本身有做压缩,而且文件格式比较特殊,破坏了估计是打不开的。
    zhuzhe1983
        23
    zhuzhe1983  
    OP
       2016-12-09 11:24:14 +08:00
    @mcfog 哈哈,这个新闻我也看到了
    debiann
        24
    debiann  
       2016-12-09 11:25:56 +08:00
    300M/10minute 的话速度是 4Mbps ,用阿里云开固定带宽可以胜任,长期用也没问题。


    问题是初始的 3T 。
    用美国慢,忽略。
    用日本,有快的,但短时间内 3T 流量,容易被停机。


    所以还是赶阿里云国际版的末班车下载一波。
    sfree2005
        25
    sfree2005  
       2016-12-09 11:26:16 +08:00 via iPhone
    虽然不知道你的应用场景 但是不是这 3T 一定要拉到本地?如果要做各种分析 能不能直接就在外面另外弄个服务器在上面处理?
    zxy
        26
    zxy  
       2016-12-09 11:28:54 +08:00
    你开个 kcp ,我来帮你试试
    d7101120120
        27
    d7101120120  
       2016-12-09 11:31:24 +08:00
    如果条件允许,办一个移动宽带,便宜方便快速专门用来做数据隧道。
    DesignerSkyline
        28
    DesignerSkyline  
       2016-12-09 11:40:50 +08:00
    基因数据吗?这么大。。
    ctj
        29
    ctj  
       2016-12-09 11:43:20 +08:00   1
    移动宽带+1
    wget 单线程下载 Linode 东京节点测速文件
    2016-12-09 11:42:01 (3.83 MB/s) - ‘ 100MB-tokyo.bin ’ saved [104857600/104857600]
    axel 4 线程的话是这个速度
    Downloaded 100.0 megabytes in 19 seconds. (5170.48 KB/s)

    基本上跑满 50M 带宽
    zhuzhe1983
        30
    zhuzhe1983  
    OP
       2016-12-09 11:46:07 +08:00
    @DesignerSkyline netcdf 格式的,多维度气象数据
    goodbest
        31
    goodbest  
       2016-12-09 12:01:25 +08:00
    科研数据走 cernet ipv6 嘛,速度会很快的。
    jeocat
        32
    jeocat  
       2016-12-09 12:01:40 +08:00
    找个日本朋友下载这个数据装进硬盘再寄过来~
    goodbest
        33
    goodbest  
       2016-12-09 12:04:19 +08:00
    各位可能还忽略了一个问题:
    既然这么大的数据,难道那个 FTP 自身就不限速么?
    cedared
        34
    cedared  
       2016-12-09 12:10:16 +08:00
    微林
    techmoe
        35
    techmoe  
       2016-12-09 12:11:33 +08:00 via Android
    在不考虑数据安全性的情况下,可以尝试使用 PCS API 上传到百度云试试
    yulgang
        37
    yulgang  
       2016-12-09 12:35:55 +08:00
    要是用 Amazon S3 中转呢
    chousb
        38
    chousb  
       2016-12-09 12:37:36 +08:00
    这种数据量,请考虑使用顺丰协议。
    jyf007
        39
    jyf007  
       2016-12-09 12:44:49 +08:00 via Android
    @chousb
    cat9life
        40
    cat9life  
       2016-12-09 12:49:49 +08:00
    这么大数据想不到好办法...太快首先源服务器别拖垮了 :)
    zhuzhe1983
        41
    zhuzhe1983  
    OP
       2016-12-09 12:55:40 +08:00
    @goodbest 在日本主机上下载基本可以跑慢百 M
    skylancer
        42
    skylancer  
       2016-12-09 12:55:54 +08:00
    老实说,你要速度的流量费足够你飞日本来回几次了
    香港飞日本的廉价航班也就 4 500 港币
    zhuzhe1983
        43
    zhuzhe1983  
    OP
       2016-12-09 12:59:32 +08:00
    @cedared 由于资源有限,目前我们暂时无法更多的新用户提供服务。 >_<
    deadEgg
        44
    deadEgg  
       2016-12-09 13:01:54 +08:00
    走韩国把,有很棒的路线。
    韩国网络非常快,如果走韩国的话你线路的瓶颈在于韩国到你这。应该可以到 10M 左右
    Sequencer
        45
    Sequencer  
       2016-12-09 13:08:12 +08:00
    然后 3t 文件分段
    开十个 vultr 的最低配
    都装上 btsync
    imyip
        46
    imyip  
       2016-12-09 13:08:17 +08:00 via Android
    BBR
    xzpjerry731
        47
    xzpjerry731  
       2016-12-09 13:08:41 +08:00
    @simapple 求链接或者搜索的姿势……偶尔能看到这个梗,一直找不到出处
    Actrace
        48
    Actrace  
       2016-12-09 13:13:22 +08:00
    楼主 3T 数据用微林 vxtrans 拉估计要破产。
    还是老老实实做成 http 资源,然后用百度或者迅雷什么的离线拉吧。
    cloudbeyond
        49
    cloudbeyond  
       2016-12-09 13:14:10 +08:00
    TsunamiUDP
    wclebb
        50
    wclebb  
       2016-12-09 13:17:19 +08:00 via iPhone
    @xzpjerry731 我刚搜到,亚马逊拉满 17 轮卡车。
    wshedu
        51
    wshedu  
       2016-12-09 13:17:29 +08:00   1
    misty8873
        52
    misty8873  
       2016-12-09 13:20:48 +08:00
    直接让他们发硬盘吧。。。
    lynnworld
        53
    lynnworld  
       2016-12-09 13:24:32 +08:00
    分成 1500 个 2g 的文件,分发到多个主机上,再分别下载。
    irainsoft
        54
    irainsoft  
       2016-12-09 13:26:25 +08:00
    分卷加密压缩 再拉到一个邻居 windows 服务器上百度云吧...

    其实最好的方式还是寄回来
    Wyatt
        55
    Wyatt  
       2016-12-09 13:56:52 +08:00 via Android
    找个日本的主机装锐速或者新出的 BBR 当跳板,应该快很多
    RqPS6rhmP3Nyn3Tm
        56
    RqPS6rhmP3Nyn3Tm  
       2016-12-09 14:01:49 +08:00
    迅雷离线……讲真
    ovear
        57
    ovear  
       2016-12-09 14:13:22 +08:00   1
    正在同步 600G 左右的数据,只能跟 LZ 说,千万不要用 VPN, SS 之类的 GFW 没办法分析的协议。流量一大就 RESET 之,要么就断流。(谁跟我说 CN2 没干扰的_(:з」∠)_,量一大照样干扰的跟渣渣一样,各种 reset ,限速, QOS )
    我现在用的是 UDP 的 SS over KCPTUN + Aliyun HK ,初步稳定下来了,但是问题在于流量放大了两倍左右,不过挺稳定, LZ 可以试试 HTTP 代理。
    ovear
        58
    ovear  
       2016-12-09 14:13:46 +08:00
    @ovear 呃用的是 rsync 同步,不过也够呛的
    cydysm
        59
    cydysm  
       2016-12-09 14:47:02 +08:00
    大阪 speedtest 12Mbps
    mliilm
        60
    mliilm  
       2016-12-09 14:50:39 +08:00 via Android
    试试迅雷离线下载?
    zhuzhe1983
        61
    zhuzhe1983  
    OP
       2016-12-09 14:51:27 +08:00
    现在用日本阿里云 ECS 搭了个 ftp 反向代理,貌似快了很多,杭州本地通过反向代理的 ftp 下载可以到 3M/s ,之前是直接从阿里云国内 ECS 访问日本 ECS ,速度只有 200K/s

    感谢 @Laynooor @d7101120120 @ctj 提醒我国内不同网络的差异性
    zhuzhe1983
        62
    zhuzhe1983  
    OP
       2016-12-09 14:52:46 +08:00
    @mliilm 这个试过,也不是很理想,而且文件个数很多,添加比较麻烦。
    zhuzhe1983
        63
    zhuzhe1983  
    OP
       2016-12-09 14:53:04 +08:00
    @BXIA 这个试过,也不是很理想,而且文件个数很多,添加比较麻烦。
    zhuzhe1983
        64
    zhuzhe1983  
    OP
       2016-12-09 14:55:14 +08:00
    @ovear 感谢分享经验,看来刚才断掉是被 reset 掉了。
    springx
        65
    springx  
       2016-12-09 14:59:33 +08:00
    @zhuzhe1983 科研数据不可以走 ipv6 吗,直接 1000M 起飞啊
    ovear
        66
    ovear  
       2016-12-09 15:03:07 +08:00
    @zhuzhe1983 刚才看了下, UDP 流量被全掐了,中断了。。看来还是要找个自带重传的软件比较靠谱,我这文件数目也好多,不适合做成 http ,不然直接打包就好了。
    lz 找到好方法了记得 @我下哈~,我继续研究怎么传了_(:з」∠)_
    watara
        67
    watara  
       2016-12-09 15:05:36 +08:00
    @zhuzhe1983 个人情况。。。我用日本代理下载日本网盘差不多 8M/s ,可能联通线路连日本比较好
    springx
        68
    springx  
       2016-12-09 15:06:52 +08:00
    如果楼主能接入 ipv6 的话,在日本部署个大带宽的双栈主机做转发,应该可以稳定跑满速。
    zhuzhe1983
        69
    zhuzhe1983  
    OP
       2016-12-09 15:14:50 +08:00
    @springx 但是我们不是教育网啊,普通 IT 公司如何接入呢~
    AsisA
        70
    AsisA  
       2016-12-09 15:21:15 +08:00
    在数据量过大、网络不好的时候,发硬盘确实是个可行的办法, AWS 现在都提供邮寄硬盘的服务了...
    postlive
        71
    postlive  
       2016-12-09 15:38:35 +08:00 via Android
    随便找个阿里 B 的梯子 200mbps 跑满 就看 FTP 主机的带宽了 要不开个 VPS 从 VPS 上往下拖
    nikubenki
        72
    nikubenki  
       2016-12-09 15:42:27 +08:00
    老司机开车吗
    akwIX
        73
    akwIX  
       2016-12-09 15:46:59 +08:00
    亚太地区的流量很贵的,单向计费的那 3TB 多点,双向计费的得 6TB+的流量呢

    你还是寄硬盘吧
    ppwangs
        74
    ppwangs  
       2016-12-09 15:48:41 +08:00
    200k 算你 10 个线程, 2mb/s ,一天 168.75 Gb , 3T 数据大概 18 天。
    我觉得拷到硬盘寄回来可能还要快一点,而且不丢包
    PeterD
        75
    PeterD  
       2016-12-09 16:29:45 +08:00
    试试 aget

    pip3 install aget

    $ aget url -s 100

    -s N
    N 是并发下载个数
    Gran1987
        76
    Gran1987  
       2016-12-09 16:41:04 +08:00 via iPhone
    速度快还便宜的方法我觉得只有邮寄了,在日本找个网速给力的地方把数据拖下来几个小时,寄回中国最多四五天。
    Clarencep
        77
    Clarencep  
       2016-12-09 16:47:27 +08:00
    可以考虑参考菊花厂的这个服务:

    http://www.hwclouds.com/product/des.html
    lslqtz
        78
    lslqtz  
       2016-12-09 16:58:46 +08:00 via iPhone
    @debiann 阿里云只有 2t ,所以要两台断点续传
    debiann
        79
    debiann  
       2016-12-09 17:01:48 +08:00
    @lslqtz 不用。开两台,只用一台下载。流量包是所有 ECS 实例共享的。
    wdhwg001
        80
    wdhwg001  
       2016-12-09 17:21:21 +08:00
    @ovear Resilio 。
    文件分片√
    正确性验证√
    重传√

    可惜它仍然是加密的,且 GFW 不可识别。

    如果想要 GFW 可识别的话,只能自己写脚本分片到 50M 以下,然后目标服务器在国内,备案,然后走 80 端口和 HTTP 协议,特征不给到这份上的话,估计这么大的东西无论怎么传都会被 GFW 当成加密数据的。

    所以我更信赖装着硬盘的卡车。
    aleen42
        81
    aleen42  
       2016-12-09 17:24:14 +08:00
    @wdhwg001 卡车才是王道= =
    yun
        82
    yun  
       2016-12-09 17:46:21 +08:00
    用迅雷,你胆真大。
    我从服务器上 wget 下载的东西都加密的,你还敢用迅雷,他会免费给你保存 10 年滴。
    JJaicmkmy
        83
    JJaicmkmy  
       2016-12-09 18:47:33 +08:00
    坐飞机去日本,第二天带着硬盘飞回来,耗时大约 24 个小时,相当于 1000Gbps 的带宽,而且花费也才几千,我觉得这是最实惠的选择了。
    lslqtz
        84
    lslqtz  
       2016-12-09 18:54:28 +08:00
    @debiann 我是说代购啦 233
    zhs227
        85
    zhs227  
       2016-12-09 18:57:52 +08:00
    一定是买硬盘寄回来或者带回来比较快。
    tiandongxv
        86
    tiandongxv  
       2016-12-09 19:00:45 +08:00
    最好还是拷在硬盘,加密后邮寄,数据太多太大,下载出错率也很高,到时候回来后用密钥解密再转移。
    abbatuu
        87
    abbatuu  
       2016-12-09 19:30:23 +08:00
    上海到茨城 299 春秋是你不二之选
    happilylb
        88
    happilylb  
       2016-12-09 20:40:37 +08:00 via Android
    3T 得看到什么时候啊!!!
    fiht
        89
    fiht  
       2016-12-09 21:05:23 +08:00
    不知道为什么这么纠结...
    前段时间在数据海洋家下了 500G 的不可描述,走 v6 10M/S 也就是一晚上的事情啊..飞去日本就没必要了吧==
    不然的话楼主你给我硬盘,我下载好了给你邮过去...
    boter
        90
    boter  
       2016-12-09 21:07:56 +08:00
    其实我想说。。应该是最近的海底电缆有问题,楼主测试找找跳板即可
    ooh
        91
    ooh  
       2016-12-09 21:29:10 +08:00
    希望 lz 最后能结帖
    zander
        92
    zander  
       2016-12-09 21:34:39 +08:00
    邮寄。
    g5
        93
    g5  
       2016-12-09 22:40:42 +08:00
    京东下单多块 1T 硬盘,最好拷两份数据,走顺丰或人肉,七天内退硬盘。成本就哈哈了。。。。
    jhaohai
        94
    jhaohai  
       2016-12-09 22:42:02 +08:00 via iPhone
    在日本人肉下载然后顺丰回国内
    badcode
        95
    badcode  
       2016-12-10 09:27:18 +08:00
    楼主没有说时间这个前提
    luo362722353
        96
    luo362722353  
       2016-12-10 10:36:13 +08:00 via Android
    可以考虑 BT ,自建 tracker ,准备一台 seedbox ,从 seedbox 回传网盘,或者自动同步网盘…
    zhaoxiting1997
        97
    zhaoxiting1997  
       2016-12-10 11:08:24 +08:00
    开个移动宽带,多播跑满百兆,然后下载 3 天。。。或许你可以去看看移动的百兆光纤会不会提供千兆光猫,能多播到千兆。。。
    lzhr
        98
    lzhr  
       2016-12-10 15:01:38 +08:00
    卡车比光纤快 2333
    JamesMackerel
        99
    JamesMackerel  
       2016-12-10 15:58:16 +08:00 via Android
    不是有一本书里面写过吗?
    没有任何一根光纤的带宽,能够比得上一辆满载硬盘在高速公路上奔跑的卡车。
    ericbize
        100
    ericbize  
       2016-12-10 18:25:51 +08:00
    想起来一个不出境的办法,先下载到百度云,(实测在外面上传百度云并不慢),然后再国内下载回来。 以前同学爬虫的几百 G 数据我就是这样倒腾回国的。 但是我是人在国外, Linux 怎么实现上述操作我就不知道了。当然还有一个办法,运营商的缓存服务器~~~
    1  2  
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2967 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 34ms UTC 14:13 PVG 22:13 LAX 07:13 JFK 10:13
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86