楼主最近上了电信 199 十全十美+30 升千兆的贼船 小工来家里把原有的 EPON 设备更换成了 SDN 百卓 GP1700 之后就是噩梦的开始
更换后当天第 1 个小时网络极其顺畅,到晚上开始出现延迟、瞬断、丢包的现象 4 月初到现在小工来 3 次更换设备、测试光纤效能全部没有办法解决 要求更换回 EPON 设备也被拒绝,从来没感受到如此绝望的网络质量…
目前局域网 ping 随选网关 192.168.1.1 的丢包率都大于 5%,晚间高峰可以到 10% 上海电信这样整老用户真的是非常的可以了: 大家有没有什么建议改善这种情况的?
192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 400,已接收 = 397,丢失 = 3 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 1250ms,平均 = 30ms
![]() | 1 jousca 2019-05-04 20:48:53 +08:00 光信号的强度多少? -20db 以上算正常。 局域网如果丢包,你应该检查自己本地网才对啊。 测试的时候,你把光纤拔掉,让设备无负载情况下测试。如果丢包。你就要查本地网线有无破损虚接,水晶头这些是不是氧化了。 |
![]() | 2 jousca 2019-05-04 20:50:21 +08:00 喊小工再拿个光猫过来测试。换猫看看是否正常。我遇到过光猫质量问题导致的故障。 |
3 Wucha OP @jousca 已经更换过 3 个光猫,都是在 SDN 层疯狂丢包 PON 发功率: 2.70dBm PON 收功率: -21.43dBm 小工也说光钎质量很好,不过我现在不解的是 为什么丢包会发生在内网(光猫上) 这是从来没发生过的事情,在更换 SDN 设备后出现的。 目前家里的网络布局是:SDN 网关( 192.168.1.x ) -> 主路由器( 10.69.1.x ) -> 游戏路由器( 10.69.2.x ) 通过 10.69.2.108 ping 上层路由及 SDN 网关的结果如下: a) SDN 设备( TTL=62 ) 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 3050,已接收 = 2929,丢失 = 121 (3% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 3700ms,平均 = 72ms b) 主路由( TTL=63 ) 10.69.1.1 的 Ping 统计信息: 数据包: 已发送 = 500,已接收 = 499,丢失 = 1 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 59ms,平均 = 0ms c) 游戏路由( TTL=64 ) 10.69.2.1 的 Ping 统计信息: 数据包: 已发送 = 500,已接收 = 500,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 44ms,平均 = 0ms |
4 fruitscandy 2019-05-04 21:24:40 +08:00 用网线直连光猫,看上网和测速正常不正常 |
5 ThirdFlame 2019-05-04 21:26:05 +08:00 抛开所有设备,pc 直连 SDN 网关,测试 |
6 Wucha OP @fruitscandy 已直连 SDN 网关,测速偏低但由于硬件和负载问题已经是可接受范围内了 下载速度 平均值:104235KB/秒 | 峰值:153226KB/秒 上传速度 平均值:9901KB/秒 | 峰值:10543KB/秒 http://netreport.sh.189.cn/speed/ |
7 Wucha OP @ThirdFlame 已直连 SDN 网关 以太网适配器 以太网: 连接特定的 DNS 后缀 . . . . . . . : 本地链接 IPv6 地址. . . . . . . . : fe80::e192:860:b27f:9bdd%8 IPv4 地址 . . . . . . . . . . . . : 192.168.1.4 子网掩码 . . . . . . . . . . . . : 255.255.255.0 默认网关. . . . . . . . . . . . . : 192.168.1.1 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 500,已接收 = 487,丢失 = 13 (2% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 663ms,平均 = 35ms 估计 ping 多了还是和 #3 的效果一样 |
10 Wucha OP 大致也说一下情况,主要的延迟表现为间接性的高延迟或丢包 大概是这样的表现,主路由( 10.69.1.1 )的 CPU 负载在 10%以内,所以理论上不会出现因主路由负载过高导致与 SDN 网关传输丢包的现象…我甚至换了个主路由现象还是这样,比目前使用的路由 CPU 更快,反而丢包更频繁,等稍晚的时候把所有设备切断,只连个 PC 来 ping 下 SDN 网关下… (学了 8 年网络专业,这次真的触及到我的知识盲区了……感觉专业白学……) 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=3ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=50ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=61ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=155ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=251ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=193ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=96ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=803ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=445ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=99ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=99ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=141ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=146ms TTL=64 请求超时。 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=2ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=21ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间<1ms TTL=64 来自 192.168.1.1 的回复: 字节=32 时间=1ms TTL=64 |
12 Wucha OP @JJBOOM 我有考虑过是否有设备向路由器发起攻击,不过这种排查是否只能一个一个设备接进来再看丢包情况? 我这边设备几乎都是常用且在使用 EPON 时没有发生这种问题 PS: 我家的所有设备均在 10.69.1.x 下,如果有攻击发起难道不是向 10.69 网段攻击吗?有可能跨网攻击到 192.168.1.x ? |
13 xyzhou 2019-05-04 22:00:52 +08:00 via iPhone 额 我昨天晚上也发了一个这样的帖子 我的没你整的路由器那么多 就是一个光猫挨着一个路由器, 现在想换个路由器试试。 如果像你说的是 sdn 的问题 那换路由器也是白忙活啊 不过我有线测速还可以的,但家里都是用无线啊 |
14 Wucha OP @xyzhou 是的,确实换路由器完全徒劳,事实就是在 SDN 上丢的包,而且内网都能丢成这样子更别说外网了。 不过无线测速不能作为接入速率的参考条件,如果你的设备要求网络质量必须有线接入,这是最基础的要求了。 我现在和我这边的小工说换个百兆的 SDN 设备看看是否是 GP1700 这个垃圾设备带不动我这里的负载 :( |
16 Wucha OP @JJBOOM 是的,感觉已经刷新了我对上海电信的三观了…麻烦了这么多次小工到时候被是我自己的问题 据说上海电信一到晚上就 QOS 特别可怕,我到 0 点后试试 拔光钎空载 ping500 和 插光钎通外网 1PCping500 试试效果 真的是糟心 229 一个月的付费 最后还得自己做网络调试 :( |
![]() | 17 18k 2019-05-04 22:18:49 +08:00 我的是 99 的十全十美,好几年前的 EPON 设备 网速不稳维修小哥上次来调了光信号强度,-33db 调到 20 左右 然后说最好不要升级 200M 不稳定。。。 |
18 Fazauw 2019-05-04 22:28:10 +08:00 换个光猫?某宝有卖,选个好点的,大部分地区都有方案直接使用 |
![]() | 19 jousca 2019-05-04 22:46:51 +08:00 换条网线测试呢? PC-SDN 之间的线你有没有换过? |
22 hlz0812 2019-05-04 22:59:19 +08:00 via iPhone 不用 itv 的话改桥接试试? |
23 celeron533 2019-05-04 23:21:44 +08:00 via Android 我来胡扯一番: 1 难道是物理层(网线及接口)的问题? 2 测试的时候尽量断开所有设备(包括二级路由)并重置 ARP 映射表,以免 ARP 病毒之类的情况 3 测试机器的网络协议栈没有魔改过 |
24 Wucha OP ![]() @18k 记住!电信的嘴,骗人的鬼! EPON 稳如狗,SDN 冤大头!能不换就不换!!!血汗泪啊!!我今天搜了下才发现 SDN 被吐槽的渣都不剩… |
25 Wucha OP @celeron533 已经更换了 2 个 SDN 设备,掉线依旧,且 EPON 设备不存在该问题 所以我觉得问题不是发生在我的所有设备上(理直气壮!) |
![]() | 26 Mac 2019-05-05 00:19:00 +08:00 via Android 我是直接给了小工 200,让他给我从仓库挖了一个可以用的中兴独立光猫 |
![]() | 27 wtks1 2019-05-05 00:23:27 +08:00 via Android 好像之前也有人发帖说是换了 SDN 之后出现了莫名的晚间网速异常现象,莫非和楼主的遭遇是一样的? |
29 Wucha OP @wtks1 我这里目前是全天闪断、高 ping,晚上尤其严重…十分绝望 昨天 0 点的时候甚至上海电信的 SDN 服务端崩了 导致我的设备无法认证 直接断网… |
30 Wucha OP @jousca 如果根据大佬所说,我是否可以理解为这种缓冲的情况是实际发生于 SDN 设备上的,SDN 设备的包转发效率没有办法处理我家设备的总发包量导致 发包队列缓冲过多,直接抛弃了部分数据包,最终导致了丢包 及 间接高 ping ? (正在测试空载 ping 值) |
![]() | 31 xdeng 2019-05-05 00:32:28 +08:00 ping 192.168.1.1 都丢包说明是你局域网的问题啊,是不是 WiFi 连接? |
![]() | 32 jciba5n4y6u 2019-05-05 00:34:00 +08:00 这个设备是上海自己搞的,小问题一直不断。这和 SDN 好像没关系啊 |
![]() | 33 tmac6740 2019-05-05 00:40:31 +08:00 via iPhone 换 8245q 光猫 |
34 Wucha OP @fruitscandy @ThirdFlame @justs0o @jousca @xdeng 全局域网 1PC 200ping 结果 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 200,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 1ms,平均 = 0ms -- 百度 baidu.com 123.125.114.144 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 200,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 25ms,最长 = 27ms,平均 = 26ms 结果真的傻眼了…难道真的如 @jousca 所说是上海的 SDN 设备带不动这么多包的转发吗? 稍等把路由接进来看 200ping 结果… |
36 Wucha OP |
38 Wucha OP 进一步测试负载问题,目前 SDN 的网口 1、网口 2 分别连接 主路由器( 10.69.1.x )、游戏路由器( 10.69.2.x ) 目前情况为 2 个路由器都已连入设备(主路由:15 个设备 | 游戏路由:1PC | 所有设备均为挂着没动 单纯的接入而已) 1) 由游戏路由的 PC ( 10.69.2.108 )发起 200ping ※ 其他所有已接入的设备全部空载中 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 200,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 1ms,平均 = 0ms 2) 由游戏路由的 PC ( 10.69.2.108 )发起 200ping ※ 直播用 PC ( 10.69.2.109 )开始推送直播画面( 5000kbps ) ※ 断开主路由( 10.69.1.x )与 SDN 设备的连接 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 199,丢失 = 1 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 1236ms,平均 = 49ms 3) 由游戏路由的 PC ( 10.69.2.108 )发起 200ping ※ 直播用 PC ( 10.69.2.109 )降低推送质量( 3000kbps ) 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 200,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 1ms,平均 = 0ms ???????????????? 4) 恢复已有设置 SDN 网关( 192.168.1.x ) -> 主路由器( 10.69.1.x ) -> 游戏路由器( 10.69.2.x ) ※ 其他部分设备开始搞事(看直播、刷微博、刷微信) 由游戏路由的 PC ( 10.69.2.108 )发起 200ping 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 200,已接收 = 200,丢失 = 0 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 10ms,平均 = 0ms !?!??!?!?!?!?!?! 等今天晚上再试试情况?直播 500kb 每秒都会让 SDN 崩吗…有点不敢相信 |
![]() | 39 jousca 2019-05-05 02:00:58 +08:00 ![]() @Wucha SDN 程序在局端,你要用 500M 以上业务必须用这个设备。我感觉你还不如用 200M 的普通宽带好使…… |
40 Wucha OP @jousca 是的,以前 500M 的时候使用 EPON 设备根本不用考虑设备负载问题…#38 的情况我晚上再试试… SDN 这种情况太让人大跌眼镜了… |
![]() | 41 cst4you 2019-05-05 02:45:38 +08:00 改桥接保平安吧 199 只有宽带的 200M 用户用提速脚本上到 500M/100M(+氮气瓶), 不是美滋滋 |
![]() | 42 redsonic 2019-05-05 02:58:54 +08:00 一直不明白所谓 SDN 猫具体的软硬件配置是什么。没搜到拆机图也没有人 dump rom。不会就是 tr069 升级版+开启 tc+开启 iptables+kill 掉 httpd 吧。 |
![]() | 44 tmac6740 2019-05-05 08:59:41 +08:00 via iPhone 8245q 是 epon 我能跑到 930 下 400 上 |
46 guqikay 2019-05-05 09:31:55 +08:00 这东西真的是看人品。人品差的天天崩,我的百卓已经稳定不重启 133 天了。 |
47 guqikay 2019-05-05 09:37:12 +08:00 @jousca 移动是 GPON,电信是 EPON, 1000M 以下走 1G EPON 1000M 的走 10GEPON,光衰没有可比性。 |
48 263 2019-05-05 09:45:47 +08:00 自己换光猫吧,淘宝买个 85 的 HG8010H EPON ONU,接自己的路由,支持 vlan 的 iptv 啥的都可以解决。 |
49 xenme 2019-05-05 10:08:54 +08:00 via iPhone 目前 SDN 一年多了,稳如狗,就中间移动装宽带把我线拔了断了一次,IP 稳定几个月没问题。还是猫拨号 |
50 htcm8 2019-05-05 10:20:07 +08:00 同 中国电信上海公司的百卓 GP1700 质量奇差 总是莫名奇妙断网 还配了一个特别差的“网络管家”手机 APP |
51 Wucha OP 今天凌晨把直播推流减少到 3000kbps 并且挂了一夜后的结果: 192.168.1.1 的 Ping 统计信息: 数据包: 已发送 = 28161,已接收 = 28160,丢失 = 1 (0% 丢失), 往返行程的估计时间(以毫秒为单位): 最短 = 0ms,最长 = 17ms,平均 = 0ms 配合 #38 的测试结果看 真的让人感到头秃,GP1700 难道就这么点能力吗…这谁顶得住啊 |
52 openbsd 2019-05-05 11:28:12 +08:00 LZ 你排障的思路改下,怀疑哪个设备问题就怼哪个设备 PC 网线 直连猫,拔掉进线 光纤 ping,如果丢包,换猫。 如不丢,连上光纤,ping 某度 /DNS/运营商提供的测试 IP,以千次算,如果丢包率>1% 延迟波动很大,换猫 /检查线路 然后下载个大文件,ISO 之类的,同时播放视频 。再 ping ,看猫在负载下的状况 一般来说,光纤稳定性还是挺好的,但是有些猫不抗压 运营商 QOS 是常态,现在千兆入户,一个小区的出口几百 G 设备也扛不住啊 |
53 Wucha OP @openbsd 排查发现是直播软件 OBS 速率一高就会出现这种症状 但不理解其中原因 目前已降低直播码率 情况已解决 让小工再看看到底啥原理 :( |
54 openbsd 2019-05-05 13:36:41 +08:00 你的猫开了 路由 /无线 功能吗 ? 个人觉得猫还是桥接卡靠谱。 虽然现在猫已经很猛了,但负载上去估计还是扛不住 大佬们不都是 ---桥接猫---企业级千兆有线路由----UBNT AP )))) 的拓扑么 ? |
55 ccino 2019-05-05 13:59:22 +08:00 我现在用的是 169 的 200MB 套餐,之前看到可以免费升级到 300MB,差点心动升了。 打了 10086 后确认需要光猫换成 SDN 设备。还好之前网上看到过 SDN 没有配置端口转换等功能,最后过段放弃。 |
57 huangmiao233 2019-05-05 14:12:30 +08:00 via Android GPON 很成熟的技术呀。换 SDN 干啥? 话说啥是 SDN 几年不干传输都不知道接入网又有啥新东西 |
![]() | 58 bookit 2019-05-05 15:40:10 +08:00 SDN 是软件定义网络那个吗? 纯 cpu 来处理? |
60 jowenzzzzz 2019-05-05 19:05:17 +08:00 via Android 是不是直播上传数据流量大,连接数过多,现在用 100-300M 宽带,bt 下载上传不做限制,很容易占满下载或上传的宽带,也是会出现掉包,卡顿,3000kb 不是占用了 20-30M 的上传宽带了吗,没限制之前是多少? |
61 jowenzzzzz 2019-05-05 19:12:22 +08:00 via Android 看错单位,才 3000kbps,才 3m? |
62 walpurgis 2019-05-05 19:19:38 +08:00 via Android 半年前装的 sdn 网关,经常突然断线几分钟,有时自己会恢复,有时需要重启猫,折腾了一个月 让电信上门换了 2 次后,目前稳定,感觉这货质量堪忧,稳不稳全看人品 |
64 Wucha OP @jowenzzzzz 是的,只要超过 5000kbps = 500kb/s 就会间接性丢包,这是我在用 EPON 设备时从来没遇到过的问题 PS: 上海电信 SDN 服务端从昨天开始坏到现在,好几个平台的网友都在吐槽,没办法认证设备、新设备注册不了,快要被 SDN 秀的头秃了… |
![]() | 65 jpmorn 2019-05-05 21:53:30 +08:00 直播软件 OBS 速率一高就会出现这种症状 ========================= 码率高是不是 cpu 吃完了,这倒是比较符合你内网丢包的症状。 企业里面都是服务器开着各种监控,cpu,pps,bps 之类的,然后看丢包高的时候各个负载。 |
![]() | 66 weizhen199 2019-05-06 11:21:17 +08:00 @openbsd md 我们这边桥接不给 1000M,限速到 500M,不知真假。举报有效吗 |
67 jocover 2019-05-06 15:55:04 +08:00 sdn 光猫真垃圾,upnp 协议支持不完整,无法获得公网 ip,我有个赚钱宝一直在申请端口映射,结果几万条的记录,猫都挂了 |
![]() | 69 steadi 2019-05-06 21:23:09 +08:00 我刚换的时候也碰到过,光猫是 gp1700,在手机控制 app 里把防蹭网关掉,然后把你所有设备设置为认证设备就好了 |
70 hallieastem 2019-05-06 23:05:14 +08:00 @steadi 同 GP1700 只能全网单独接了 LEDE 软路由当二级路由,开 DMZ 后勉强可以稳定运行了 设备状态 设备逻辑 ID: XXXXXXXXXXX 网关序列号: XXXXXXXXXXXXXXXXX 启动时长: 70 天 22 时 2 分 厂家名称: BYZR 网关型号: GP1700 硬件版本: V1.0.0 软件版本: BYZR.3.0.5 设备温度: 58 PON 发帧数: 689500843 PON 发功率: 4.43dBm PON 收帧数: 1260396954 PON 收功率: -21.37dBm |
71 zanzhz1101 2019-05-07 10:01:23 +08:00 GP1700 不是 10GE 那个么。。。。不至于这点负载都承受不起呀,试试开 /关 obs 里的低延迟模式? |
72 jocover 2019-05-07 16:10:34 +08:00 @Wucha 电信 SDN 的 upnp 只能实现端口映射功能,完整协议不支持的,linux 下用 upnpc 客户端发请求就会出问题 |
73 Ts1ng 2019-05-08 16:31:52 +08:00 200m 就很好很够用,何苦去换 500m、1000m 呢,哎 |
74 jocover 2019-05-08 19:46:25 +08:00 SDN 网关下一跳地址也随机变化 ![]() |