各路大佬们!单 IP, IP 段, CIDR 之间如果做集合运算。 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
YahuiAn
V2EX    问与答

各路大佬们!单 IP, IP 段, CIDR 之间如果做集合运算。

  •  
  •   YahuiAn 2020-05-22 19:22:23 +08:00 1905 次点击
    这是一个创建于 1970 天前的主题,其中的信息可能已经有所发展或是发生改变。

    用户输入支持如下格式:

    10.0.17.35

    192.168.1.1/23

    www.baidu.com

    192.37.3.3-192.168.39.39

    现在有一个黑名单功能,也支持如上的形式,想问问这两个集合如何高效的去重呢?

    第 1 条附言    2020-06-02 17:50:19 +08:00

    小弟太菜了,在github上找了一个函数,https://github.com/cilium/cilium/blob/master/pkg/ip/ip.go#L122

    5 条回复    2020-05-23 06:43:51 +08:00
    GeruzoniAnsasu
        1
    GeruzoniAnsasu  
       2020-05-22 19:57:53 +08:00 via Android
    首先不考虑域名和 url

    我当时的实现大概这样

    一个 - 指定的范围可以解析成若干个 cidr 或 ip

    那现在只需要考虑 cidr 一种情况( ip 可以看做 /32 )
    用二叉 trie 来存这些 cidr,在深度为 N 的节点有一个 cidr 对象表示这个 cidr 是 /N

    如果某个节点左右子树都存在则递归向上合并节点

    插入过程中途遇到某个节点说明这节点已经包含了待插入地址,跳过

    然后就没有去重这一说了,匹配就是走这个 trie 跟插入流程几乎一样的

    当时没有去重合并完还要导出合并结果的需求
    GeruzoniAnsasu
        2
    GeruzoniAnsasu  
       2020-05-22 20:03:26 +08:00 via Android
    还有一种方式是直接把 ip 地址算成线性空间,每个区间有左右界,合并的时候先按左界排序,然后判断
    下一个区间的左界有没有落在前一个区间中,如果在,那么区间右界设成下一个区间右界,如果否,那么第一个区间已处理完毕,可以处理 23 区间
    wbrobot
        3
    wbrobot  
       2020-05-22 21:01:35 +08:00
    ip2long,然后算数
    msg7086
        4
    msg7086  
       2020-05-23 00:36:50 +08:00
    听上去就是个和 trie 差不多的结构。
    singerll
        5
    singerll  
       2020-05-23 06:43:51 +08:00 via Android
    转换为 10 进制?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2754 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 15:13 PVG 23:13 LAX 08:13 JFK 11:13
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86