在文件上实现 malloc 和 free - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
roy2220
V2EX    分享创造

在文件上实现 malloc 和 free

  •  
  •   roy2220 2020-02-15 19:45:03 +08:00 3091 次点击
    这是一个创建于 2069 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有时候需要在文件上构建一颗 B 树、一张巨大的哈希表(动态数据结构)

    面临的第一个问题:在文件上还能存数据结构的内存指针吗?不能,只能存文件偏移代替

    第二个问题:怎么对文件的存储空间进行管理?

    构建 B 树、哈希表要为数据结构申请存储空间(文件偏移),删除数据会释放存储空间(文件偏移),已释放的存储空间能被重新利用吗?会不会有碎片化的问题?

    看起来都指向了这个答案:在文件上实现 malloc 和 free

    目前想到的方案:

    • 大块存储空间使用 buddy 分配算法、小块存储空间使用 freelist (改良变种)管理
    • “内存”管理的元数据和普通数据一起持久化到文件
    • 使用 mmap 映射文件方便读写,使用 truncate 伸缩文件

    初步做了一个 naive 的实现(使用 go )https://github.com/roy2220/fsm

    有兴趣一起讨论交流!

    6 条回复    2020-02-17 20:43:10 +08:00
    codehz
        1
    codehz  
       2020-02-16 02:13:31 +08:00 via Android
    第一个问题是错的,任何现代操作系统都提供了内存映射功能。。。
    roy2220
        2
    roy2220  
    OP
       2020-02-16 04:04:14 +08:00
    @codehz 实现上已经使用了 mmap 映射文件,但是每次内存映射的地址不确定(虽然 mmap 可以指定写死的映射地址,数据结构也就可以直接引用这个地址,因为不会变化,但是这样做太 trick ?)。还是记录文件偏移更健壮,外加使用 protobuf 做数据结构的序列化,这样大小端、内存对齐就和平台无关了
    codehz
        3
    codehz  
       2020-02-16 08:39:32 +08:00 via Android
    @roy2220 这个解释可以,只是你不能说它没这个功能((
    另外你做这个是要折腾数据库吧。
    Mithrandir
        4
    Mithrandir  
       2020-02-16 13:50:05 +08:00
    mmap + 地址重定位可解
    roy2220
        5
    roy2220  
    OP
       2020-02-16 15:25:08 +08:00 via iPhone
    @Mithrandir 现在的方案是运行时用 mmap 地址+文件偏移定位数据块
    zhuyie
        6
    zhuyie  
       2020-02-17 20:43:10 +08:00   2
    可以看看微软是怎么做的。微软开源了 Outlook 所用的 PST 文件格式,它由底至上抽象了 3 个层:
    1. NDB Level: Node database, basic storage
    2. LTP Level: Heap, BTree, Property bags, Tables
    3. Messaging Level: Folders, Messages, Atachments

    https://docs.microsoft.com/en-us/openspecs/office_file_formats/ms-pst/141923d5-15ab-4ef1-a524-6dce75aae546
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5349 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 09:04 PVG 17:04 LAX 02:04 JFK 05:04
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86