需要高并发读取 xlsx 文件存入数据库怎么处理比较好 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
24 条回复    2025-01-29 22:08:22 +08:00
wen20
    1
wen20  
   258 天前
有多少 xlsx 要读, 还需要高并发
pureGirl
    2
pureGirl  
OP
   258 天前
@wen20 实际不需要多少,但是要处理并发
neoblackcap
    3
neoblackcap  
   258 天前
不是很懂什么叫高并发读取 xlsx 文件,你一个文件需要很多个人一起读?还是一大批文件需要并行处理?
只是简单的并行处理,直接进程池就可以解决问题了
pureGirl
    4
pureGirl  
OP
   258 天前 via iPhone
@neoblackcap 就是会并发上传 xlsx 文件,然后把内容写入数据库
lxue
    5
lxue  
   258 天前
可以实现,celery 是异步的不会阻塞 Django 的 worker 的
neoblackcap
    6
neoblackcap  
   258 天前
@pureGirl 并发上传文件,那先上传到对象存储,然后创建异步任务,慢慢处理
pureGirl
    7
pureGirl  
OP
   258 天前 via iPhone
@neoblackcap 现在就直接把文件转换成二进制存到队列里,然后 worker 一个个处理
neoblackcap
    8
neoblackcap  
   258 天前
@pureGirl 那这个方案现在是有什么问题吗?数据不大的话,处理得快也不是不行
alphaControler
    9
alphaControler  
   258 天前 via Android
并发要解决的是数据竞争问题,你这只是读的话,多少并发都没问题。如果是有写,那就看具体情况,要么按时间片分文件,要么读写锁。
pureGirl
    10
pureGirl  
OP
   258 天前 via iPhone
@neoblackcap 之后可能会有数据比较大的情况
rogerer
    11
rogerer  
   258 天前
@pureGirl 那就做优先级队列?把耗时长的任务放后面一点,并行处理 xlsx 也没有太多特殊的操作。
8355
    12
8355  
   258 天前
不是我说,高并发有 qps50 没。。。。
thoo61871
    13
thoo61871  
   258 天前
异步
随便你怎么实现都行
neoblackcap
    14
neoblackcap  
   258 天前
@pureGirl 那就改成先上传到对象存储,然后你处理的时候再从对象存储读回。反正都落盘了,后续都是慢慢处理的问题的。
sazima
    15
sazima  
   258 天前
很耗时吗? Dajngo 部署不是单进程的,不需要 celery
neoblackcap
    16
neoblackcap  
   258 天前
@pureGirl 还有就是对象存储的读取,记得走 VPC/内网,既省钱,又提高性能
pureGirl
    17
pureGirl  
OP
   258 天前 via iPhone
@neoblackcap 我研究一下,谢谢
opengps
    18
opengps  
   258 天前   1
单个文件的操作是独占的,并非高并发的概念。你可能高频,但不是并发
pureGirl
    19
pureGirl  
OP
   258 天前 via iPhone
@opengps 不是单个文件啊,是多次请求处理文件
pureGirl
    20
pureGirl  
OP
   258 天前 via iPhone
@opengps 高频是什么东西没听说过
windyboy
    21
windyboy  
   257 天前
多个人不可能一起写一个文件
ponyfk
    22
ponyfk  
   257 天前
--- 用 django celery 可以实现吗

可以实现。以我的经验,celery 都不需要,就在 view 代码里面处理
ShineyWang
    23
ShineyWang  
   256 天前 via Android
很多数据库应该直接支持 Excel 导入
512357301
    24
512357301  
   256 天前 via Android
试试 duckdb
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1395 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 35ms UTC 16:36 PVG 00:36 LAX 09:36 JFK 12:36
Do have faith in what you're doing.
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86