V2EX fishspecial
 fishspecial 最近的时间轴更新
fishspecial

fishspecial

V2EX 第 248927 号会员,加入于 2017-08-16 10:37:26 +08:00
fishspecial 最近回复了
2020-08-21 12:48:54 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@Juszoe 怎么可能嫌弃呢?很欢迎你的帮助!
@inframe 是的,尤其是这次 excel 没有统一的格式,导入数据库正则手机号数据超过了我的技术范围了。
@also24 谢谢你的代码!我今晚下班后试试!
@yzkcy 谢谢你的思路!
@T0m008 侵犯公民信息,主要是股市和房产的。
@Wait845 谢谢不吝赐教!我的小绿 V2ViX1NhbXVyYWk=
@calmzhu 不好意思才回复你,我的小绿 V2ViX1NhbXVyYWk= 白天上班没有时间回复消息。谢谢老乡的帮忙,武汉欢迎你!我一定接待。
@guoyida 我晚上看看这个软件,谢谢!
@huanghaozi 已经卡死了,而且导出的整合 excel 只有文件名和该文件的总行数两列数据
@funcookies 十分需要!晚上我试试其他热心 v 友的代码,运行时间肯定希望尽量在一天以内,时间长了怕电脑崩溃。
@nightv2 好的 我这就去搜一下这篇文章,谢谢!
@dhkjenfbfu 感谢你的专业回答!这些回复我一般不怎么理的。谢谢可爱的 v 友
2020-08-21 00:41:34 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@binux 谢谢指点!老哥可以点一下相关的操作函数吗?
2020-08-21 00:40:38 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@waytoshine 谢谢指点!过程我能理解,但是代码上还是觉得困难了点…唉
2020-08-21 00:25:21 +08:00
回复了 1ver 创建的主题 浏览器 Edge 浏览器没有建议密码的功能?
没有,但是接下来几个小版本更新会加上这个功能。
2020-08-21 00:22:48 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 是的,txt 转为 excel 文件是可行的,但是 excel 无法直接转成文本格式
2020-08-21 00:21:45 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@EscYezi 应该是爆内存了...可能优化之后能行?我技术实在太菜了 /无奈
2020-08-21 00:20:24 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 我怕出 memoryerror,而且这么长时间没接触代码了,数据结构和算法都忘的一干二净。今天写了一个很简单的 demo 对相同文件进行去重后,统计所有 excel 的行数,最后算来有一亿多条,这还是跑到 14000 千个文件左右就爆出 memoryerror 的情况之下。实在是数据量太大了。现在就想有 v2 能帮助下,有大概的代码改改我就可以解决问题就好。
2020-08-21 00:17:30 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@ys0290 我过几个月估计就调回去了。不过这不是在公司跟资本家做事,打击犯罪分子的话,做起来肯定是会当自己的事情去处理的,毕竟也的确是自己的工作任务。(当然自己技术实在有限哈哈哈)
2020-08-21 00:15:17 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@calmzhu 谢谢你的回答! 19000 左右的 excel 中,因为被多次保存,有些 excel 是一模一样的数据,我就通过计算 excel 的行数来保证没有相同行数的 excel (相同行数的数据不同的 excel 这种情况忽略不计)达成去重的目的。因为不管哪个 excel 文件,每一行数据都会包含手机号,也就是手机号的条数就是 excel 的行数,但是这样就会导致,假如一个手机号在多个文件里出现就引起重复计算,所以的确没想好怎么提取 19000 个 excel 的所有手机号来进行总的去重。一假如可以不花太多功夫,一行中有多个手机号的每个不重复的算一个,但假如太麻烦那就统共算一条吧。毕竟数据量太大了,平均一个文件都有 10000 行左右。
2020-08-21 00:08:36 +08:00
回复了 fishspecial 创建的主题 问与答 卑微民警在线求助使用 Python 的 excel 数据分析
@dji38838c 到时候我也逃不脱的哈哈哈,觉得做这个事情很蠢。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     836 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 15ms UTC 21:16 PVG 05:16 LAX 14:16 JFK 17:16
Do have faith in what you're doing.
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86