最近跟朋友讨论一起搞搞 quant ,技术面是看了某 git ( https://ithub.com/thuquant/awesome-quant )
数据库和硬件层面不知道用 clickhouse 作为数据库,p5510 ,pm9a3 作为存储,适不适合? 拿 clickhouse 的 500w 数据试验了一下,结合 metabase 牛逼极了,没想到超越了 es 这么多
当然目前正处于脑暴 bb 阶段,离最后去创业还差得远
现在互联网不容易,年纪大了随时毕业, 我是搞数据算法的,朋友是搞金融风控的, 君子不器,如果被行业淘汰,总得找找新出路
![]() | 1 cweijan 2022-07-11 14:34:16 +08:00 ![]() clickhouse 和 es 的应用场景不同啊大哥 |
![]() | 2 yang2yang 2022-07-11 14:53:20 +08:00 并发不行把 |
![]() | 3 Agdhfdjh 2022-07-11 14:58:47 +08:00 我也用 ch 做回测数据的存储,加载比 mysql 快太多 |
![]() | 4 tramm 2022-07-11 15:09:49 +08:00 感觉不适合, 并发太低, 除非你的业务展示的数据大家都一样的话, 还有可能. |
5 28Sv0ngQfIE7Yloe 2022-07-11 15:18:06 +08:00 模拟 30 个用户一起聚合查询就能看出问题了,感觉做业务的话 CH 不适合直查,用物化视图输出聚合报表方便些 |
![]() | 6 dzdh 2022-07-11 15:19:04 +08:00 ch 不支持更新哦~~ |
7 vvtf 2022-07-11 15:28:28 +08:00 1. ck 对硬件有要求;内存要求高; 2. 集群副本的话数据量太大 zk 又是一个炸弹 (推荐单节点 zk;) 3. qps 不会很高; 4. 不支持事务;不支持更新删除;(虽然有 update 和 delete 的 dml, 但是这个 ck 离线处理的;) 但是做 olap 报表分析确实不错; |
![]() | 8 1988chg 2022-07-11 15:30:04 +08:00 个人觉得 CK 适合做分析,不适合实时的业务。 |
9 dqzcwxb 2022-07-11 15:38:11 +08:00 觉得 clickhouse 比 es 强,只能说明你的业务逻辑足够简单 |
10 Leviathann 2022-07-11 15:41:16 +08:00 @dzdh replacemergingtree 相当于更新了,不过是异步的 |
![]() | 11 suixn 2022-07-11 15:44:35 +08:00 测一下 Doris 或者 starrocks ,并发会好一些 |
![]() | 12 kxjhlele 2022-07-11 15:53:51 +08:00 clickhouse 我直接限制 5 用户登录,单连接查询最大 100G 内存,百亿 10 多秒就能汇聚好, |
![]() | 13 dzdh 2022-07-11 15:58:50 +08:00 @Leviathann insert 走 maxversion 其实也可。 |
![]() | 14 hush3 2022-07-11 16:07:46 +08:00 一直有个疑问。。。clickhouse 的简称到底是 ck 还是 ch 比较好? 好像这两种都有很多人用 |
![]() | 15 wittyfans 2022-07-11 16:18:59 +08:00 最近也在研究 clickhouse 配合 metabase 用,但可能没办法申请到集群去部署,不知道 clickhourse 部署在单机上效果怎么样? |
![]() | 16 rapperx2 2022-07-11 16:38:13 +08:00 并发是个大问题 |
![]() | 17 xh3ccc 2022-07-11 18:06:53 +08:00 via iPhone ![]() |
18 gabon 2022-07-11 18:15:24 +08:00 via iPhone 我们公司日志系统从 es 换到了 ck ,感觉查询语法更丰富,性能更强。估计每天就得上百 tb 的日志数据。 |
![]() | 20 olaloong 2022-07-11 19:35:38 +08:00 via Android 上周测试环境 zk 炸了连带 ck 全崩了,重建数据搞得怀疑人生 |
![]() | 21 makeitwork OP @wittyfans 目前单机实验状态,稳得很! |
23 gabon 2022-07-12 10:32:32 +08:00 via iPhone @zhygkx 我们这边是运维直接切的,平时查询是在 kibana 上,页面没变,底层数据源从 es 换到了 ck ,切换流程我不太清楚。 |
![]() | 24 ivvei 2022-07-12 13:28:56 +08:00 这帖子看得我莫名其妙,人家搞 quant 要并发干嘛? |
26 yjhatfdu2 2022-08-08 14:26:16 +08:00 @zhygkx ch 使用 ngram bloomfilter 做 skip index ,也可以一定程度满足全文索引的需求,效果也是很不错的 |
27 victorc 2022-08-24 00:15:25 +08:00 这对 quant 来说,根本无关要紧的事,别误入歧途了,搞半天,最后还是在操练编程开发 量化最重要的是实盘能稳定赚钱 我回测也好,实盘也好,啥数据库都不用,全部存文件 |