
把 DNSCrypt-Proxy 的 TSV 格式的 query.log 用 Python 解析之后,同时插入到下面 4 个数据库中:
然后用 Flask 做一个统计各种 DNS 查询的前端(比如每天最多的 10 个域名 / 10 个客户端,及各种流量图之类),然后对比这 4 个数据库在这类 time series 的实际应用场景中到底能有多大的区别。
p.s.
估计这类问题也是这里很多同学每天正在经历的痛点,所以我就先把想法分享出来了。
1 wph95 2018 年 4 月 23 日 可以加上一个 prometheus 试试(虽然和 influxDB 当前的设计思想基本一致) 实际应用场景可以定义一下, 是写多读少?每分钟写多少量,每分钟查多少量。 |
3 hst001 2018 年 4 月 23 日 via Android 战略性 mark |
4 freeznet 2018 年 4 月 23 日 必须 mark~! |
5 xupefei 2018 年 4 月 23 日 via Android 比较 SQL 和 NoSQL,schema 和 schema-free 需要特别设计数据,因为设计不好的数据直接会造成不平等的比较。Time series benchmarking 在学术界也是个很新的领域,鲜有研究。 给你一篇参考:ftp://ftp.informatik.uni-stuttgart.de/pub/library/medoc.ustuttgart_fi/DIP-3729/DIP-3729.pdf |
6 mlhorizon 2018 年 4 月 23 日 Mark,坐等结果 |
7 bysslord 2018 年 4 月 23 日 via iPhone 最近也在折腾 influxdb,mark |
8 jy01264313 2018 年 4 月 23 日 再加一个 graphite 吧 |
9 bomb77 2018 年 4 月 23 日 期待结果,我先投 influxdb 一票,不知道结果会不会让人惊讶 |
10 sun2920989 2018 年 4 月 23 日 等着看看 |
11 ninion 2018 年 4 月 23 日 同在折腾 influxdb 求问有没有国内用户群 |
12 rrfeng 2018 年 4 月 23 日 每条都入还是单位时间后统计再入?这个差别很大的。另外只有 MySQL 和 ElasticSearch 并没有 time series 的属性。 1. MySQL 必然倒数(少量数据情况下可能胜出),但是需要没有可以配合的前端。 2. ElasticSearch 配 Kibana 不需要前端可以快速出图。 3. InfluxDB 和 TimescaleDB 在非定量场景(一个 series 单位时间内条数一定)会出现什么反应确实很好奇。 4. 可以直接用 Grafana 统一出图,不需要 flask 自己写了。 ES 的区别在于存全量数据(原始日志直接录入),分析可以选择任意字段。Influxdb 通常只用来存聚合后的统计数据……如果也把全量塞进去的话,需要将字段拆成很多很多的 tag,可能会影响查询效率。 |
13 Livid MOD OP PRO |
14 xuanyuanaosheng 2018 年 4 月 24 日 via Android 持续关注 |
15 widewing 2018 年 4 月 24 日 via Android 我用 OpenTSDB 是不是显得比较 out... |
16 freestyle 2018 年 4 月 24 日 via iPhone mark |
18 crystom 2018 年 4 月 25 日 不知道做游戏日志存储哪个好 |
19 Kabie 2018 年 4 月 27 日 最近还看到了一个略有不同的东西…… https://github.com/pipelinedb/pipelinedb |
20 lambdaT 2018 年 5 月 5 日 via iPhone mark |
21 capthy 2018 年 5 月 14 日 influxdb 配合 grafana 做前端很不错 |