
如果要搭建物联网大数据平台,接收来自众多设备的时许数据,以及分析查询,预警等功能,这样的要求需要采用什么样的数据存储方案,sql 数据库还适用吗
1 nnnToTnnn 2019-08-28 14:06:54 +08:00 推荐使用 apache hadoop 当然 mysql cluster 也能支撑,但是生态没有 hadoop 的强,这是我了解到的 |
2 chucongqing 2019-08-28 14:08:21 +08:00 hdfs |
3 qihao 2019-08-28 14:17:48 +08:00 influxdb、opentsdb 时序数据库 |
4 daijinming OP @qihao 朋友这种数据库好用吗,相对 sql 而言 |
5 netnr 2019-08-28 14:35:26 +08:00 说个文件数据库方案,用 sqlite,按设备按日期分文件(夹)存储 可以用常规的关系型数据库存储设备列表,每一个设备所产生的数据,分文件夹,分月或周或天存储,分的颗粒度较小时,可以间隔一段时间生成中间统计(按天存储时,一个月完,生一张月统计表,一年完生成一张年表,方便后续查询统计) |
6 freeznet 2019-08-28 16:51:20 +08:00 时序数据的话无脑推 timescale db |
7 fengyj 2019-08-28 16:52:18 +08:00 hadoop 系列 HBase 数据库 |
8 funky 2019-08-28 16:53:38 +08:00 无脑 timescaledb +1 |
9 daijinming OP @huiyifyj 听到 HBase 感觉好重呀,好上手吗,我们这边都是 SQL 数据库,真是有点闭塞了 |
10 fengyj 2019-08-28 17:11:08 +08:00 @daijinming #9 HBase 是列式数据库,与平常的数据库有些反向,所以只要懂过这之中的区别就应该可以上手。 |
11 ccl945 2019-08-28 17:53:23 +08:00 druid,clickhouse (来自一个大数据之神的建议) |
12 kifile 2019-08-28 18:03:16 +08:00 看数据量级,每日大文件增量(GB 单文件),上 HDFS. 小文件增量,数据总量 TB 级别,考虑分布式部署,使用 Greenplum, 小文件增量,数据总量 TB 级别,单机可以支撑,使用 ClickHouse |
13 kifile 2019-08-28 18:04:33 +08:00 ps: 如果时序数据监控,influxdb 有一整套监控方案 |
14 kifile 2019-08-28 18:04:54 +08:00 就是开源版本不能分布式部署 |
15 Ley 2019-08-28 18:07:21 +08:00 via Android 可以看一下 Microsoft Azure HD Insights,他的文档里介绍了一些解决方案 |