查询模式以时间范围为主

Monira64 · Post by **Monira64** » Tue May 20, 2025 8:57 am

常见的查询需求是“某个时间段内的平均值/最大值”、“过去一小时的趋势”等。
海量且高速产生：数十亿设备可能同时每秒产生数万甚至数十万个数据点。
模式重复性高：相邻数据点之间往往存在高度相关性或规律性，具有很高的压缩潜力。
传统数据库（RDBMS如MySQL, PostgreSQL；NoSQL如MongoDB, Cassandra）并非为这种特殊数据模型而设计：

RDBMS的写入瓶颈：关系型数据库为了保证事务的ACID特性，其B-tree索引在高冰岛电话号码库并发写入时容易产生锁竞争，导致性能急剧下降。每次写入都需要维护复杂的索引结构，这在高频写入的IoT场景下是巨大的开销。
低效的存储与查询：当数据量达到TB甚至PB级别时，RDBMS的查询性能会因大量随机I/O而变慢，尤其是时间范围聚合查询，可能需要遍历大量数据。它们的压缩机制也相对通用，对于时序数据并不高效，导致存储成本居高不下。
NoSQL的不足：虽然某些NoSQL数据库在写入吞吐量上有所改善，但它们通常缺乏针对时间序列数据优化的查询功能（如内置的降采样、时间窗口聚合函数），这意味着开发者需要在应用层编写大量复杂的逻辑来弥补这些缺失，增加了开发和维护的复杂性。