再获权威顶会认可
8 月 26 日至 8 月 30 日,数据库领域的顶级国际会议 VLDB 2024 在广州举行。IoTDB 三篇论文的最新研发成果被本次大会录用,这其中也包括 TsFile 成为 Apache Top-Level 项目后发表的第一篇顶会论文。
同时,在国际权威数据库性能测评基准组织事务处理性能委员会(TPC)主办的 TPCTC 2024 会议上,IoTDB 团队受主办方邀请,发表论文和做特邀报告,并组织讨论会。
VLDB 会议聚焦当前数据库研究领域的前沿方向以及工业界最新技术,吸引了全球顶级科研机构的投稿,对系统创新性、完整性、实验设计等方面都有极高要求。
与 VLDB 2024 大会联合举行的第 16 届 TPC 技术会议(TPCTC 2024),入选论文将在计算机科学领域著名期刊—— Lecture Notes in Computer Science(LNCS)上发表,并被考虑用于权威数据库性能基准—— TPC 基准测试的未来开发。
国际数据库系统与标准领域的双会议认可,代表 IoTDB 坚持的产学研结合路线的成功。IoTDB 的国际化技术创新优势得到保持,持续领跑时序数据管理技术。
IoTDB 最新论文分享
🥳论文名称:Apache TsFile: An IoT-native Time Series File Format
📅时间:8 月 27 日 15:30-17:40,B3 会议室
✍摘要:物联网 (IoT) 的普及导致时序数据呈指数级增长,这些数据分布并应用于各种环境,需要专用的存储解决方案。尽管关注度日益增长,但当前的时序数据库系统缺乏标准化的文件格式,现有的开放文件格式无法充分利用物联网时序数据的独特特性。在本文中,我们介绍了 Apache TsFile,这是一种专门为物联网时序数据量身定制的文件格式。TsFile 按设备组织数据,根据设备相关信息创建索引。我们的实验证明了 TsFile 在实现高数据摄取率、最小化延迟和优化数据紧凑性方面的效率。
📍议程:
🥳论文名称:On Reducing Space Amplification with Multi-Column Compaction in Apache IoTDB
📅时间:8 月 28 日 15:30-17:40,H6 会议室
✍摘要:日志结构合并树 (LSM-tree) 通常用作现代时序数据库(包括 Apache IoTDB)中写入密集型工作负载的存储引擎,但因此会遭受高空间放大 (SA),这个问题在物联网 (IoT) 场景中变得更加复杂。为了缓解这种情况下的 SA,本文介绍了 Apache IoTDB 中的多列压缩 (MCC) 策略。我们同时考虑了单独插入无序数据和多列数据更新,并分析了在压缩过程中选择合适文件以最大程度减少空间的难度。然后,我们提出了一种启发式方法来改进文件选择,从而减少 SA。为了提高这种方法的效率,我们进一步设计了文件预取器和压缩缓存。所提出的 MCC 已在 Apache IoTDB 中实现。实验结果表明,我们提出的 MCC 在减少空间放大方面取得了更好的性能。
📍议程:
🥳论文名称:Distance-based Outlier Query Optimization in Apache IoTDB
📅时间:8 月 28 日 15:30-17:40,G8 会议室
✍摘要:虽然对流数据的异常值检测已得到广泛研究,但时序数据库中的异常值查询却在很大程度上被忽视了。在本文中,我们专注于优化 Apache IoTDB 中基于距离的异常值查询的效率,并考虑延迟数据的重叠文件。我们建议利用存储在文件中的值的存储桶统计数据。为了实现高效修剪,我们在存储桶和重叠文件中推导出了数据点邻居计数的上限和下限。与现有的为数据流设计的异常值检测方法相比,大量实验证明了我们的方案在基于 LSM 树的时序数据库 Apache IoTDB 中的效率。
📍议程:
TPCTC X IoTDB:邀请论文分享
🥳论文名称:Performance Evaluation of TimechoDB using TPCx-IoT Benchmark
📅时间:8 月 30 日 16:00-16:30,Great Hall D1
✍摘要:在本文中,我们使用第一个用于衡量网关系统性能的行业标准基准, TPCx-IoT 来测量基于 IoTDB 的 TimechoDB,并展示了其在处理大量数据提取和复杂查询操作方面的卓越性能。结果表明,TimechoDB 优于提交给 TPC 委员会的其他时序数据库。我们分析了 TimechoDB 优势的关键因素,并为 TPCx IoT 基准的未来改进提供了见解和建议,旨在推动大规模 IoT 数据管理的进步。
📍议程:
TPCTC X IoTDB:讨论会
🥳议题:时序数据库基准测试:现状和未来展望
📅时间:8 月 30 日 13:30-14:30,Great Hall D1
✍主题介绍:专家们将深入探讨基准测试在时序数据库领域中的关键作用,并特别关注物联网场景的独特需求,包括数据库处理物联网数据的规模和复杂性所需的关键特性。我们将讨论专为物联网工作负载设计的 TPCx-IoT 基准测试,包括其优势和局限性,以及未来发展。小组还将分享从对基于开源时间序列数据库 Apache IoTDB 构建的 TimechoDB 进行基准测试中获得的实用见解。
更多内容推荐:
• 了解如何使用 IoTDB 企业版