Skip to main content

Apache Doris

  • apache/doris
    • 开源的实时数据仓库 (Real-time Data Warehouse)
    • MPP (Massively Parallel Processing) 架构
    • 前身是百度的 Palo 项目,2022年成为 Apache 顶级项目
  • 核心特性
    • 极速分析:列式存储、向量化执行引擎、CBO (基于代价的优化器)、MPP 并行计算
    • 实时性:支持高并发点查与复杂分析,支持秒级/亚秒级数据导入 (Stream Load, Routine Load)
    • 极简架构:仅包含 FE (Frontend) 和 BE (Backend) 两类进程
      • FE:负责请求接入、SQL 解析、查询规划与元数据管理
      • BE:负责数据存储和查询计划的执行
    • 兼容性:高度兼容 MySQL 协议与标准 SQL,无缝对接各类 BI 工具
    • Unified Lakehouse:支持外表直接联邦查询数据湖 (Hive, Iceberg, Hudi) 和关系型数据库 (MySQL, PG)
    • 存算分离:新版本支持存算分离架构 (Storage-Compute Separation),底层对接 S3/HDFS 等共享存储