作为国内使用规模最大的ClickHouse用户,字节跳动在面临业务的急速扩张时,大量集群扩容以及数据移动和重新平衡的需求压力愈发增强。因此,在ClickHouse的基础之上,字节跳动设计了分布式基础架构云数仓,并向社区开源为 ByConity。
ByConity 是面向现代数据栈的一款数仓系统,应用了大量数据库成熟技术,如列存引擎,MPP 执行,智能查询优化,向量化执行,Codegen,indexing,数据压缩,适合用于 Online Analytical Processing(OLAP) 场景和轻载数仓的场景,包括但不限于交互式分析、实时 APP 监控、流数据处理和分析等。
项目 GitHub 地址
用户手册地址
https://github.com/ByConity/ByConity/tree/master/docs/zh-cnByConity
自宣布开源以来,我们收到了很多用户反馈和建议。此次全新的 0.2.0 版本中,我们进一步提升了部分技术能力,其中包含:
-
冷读加速(IO Scheduler, Cache Preload)
-
数据湖(Hudi 读取, External Catalog等)
-
Hive on S3
-
ELT(Asynchronous query execution、query Queue、join spill)
-
CBO statistics 自动收集等
9 月 14 日(下周四) 19:00-20:00,ByConity 研发工程师 Kevin Fang 将现身直播间,与大家一起解读 0.2.0 版本功能特性及技术原理! 大家扫码海报底部二维码预约直播啦。直播间还可以参与抽奖赢 ByConity 周边哦~🎁
并且,为了让大家可以更快速地部署 ByConity,我们为大家提供了更加容易上手的一键部署方式,邀请大家一起参与体验 “ByConity 快速部署有奖征集活动” ,并为大家准备了大奖! >>文章传送门
项目 GitHub 地址
用户手册地址
https://github.com/ByConity/ByConity/tree/master/docs/zh-cnByConity