博客

共 85 篇
技术分享
Apache Doris 如何基于自增列满足高效字典编码等典型场景需求
Apache Doris 在 2.1 版本中实现了高效的自增列功能,提供了创新性的自增序列预分配方案。本文将从基本语法、使用示例、ID 预分配方案基本原理、使用限制等几个方面对自增列进行详尽的介绍,以帮助用户更好地理解和应用自增列功能。
SelectDB 技术团队 · 2024/03/15
技术分享
揭秘 Variant 数据类型:灵活应对半结构化数据,JSON 查询提速超 8 倍,存储空间节省 65%
最新发布的 Apache Doris 2.1 引入了全新的数据类型 Variant,对半结构化数据分析能力进行了全面增强。
SelectDB 技术团队 · 2024/03/12
技术分享产品动态
百川终入海 ,一站式海量数据迁移工具 X2Doris 正式发布
一站式海量数据迁移工具 X2Doris 集自动建表和数据迁移于一体、提供了对 Apache Hive、ClickHouse、Apache Kudu 以及 StarRocks 等多个数据源的支持,全程界面化、可视化操作,仅通过鼠标操作即可完成大规模数据同步至 Doris 中,并提供了极速和稳定的迁移体验。
飞轮科技 大数据架构师、Apache StreamPark PPMC 王华杰 · 2024/01/26
技术分享
文本检索性能提升 40 倍,Apache Doris 倒排索引深度解读
本文将以 Amazon customer reviews 数据集为例,介绍 Apache Doris 在查询该数据集以及类似场景中,如何充分利用倒排索引以及 NGram Bloom Filter 索引进行查询加速,并详细解析其工作原理与最佳实践。
飞轮数据 姜凯 · 2023/01/25
技术分享
Apache Doris 聚合函数源码阅读与解析
本篇文章通过阅读聚合函数代码切入 Apache Doris 内核,同时也秉承着开源的精神,开发了 array_agg 函数并贡献给社区。笔者通过这篇文章记录下对源码的一些理解,同时也方便后面的新人更快速地上手源码开发。
网易 资深数据库内核工程师 隐形(邢颖) · 2024/01/12
技术分享
开源免费用|Apache Doris 2.0 推出跨集群数据复制功能
随着企业业务的发展,系统架构趋于复杂、数据规模不断增大,数据分布存储在不同的地域、数据中心或云平台上的现象越发普遍,如何保证数据的可靠性和在线服务的连续性成为人们关注的重点。在此基础上,跨集群复制(Cross-Cluster Replication,CCR)应运而生,并逐渐成为数据和服务高可用性的重要保障。
SelectDB 技术团队 · 2023/10/20
技术分享
Apache Doris 2.0 如何实现导入性能提升 2-8 倍
数据导入吞吐是 OLAP 系统性能的重要衡量标准之一,高效的数据导入能力能够加速数据实时处理和分析的效率。随着 Apache Doris 用户规模的不断扩大, 越来越多用户对数据导入提出更高的要求,这也为 Apache Doris 的数据导入能力带来了更大的挑战。
SelectDB 技术团队 · 2023/09/06
技术分享
一键实现 Oracle 数据整库同步至 Apache Doris
在新版本的 Doris-Flink-Connector  中,我们实现了 FlinkCDC 的 Datastream API 集成,无需提前在 Doris 中创建表以及映射关系,仅仅通过简单的参数配置就能一键完成从 Oracle 等关系型数据库到 Apache Doris 的整库数据同步。
SelectDB 技术团队 · 2023/08/22
技术分享
Apache Doris 巨大飞跃:存算分离新架构
在 Apache Doris 2.0 即将发布之际,SelectDB 技术团队正式宣布,将存算分离架构实现贡献至 Apache Doris 社区。这一工作预计将于 2023 年 10 月前后完成,届时全部存算分离的代码都将会提交到 Apache Doris 社区主干分支中。
SelectDB 技术团队 · 2023/07/30
技术分享
如何基于 Apache Doris 构建新一代日志分析平台|解决方案
日志数据是企业大数据体系中重要的组成部分之一,这些数据记录了网络设备、操作系统以及应用程序的详细历史行为,蕴含了丰富的信息价值,在可观测性、网络安全、业务分析等关键业务领域发挥着重要作用,可帮助企业更好了解系统及业务运行情况,及时发现及解决问题,以保障系统安全稳定运行。
SelectDB 技术副总裁 、Apache Doris Committer 肖康 · 2023/07/25