
该技术由镜舟科技投递并参与金猿组委会×数据猿×上海大数据联盟共同推出的《2025大数据产业年度创新技术》榜单/奖项评选。
本发明公开了一种高效的物化视图构建方法及数据处理系统,专为解决大规模分布式数据库中复杂查询的高延迟问题而设计。该技术通过智能化的预计算策略,将高频复杂的SQL查询结果预先计算并存储,构建出能够实时响应的物化视图。
核心创新在于其构建算法支持多表关联(Join)的复杂场景,并具备增量更新能力,确保视图数据与基表数据的实时一致性。系统能够自动识别用户查询请求,通过透明重写机制,将针对原始大表的查询自动路由至高效的物化视图,从而在无需用户修改SQL的前提下,实现查询性能的指数级跃升,显著降低了计算资源消耗,提升了系统的整体吞吐量。
关键突破性技术说明1.背景与挑战
在企业级数字化转型过程中,数据量呈爆炸式增长。传统的OLAP数据库在处理多维分析、特别是涉及多张大表关联(Join)和高并发聚合查询时,往往面临响应慢、资源消耗大的瓶颈。传统的视图技术仅是逻辑映射,无法物理加速;而传统的物化视图往往刷新滞后,无法满足“实时分析”的需求。本专利技术《一种物化视图构建方法、数据处理系统、介质及程序产品》正是为了解决实时性、复杂查询能力、低成本这三个需求而开发。
2.核心技术突破
·智能透明查询重写
本技术实现了一种高智能的优化器重写机制。用户无需感知物化视图的存在,继续对原始明细表进行查询。数据库内核会自动分析SQL语义,判断当前的查询模式是否命中已存在的物化视图。一旦命中,优化器会自动将查询计划重写为扫描物化视图,从而规避了现场进行昂贵的Join和Aggregate计算。这种“无感加速”极大降低了业务层的改造成本。
·实时增量更新机制
区别于传统T+1的离线刷新,本技术引入了基于LSM-Tree架构的实时更新机制。当基表数据发生变更(Insert/Update/Delete)时,系统能自动计算出变更对物化视图的影响,并仅对变化部分进行增量维护。这保证了物化视图的数据时效性达到秒级甚至亚秒级,真正实现了“实时湖仓”的分析体验。
·支持复杂多表关联
现有市场上的许多加速方案仅支持单表聚合,而本专利技术实现了对多表星型模型甚至雪花模型的物化视图构建支持。通过先进的分布式Shuffle策略,系统能够在构建视图时高效处理跨节点的数据关联,使得复杂的业务报表查询也能享受到预计算带来的红利。
·异步构建与资源隔离
为了不影响在线业务的稳定性,本方法采用了存算分离的架构基础,支持异步构建物化视图。构建任务可以被调度到空闲的计算节点执行,或者利用独立的计算资源组(Resource Group),确保在构建大规模视图时,核心业务查询不受资源争抢的影响。
3.技术价值与行业领先性
该技术是镜舟数据库(MirrorShip)实现“极速统一”基础。相比于业界同类产品,本技术在更新时效性和查询重写的智能度上处于国际领先水平。它不仅解决了金融风控、实时营销等场景下的低延迟查询需求,更通过大幅减少重复计算,帮助企业节省了昂贵的计算资源成本,是新一代云原生数据仓库的核心竞争力体现。
专利技术应用产品/服务本专利技术已全面应用于镜舟科技的核心产品——镜舟数据库(MirrorShip)中。
作为企业级一站式分析型数据库,镜舟数据库利用该物化视图构建技术,为金融、零售、制造等行业的头部客户提供了极致的查询加速服务。在实际应用中,该技术帮助客户将原本需要分钟级响应的复杂报表查询优化至亚秒级,实现了“即席查询”的流畅体验。同时,依托该技术,镜舟数据库成功帮助客户简化了数据架构,替代了传统复杂的预计算链路,显著降低了运维复杂度与硬件成本。
开发团队·带队负责人姓名:冉攀峰
镜舟科技资深数据库技术专家,长期深耕于分布式数据库内核研发领域。作为核心研发成员,主导了镜舟数据库查询优化器及物化视图系统的设计与实现。他在大规模数据并行处理、实时计算存储架构以及复杂SQL查询加速方面拥有深厚的技术积累和丰富的实践经验,致力于通过技术创新解决企业级海量数据实时分析难题。
·隶属机构
镜舟科技是中国领先的企业级数据基础设施服务商,也是全球领先开源项目StarRocks的主要贡献者。公司基于“开源+商业化”模式,致力于推动StarRocks在全球范围内的应用,并提供企业级产品镜舟数据库(MirrorShip)及全场景解决方案。
作为新一代数据架构的践行者,镜舟科技率先推出基于StarRocks的Lakehouse解决方案,凭借极速统一、实时更新、高并发查询等核心优势,帮助企业实现从传统数仓向现代化湖仓架构的平滑演进。依托强大的技术创新能力和深耕行业的洞察力,镜舟已服务超过百家头部企业,覆盖金融、互联网、新经济、智能制造等多个领域,助力企业挖掘数据价值,驱动业务增长。
相关评价在我们与镜舟科技共同服务的众多客户中,数据分析的“时效性”与“成本”往往是难以调和的矛盾,镜舟的物化视图构建技术解决了这一痛点。
通过该技术,我们能够帮助客户在不改变原有数据架构的基础上,实现对亿级数据查询的秒级响应。镜舟的这一技术方案提升了Hadoop生态的实时能力,极大提升了双方联合解决方案的市场竞争力,是帮助企业从离线数仓向实时湖仓架构演进的关键加速器。
——深圳银兴智能数据有限公司CEO 李勇
作为StarRocks社区官方授权的技术服务与培训中心,我们旨在降低企业数据技术的门槛。在我们的日常培训与技术支持工作中,物化视图是用户咨询最高频、也是解决实际痛点最直接的功能模块之一。镜舟科技的物化视图技术,简化了数据建模的复杂度,让客户能够以极低的上手成本,获得极致的查询加速体验,同时也在工程化落地上展现了极高的易用性。
——北京兴元科技有限公司CTO 吴梦龙