多维分析底层数据模型设计
发表于
|
分类于
建模
两种模型分析cube聚合结果冗余模型
查询事业部的数据:select bu_id, amount from table where dt=20211001 and bu_id>0 and cat1_id=-1 and cat2_id=-1;
dt
bu_id
cat1_id
cat2
...
CAP分布式系统理论案例理解
发表于
|
分类于
CAP
2000年7月,加州大学伯克利分校的Eric Brewer教授在ACM PODC会议上提出CAP猜想。2年后,麻省理工学院的Seth Gilbert和Nancy Lynch从理论上证明了CAP。之后,CAP理论正式成为分布式计算领域的公认定理。
CAP认为:一个分布式系统最多同时满足一致性(Cons
...
doris总体知识点总结
发表于
|
分类于
doris
知识点概要
Broadcast/Shuffle Join
聚合模型的select count(*) 效率很低
分桶分桶列的选择,是在 查询吞吐 和 查询并发 之间的一种权衡:
如果选择多个分桶列,则数据分布更均匀。如果一个查询条件不包含所有分桶列的等值条件,那么该查询会触发所有分桶同时扫描,这样
...
Doris VS Es之索引原理
发表于
|
分类于
doris
在olap场景下,doris的性能要强于es,很大一部分原因在于,doris可以通过聚合模型以及创建rollup,来针对olap的各种维度分析进行预聚合处理;那么,如果我们不考虑doris的agg模型以及rollup,假设就是使用duplicate模型,这时候,doris和es的聚合查询性能会孰强孰
...