ClickHouse是一个非常出色列数据库，对大数据量的实时分析有极佳的性能。本文用来介绍其MV（Materialized View，物化视图）的内部机制，帮助大家理解后更准确的使用。

文末takeway很重要!

MV是一个trigger

定义MV，实际上定义了一个insert trigger。数据数据写入source table时，会根据配置分成多个block，MV从block中读取数据，写入MV对应的storage table中。

MV不会读取source table读取
调用一次insert时，MV select可能会被trigger多次

如下图，展示了数据写入时的情况

既然MV不从source table中读取，那极端情况如下图，当使用Null或者Kafka这样的Engine时，source table不会写入数据，但MV是可以存在的。

MV使用普通table存储数据

MV会将数据持久化存储，其存储的方式是采用一个普通的table，这种方式允许我们针对MV进行查询或者修改时，可以像普通表一样来进行操作，无需更多额外的知识。

两种方式创建MV：

直接创建

使用如下的sql创建时，会隐式生成一个table，名称为 .innner.mv1

        
      
CREATE MATERIALIZED VIEW mv1
ENGINE = SummingMergeTree
ORDER BY (id, d)
AS
SELECT id, d, count() AS cnt
FROM source
GROUP BY id, d;

使用TO创建

使用如下的sql创建时，首先显示的创建名称为 dest的table，然后创建MV时通过 TO 指向该table。此时不会再创建隐式的inner table。

        
      
CREATE TABLE dest
(id String, d Date, cnt UInt64)
ENGINE = SummingMergeTree
ORDER BY (id, d);

CREATE MATERIALIZED VIEW mv1
TO dest
AS
SELECT id, d, count() AS cnt
FROM source
GROUP BY id, d;

区别

Implicit table

optimize_move_to_prewhere 在查询MV时不可用
可以使用populate在创建时插入数据
drop mv时，会自动drop inner table

Explicit table

不能使用populate创建，需要使用insert手动插入（见下文）
drop mv时，dest table不会被删除

如何使用

使用 TO, ALWAYS

显示创建table方便运维，因为本身就是一张普通表，并且使其可见
polulate 实际不可用, 它会针对所有的数据运行，数据量越大，持续时间越长，甚至会超时或内存不足。这在7x24小时运行的系统中基本不会采用

常见错误

认为MV中的聚合计算是针对source table所有数据

一个错误就是在插入数据时进行 max min avg 等由当前数据集决定的计算，例如

        
      
CREATE MATERIALIZED VIEW mv1
ENGINE = AggregatingMergeTree
PARTITION BY toYYYYMM(hour)
ORDER BY hour
POPULATE
AS
SELECT toStartOfHour(time) hour,
	maxState(cnt_by_minute) max_by_hour,
	sumState(cnt_by_minute) sum_by_hour
FROM
(
	SELECT minute, count() AS cnt_by_minute
	FROM source
	GROUP BY minute
)
GROUP BY hour

上面的sql希望从source table中通过group 每分钟的计数创建每小时计数的MV，包括每小时内计数总和和以及最大的每分钟计数。

如果使用 populate 那么初始化的max_by_hour是对的，但是后续的数据的计算会有问题，因为：

MV的计算是针对插入的block，而不是source table所有数据

当执行如下的两个sql，每次插入一条时，max_by_hour值为1，每次插入量条时，值为2

        
      
-- sql1
insert into source values (now()), (now());

-- sql2
insert into source values (now());
insert into source values (now());

认为source table的数据操作会影响MV中的数据

MV对source table的修改是完全未知的，因为MV的数据读取不是从source table中，因此以下两种情况都是正确的：

source table中数据删改，MV中数据不会变化
source table和MV可以存储不同时长的数据。例如source table中存储最近半年的数据，但是MV中存储10年以内的聚合数据

MV with Replicated Engines

正如前面所说，MV的storage table就是普通的table，因此也可以像普通table一样使用Replicated Engine。

创建方式

不使用 TO 创建时，要设置engine，这会在inner table上创建replica
使用 TO 创建时，engine要设置在dest table中

Replica机制

其中要点包括：

数据写入发生在运行query的node中，写入其中的source table
插入的数据块会发送给其他node中对应的replicated table（例如从replica1发送到replica2）。 replica2不会从replica1直接读取
在node内，MV从写入source table的数据中获取数据
在创建时，此table使用了replicated engine，因此该table中的插入数据块，会被发送到其他node对应的replicated mv storage table中
每一个数据块是原子的、可去重的（通过checksum）
只有原始数据会进行发送，而不是merge之后的数据，以减少网络使用

所以极端情况下，下图的情况是不可能发生的。写入一个node的source table，但是想replicate 到另一个node的replica source table所创建的MV中。

Replication与数据的insert没有关系，它使用数据插入part的文件，而不是query的log。

一般完整使用replicated的MV如下图

更新MV

Implicit table (.inner.mv1)

停止数据写入
detach table mv1
alter table .inner.mv1
attach materialized view mv1

        
      
DETACH TABLE mv1

ALTER TABLE `.inner.mv1`
     ADD COLUMN b Int64 AFTER a,
     MODIFY ORDER BY (a, b)

ATTACH MATERIALIZED VIEW mv1
ENGINE = SummingMergeTree
ORDER BY (a, b) AS
SELECT a, b, sum(amount) AS s
FROM source
GROUP BY a, b

Explicit table (TO dest)

停止数据写入
alter table dest
drop table mv1
create materialized view mv1

        
      
ALTER TABLE dest
     ADD COLUMN b Int64 AFTER a,
     MODIFY ORDER BY (a, b)

DROP TABLE MV1

CREATE MATERIALIZED VIEW mv1
TO dest
SELECT a, b, sum(amount) AS s
 FROM source
GROUP BY a, b

说明

如果不停止写入，那么mv1 被detach或者删除后的数据将丢失
使用explicit table会直观很多，修改可见的dest table，drop mv1后重新创建即可

不停机同步数据到MV

MV通常不会在首次创建source table就创建，而是随着业务需求变化而创建。这时创建MV既需要读取历史数据，也需要能处理线上正在不断写入的数据（针对7x24小时运行的系统）。

创建MV，在where条件中设置date列大于将来某个日期（一般mv都会包含一个date字段）。
上线并等到该日期到达后，MV中将开始写入数据
插入该日期之前的数据
在第3步运行完成后，此MV的数据将完整可用

        
      
CREATE TABLE dest(a Int64, d Date, cnt UInt64)
ENGINE = SummingMergeTree
PARTITION BY toYYYYMM(d) ORDER BY (a, d);

-- create MV с where date >= in_the_future
CREATE MATERIALIZED VIEW mv1 TO dest AS
SELECT a, d, count() AS cnt
FROM source
WHERE d >= '2023-02-14'
GROUP BY a, d;

-- arrives 2023-02-14
INSERT INTO dest -- insert all for before in_the_future
SELECT a, d, count() AS cnt
FROM source
WHERE d < '2023-02-14' -- piece by piece by 1 month (or .. day) GROUP BY a, d;

TAKEAWAY

MV只是一个trigger，将数据存储到一个普通表
ALWAYS 使用 TO 创建MV
MV不从source 读取数据，也不会因为source table的数据变更而受影响
MV的select中只处理当次传入的所有数据，而不是source table的所有数据

参考：

二十四分钟精通ClickHouse Materialized View