From 761ab9b9339380637622af93f08893203369ad2f Mon Sep 17 00:00:00 2001 From: v-zhangjc9 Date: Thu, 14 Mar 2024 11:58:56 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E4=BC=98=E5=8C=96=E6=96=87=E6=A1=A3?= =?UTF-8?q?=E6=A0=BC=E5=BC=8F?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- README.md | 12 +++--------- 1 file changed, 3 insertions(+), 9 deletions(-) diff --git a/README.md b/README.md index 2f9eba3..6ab4d97 100644 --- a/README.md +++ b/README.md @@ -129,8 +129,7 @@ odcp-snapshot-generic-local/cluster-tools下面 #### Victoria Metrics -Victoria Metrics是一款替代Prometheus的开源指标采集应用,支持分布式部署和指标主动推送,完全兼容Prometheus -API,提供了接近数倍于Prometheus的性能。 +Victoria Metrics是一款替代Prometheus的开源指标采集应用,支持分布式部署和指标主动推送,完全兼容Prometheus API,提供了接近数倍于Prometheus的性能。 _目前项目采用单节点模式部署,性能还有富裕,后期可根据性能需求,改为分布式部署。_ @@ -803,16 +802,11 @@ dws_acct_item_gz └── 00000911-5f8f-4a72-9687-d78a0ec7ec5f_4-10-0_19700101000000001.parquet ``` -其中,`.hoodie`文件夹通常被称为「时间线」,记录了hudi表的各种操作时间点、顺序和操作内容,`requested`结尾的时间线文件为**操作请求 -**,表示一个操作的开始,文件内容往往为将要操作的内容;`inflight`结尾的时间线文件为**操作进行中标志**,意思是这个操作正在进行中;没有结尾的文件为 -**操作完成标志**,表示这个操作已经完成,文件内容往往为一些操作结果,特别的,压缩操作的完成标志,结尾为`commit`。 +其中,`.hoodie`文件夹通常被称为「时间线」,记录了hudi表的各种操作时间点、顺序和操作内容,`requested`结尾的时间线文件为**操作请求**,表示一个操作的开始,文件内容往往为将要操作的内容;`inflight`结尾的时间线文件为**操作进行中标志**,意思是这个操作正在进行中;没有结尾的文件为**操作完成标志**,表示这个操作已经完成,文件内容往往为一些操作结果,特别的,压缩操作的完成标志,结尾为`commit`。 时间线可以帮助运维人员了解hudi表的操作的详细时间点,当压缩或者同步出现问题的时候,往往会体现在时间线上,时间线的操作类型还有很多,可以在源码中了解。 -分区文件夹中,存放的是hudi表的实际数据,其中文件命中带有`log`的文件为增量文件,也称为日志文件,存放的是checkpoint之间写入磁盘的增量数据;经过压缩操作之后,增量数据就会被整合成为`parquet` -结尾的数据文件;类似`5f8f-4a72-9687-d78a0ec7ec5f`这样的字符串被称为`file_id` -,通常一个file_id会对应多个日志文件和一个数据文件;类似`19700101000000001`和`20240312153252615` -这样的字符串被称为「时间点」,和时间线上的操作对应,多个时间点对应的文件会同时存在,这是hudi配置里定义的保留文件版本,用于hudi错误回退。 +分区文件夹中,存放的是hudi表的实际数据,其中文件命中带有`log`的文件为增量文件,也称为日志文件,存放的是checkpoint之间写入磁盘的增量数据;经过压缩操作之后,增量数据就会被整合成为`parquet`结尾的数据文件;类似`5f8f-4a72-9687-d78a0ec7ec5f`这样的字符串被称为`file_id`,通常一个file_id会对应多个日志文件和一个数据文件;类似`19700101000000001`和`20240312153252615`这样的字符串被称为「时间点」,和时间线上的操作对应,多个时间点对应的文件会同时存在,这是hudi配置里定义的保留文件版本,用于hudi错误回退。 ## 案例