본문 바로가기

MySQL/MySQL Tip & Tech

[MySQL] 사용자 로그 테이블 - (3) 자동화된 파티션 관리

[MySQL] 사용자 로그 테이블 - (1) Primary Key가 필요한가?

[MySQL] 사용자 로그 테이블 - (2) 파티션 관리

[MySQL] 사용자 로그 테이블 - (3) 자동화된 파티션 관리

 

이전 글들에서 사용자 로그 테이블을 설계할 때 Key에 대해 고려할 점과 파티션을 적용하고 관리하는 방법을 소개했습니다.

 

이 글에서는 사용자 로그 테이블에 daily 파티션을 생성, 추가 및 삭제하는 일련의 작업을 자동으로 처리하는 방법에 대해 살펴 봅니다.

 

개요

  • 관리 대상 테이블을 지정하고 로그의 보관 기간을 설정하는 방법
    • `log_retention` 테이블을 생성하고 다음의 내용을 저장
      • 사용자 로그 테이블의 이름
      • 파티션 키로 사용하는 날짜 컬럼의 이름
      • 로그 보관 기간
  • 파티션 관리 Stored Procedure
    • 파티션이 없으면 파티션 생성
    • 새 파티션 추가
    • 보관 기간을 초과한 파티션 삭제
  • Event를 생성하여 파티션 관리 Stored Procedure를 주기적으로 실행
    • 하루에 한 번, 파티션 관리 Stored Procedure를 실행

 

테스트 환경 만들기

1. DB 및 테이블 생성

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
SET NAMES 'utf8mb4';
 
SET COLLATION_CONNECTION = 'utf8mb4_general_ci';
 
SET sql_mode = 'ONLY_FULL_GROUP_BY,STRICT_TRANS_TABLES,STRICT_ALL_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,TRADITIONAL,NO_AUTO_CREATE_USER,NO_ENGINE_SUBSTITUTION';
 
CREATE DATABASE partition_test DEFAULT CHARACTER SET utf8mb4 DEFAULT COLLATE utf8mb4_general_ci;
 
USE partition_test;
 
CREATE TABLE tally (
  n SMALLINT UNSIGNED NOT NULL COMMENT '1 ~ 10,000 정수',
  PRIMARY KEY (n))
ENGINE = InnoDB
COMMENT = 'mutex 용도의 테이블';
 
INSERT `tally` VALUES 
 
CREATE TABLE audit_log (
    audit_log_date datetime(0NOT NULL,
    audit_log_id bigint UNSIGNED NOT NULL AUTO_INCREMENT,
    PRIMARY KEY (audit_log_date, audit_log_id),
    INDEX `nix-audit_log-audit_log_id` (audit_log_id)
ENGINE = InnoDB;
 
CREATE TABLE item_log (
    item_log_date datetime(0NOT NULL,
    item_log_id bigint UNSIGNED NOT NULL AUTO_INCREMENT,
    PRIMARY KEY (item_log_date, item_log_id),
    INDEX `nix-item_log-item_log_id` (item_log_id)
ENGINE = InnoDB;
 
CREATE TABLE log_retention (
      log_table_name varchar(64NOT NULL PRIMARY KEY COMMENT '로그 테이블 이름'
    , log_date_column_name varchar(64NOT NULL COMMENT '로그 일자 컬럼 이름'
    , retention_period smallint UNSIGNED NOT NULL COMMENT '로그 보관 기간. 단위 : day'
ENGINE = InnoDB,
COMMENT '로그 보관 기간 정보';
cs

 

2. `audit_log` 테이블에 10일 전 로그 INSERT

1
2
INSERT audit_log (audit_log_date)
VALUES (TIMESTAMPADD(DAY, -10, NOW(0)));
cs

 

3. `log_retention` 테이블에 2개의 유저 로그 테이블에 대한 파티션 관리 정보 INSERT

1
2
3
INSERT log_retention (log_table_name, log_date_column_name, retention_period)
VALUES ('audit_log''audit_log_date'180)
    , ('item_log''item_log_date'90);
cs

 

4. 현재 유저 로그 테이블의 파티션 상태 조회

1
2
3
SELECT P.TABLE_NAME, P.PARTITION_NAME, P.PARTITION_ORDINAL_POSITION, P.PARTITION_DESCRIPTION
FROM log_retention LR
    INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = 'partition_test' AND P.TABLE_NAME = LR.log_table_name;
cs

 

(결과)

 

사용자 로그 파티션 관리 Stored Procedure

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
-- -----------------------------------------------------
-- PROCEDURE usp_manage_log_partition
-- -----------------------------------------------------
 
DELIMITER $$
 
DROP PROCEDURE IF EXISTS `usp_manage_log_partition`$$
 
CREATE DEFINER=CURRENT_USER() PROCEDURE `usp_manage_log_partition`(
      IN pi_int_partition_buffer int UNSIGNED   -- 버퍼로 미리 만들 파티션의 개수
    , OUT po_int_return int                     -- 리턴 값
)
DETERMINISTIC
SQL SECURITY DEFINER
CONTAINS SQL
COMMENT '
author : doeyull.kim
e-mail : purumae@gmail.com
created date : 2017-07-16
description : 로그 파티션에 대한 sliding window 작업
parameter :
      IN pi_int_partition_buffer int UNSIGNED   -- 버퍼로 미리 만들 파티션의 개수
    , OUT po_int_return int                     -- 리턴 값
return value :
    0 = 에러가 없습니다.
    -1 = 예상하지 않은 런 타임 오류가 발생하였습니다.
usage :
    SET @pi_int_partition_buffer = ;
    CALL usp_manage_log_partition (@pi_int_partition_buffer, @po_int_return);
    SELECT @po_int_return;
'
proc_body: BEGIN
    DECLARE v_dt5_now datetime(0DEFAULT(NOW(0));
    DECLARE v_int_i int UNSIGNED;
    DECLARE v_int_j int UNSIGNED;
    DECLARE v_vch_log_table_name varchar(64);
    DECLARE v_vch_log_date_column_name varchar(64);
    DECLARE v_vch_partition_name varchar(64);
    DECLARE v_dat_start_date date;
    DECLARE v_int_partition_count int UNSIGNED;
    DECLARE v_dat_oldest_date date;
    DECLARE v_int_retention_period int UNSIGNED;
 
    SET SESSION group_concat_max_len = 1000000;
 
    -- STEP 1 : 파티셔닝 되어 있지 않은 로그 테이블에 최초 파티셔닝 적용
    -- 1.1 아직 파티셔닝 되지 않는 로그 테이블 목록 추출
    DROP TABLE IF EXISTS tmp_create;
 
    CREATE TEMPORARY TABLE tmp_create (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        log_date_column_name varchar(64NOT NULL
    ) ENGINE = MEMORY;
 
    INSERT tmp_create (log_table_name, log_date_column_name)
    SELECT STRAIGHT_JOIN log_table_name, log_date_column_name
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_NAME IS NULL;
 
    SELECT 1, FOUND_ROWS() INTO v_int_i, v_int_j;
 
    -- 1.2 아직 파티셔닝 되지 않은 로그 테이블에 최초로 파티션 생성
    --  ㄴ 임시 테이블 `tmp_create`의 Rows 수 만큼 LOOP
    --    ㄴ 파티션 생성이 필요한 로그 테이블의 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        -- 테이블에 기록된 "가장 오래된 날짜"를 담을 세션 변수 초기화
        --  ㄴ 동적 쿼리를 사용해 조회한 결과를 외부로 추출해야 하기 때문에 로컬 변수를 사용할 수 없음
        SET @dt5_oldest_log_date = NULL;
 
        -- 이번 LOOP에서 파티션을 생성할 테이블에 대해, 파티션 생성에 필요한 정보를 추출
        --  ㄴ log_table_name, log_date_column_name은 tmp_create 테이블에서 직접 추출
        --  ㄴ oldest_log_date는 동적 쿼리를 만들어 추출
        SELECT CONCAT(
'SELECT ', log_date_column_name, '
INTO @dt5_oldest_log_date
FROM ', log_table_name, '
FORCE INDEX FOR ORDER BY (PRIMARY)
ORDER BY ', log_date_column_name, '
LIMIT 1;'
        ) AS dynamic_query, log_table_name, log_date_column_name
        INTO @vch_stmt, v_vch_log_table_name, v_vch_log_date_column_name
        FROM tmp_create FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
 
        -- oldest_log_date를 구하기 위해 동적 쿼리 @vch_stmt 실행
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
 
        -- 첫 파티션 일자 : 테이블에 기록된 가장 오래된 날짜. 테이블이 비어있다면 "오늘"
        SET v_dat_start_date = DATE(IFNULL(@dt5_oldest_log_date, v_dt5_now));
 
        -- 만드는 파티션의 총 개수 = 파티션 시작 일자 ~ 오늘까지 기간 + 버퍼 삼아 미리 만들 파티션의 수
        SET v_int_partition_count = TIMESTAMPDIFF(DAY, v_dat_start_date, DATE(TIMESTAMPADD(DAY, pi_int_partition_buffer + 1, v_dt5_now)));
 
        -- ALTER TABLE .. PARTITION BY RANGE COLUMN .. 문을 동적 쿼리로 생성하여 실행
        SELECT CONCAT(
'ALTER TABLE `', v_vch_log_table_name, '` PARTITION BY RANGE COLUMNS (`', v_vch_log_date_column_name, '`) (', GROUP_CONCAT('
    PARTITION p_', DATE(TIMESTAMPADD(DAY, n - 1, v_dat_start_date)) + 0' VALUES LESS THAN 'IF(n = v_int_partition_count, 'MAXVALUE', CONCAT('(''', DATE(TIMESTAMPADD(DAY, n, v_dat_start_date)), ''')')), ' ENGINE = InnoDB' SEPARATOR ','), '
);'
        )
        INTO @vch_stmt
        FROM tally FORCE INDEX FOR JOIN (PRIMARY)
        WHERE n <= v_int_partition_count;
 
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
 
        SET v_int_i = v_int_i + 1;
    END WHILE;
    
    DROP TABLE tmp_create;
 
    -- STEP 2: 정기적인 파티션 추가
    -- 2.1 파티션 추가가 필요한 로그 테이블 목록 추출
    --  ㄴ 전제 조건
    --    ㄴ 마지막 파티션은 LESS THAN MAXVALUE로 설정되어 있어야 함
    --    ㄴ 파티션 이름의 이름 규칙은 p_ (예) p_20180701
    DROP TABLE IF EXISTS tmp_reorganize;
 
    CREATE TEMPORARY TABLE tmp_reorganize (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        start_date date NOT NULL,
        partition_name varchar(64NOT NULL
    ) ENGINE = MEMORY;
 
    INSERT tmp_reorganize (log_table_name, start_date, partition_name)
    SELECT STRAIGHT_JOIN LPM.log_table_name
        , DATE_FORMAT(RIGHT(P.PARTITION_NAME, 8), '%Y-%m-%d')
        , P.PARTITION_NAME
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_DESCRIPTION = 'MAXVALUE'
        AND P.PARTITION_NAME < CONCAT('p_', DATE(TIMESTAMPADD(DAY, pi_int_partition_buffer, v_dt5_now)) + 0);
 
    SELECT 1, FOUND_ROWS() INTO v_int_i, v_int_j;
 
    -- 2.2 파티션 추가가 필요한 로그 테이블에 파티션 추가
    --  ㄴ 임시 테이블 `tmp_reorganize`의 Rows 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        SELECT log_table_name, start_date, partition_name
        INTO v_vch_log_table_name, v_dat_start_date, v_vch_partition_name
        FROM tmp_reorganize FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
 
        -- 추가할 파티션의 개수
        SET v_int_partition_count = TIMESTAMPDIFF(DAY, v_dat_start_date, DATE(TIMESTAMPADD(DAY, pi_int_partition_buffer + 1, v_dt5_now)));
 
        -- ALTER TABLE .. REORGANIZE PARTITION .. 문을 동적 쿼리로 생성하여 실행
        SELECT CONCAT(
'ALTER TABLE `', v_vch_log_table_name, '` REORGANIZE PARTITION ', v_vch_partition_name, ' INTO (', GROUP_CONCAT('
    PARTITION p_', DATE(TIMESTAMPADD(DAY, n - 1, v_dat_start_date)) + 0' VALUES LESS THAN 'IF(n = v_int_partition_count, 'MAXVALUE', CONCAT('(''', DATE(TIMESTAMPADD(DAY, n, v_dat_start_date)), ''')')), ' ENGINE = InnoDB' SEPARATOR ','), '
);'
        )
        INTO @vch_stmt
        FROM tally FORCE INDEX FOR JOIN (PRIMARY)
        WHERE n <= v_int_partition_count;
 
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
 
        SET v_int_i = v_int_i + 1;
    END WHILE;
 
    DROP TABLE tmp_reorganize;
 
    -- STEP 3. 보관 기간이 만료된 파티션 삭제
    -- 3.1 보존 기간보다 오래된 파티션을 가진 테이블 목록 추출
    DROP TABLE IF EXISTS tmp_drop;
 
    CREATE TEMPORARY TABLE tmp_drop (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        oldest_date date NOT NULL,
        retention_period int UNSIGNED NOT NULL
    ) ENGINE = MEMORY;
 
    INSERT tmp_drop (log_table_name, oldest_date, retention_period)
    SELECT LPM.log_table_name
        , DATE_FORMAT(RIGHT(P.PARTITION_NAME, 8), '%Y-%m-%d')
        , LPM.retention_period
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_ORDINAL_POSITION = 1
        AND P.PARTITION_NAME < CONCAT('p_', DATE(TIMESTAMPADD(DAY, - LPM.retention_period + 1, v_dt5_now)) + 0);
 
    SELECT 1, FOUND_ROWS() INTO v_int_i, v_int_j;
 
    -- 3.2 로그 테이블에서 만료된 파티션 삭제
    --  ㄴ 임시 테이블 `tmp_drop`의 Rows 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        SELECT log_table_name, oldest_date, retention_period
        INTO v_vch_log_table_name, v_dat_oldest_date, v_int_retention_period
        FROM tmp_drop FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
 
        -- 만료된 파티션이 삭제되었을 때, 파티션의 시작 일자 (이 일자 이전의 파티션은 삭제 대상)
        SET v_dat_start_date = DATE(TIMESTAMPADD(DAY, - v_int_retention_period + 1, v_dt5_now));
 
        -- 만료된 로그를 임시로 적재할 테이블이 존재하지 않으면 생성
        --  ㄴ 이름 규칙 : _trash (예) audit_log_trash
        --  ㄴ 이 단계에서 생성한 %_trash 테이블은 마지막에 drop하지 않고 계속 재활용합니다.
        --    ㄴ 파티션이 많은 사용자 로그 테이블로부터 CREATE TABLE .. LIKE .. 구문을 사용하여 %_trash 테이블을 만드는 비용이 크기 때문
        IF NOT EXISTS (
            SELECT *
            FROM information_schema.TABLES
            WHERE TABLE_SCHEMA = DATABASE()
                AND TABLE_NAME = CONCAT(v_vch_log_table_name, '_trash')
        ) THEN
            SET @vch_stmt = CONCAT(
                'CREATE TABLE `', v_vch_log_table_name, '_trash` LIKE `', v_vch_log_table_name, '`;'
            );
        
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
        
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '_trash` REMOVE PARTITIONING;'
            );
        
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
        END IF;
 
        -- 3.2.1 삭제해야하는 파티션의 개수 만큼 LOOP
        WHILE v_dat_oldest_date < v_dat_start_date DO
            -- ALTER TABLE .. EXCHANGE PARTITION .. WITH TABLE .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ 삭제할 파티션을 %_trash 테이블의 빈 .idb 파일과 교환
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '` EXCHANGE PARTITION p_', v_dat_oldest_date + 0' WITH TABLE `', v_vch_log_table_name, '_trash`;'
            );
 
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
 
            -- ALTER TABLE .. DROP PARTITION .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ 사용자 로그 테이블에서 빈 파티션을 삭제
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '` DROP PARTITION p_', v_dat_oldest_date + 0';'
            );
 
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
 
            -- TRUNCATE TABLE .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ %_trash 테이블 비우기
            SET @vch_stmt = CONCAT(
                'TRUNCATE TABLE `', v_vch_log_table_name, '_trash`;'
            );
 
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
 
            SET v_dat_oldest_date = TIMESTAMPADD(DAY, 1, v_dat_oldest_date);
        END WHILE;
 
        SET v_int_i = v_int_i + 1;
    END WHILE;
 
    DROP TABLE tmp_drop;
 
    SET po_int_return = 0;
END proc_body$$
 
DELIMITER ;
cs

 

Stored Procedure 실행하고 파티션 상태 조회

1
2
3
4
5
CALL usp_manage_log_partition(1, @r);
 
SELECT P.TABLE_NAME, P.PARTITION_NAME, P.PARTITION_ORDINAL_POSITION, P.PARTITION_DESCRIPTION
FROM log_retention LR
    INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = 'partition_test' AND P.TABLE_NAME = LR.log_table_name;
cs

 

(결과)

 

오늘은 2018년 7월 19일입니다.

1. `audit_log` 테이블에는 10일전 로그 (2018년 7월 9일)가 있으므로, p_20180709 파티션부터 생성되었고, `item_log` 테이블은 비어있기 때문에 오늘인 p_20180719 파티션부터 생성되었습니다.

2. Stored Procedure를 호출할 때 첫 번째 인자인 pi_int_partition_buffer 값으로 1을 넣었으므로, 1개의 버퍼 파티션인 p_20180720 이 추가로 생성되었습니다.

 

정기적으로 Stored Procedure를 실행하도록 Event 생성 - 매일 AM 4:00 실행

1
2
3
4
5
6
7
8
9
10
11
12
CREATE DEFINER=CURRENT_USER() EVENT `ues_log_slide_window`
ON SCHEDULE
EVERY DAY
STARTS TIMESTAMPADD(HOUR, 4, DATE(NOW()))
ON COMPLETION NOT PRESERVE
ENABLE
COMMENT ''
DO
 
evt_body: BEGIN
   DECLARE v_int_return int;

    CALL usp_manage_log_partition(5, v_int_return);
END evt_body
cs

 

맺으며

다양한 상황에 대해 일일이 테스트 케이스를 만들어 보여드리진 않았습니다.

여러가지 상황을 직접 만들어 테스트 해보시고, 되도록 주석을 자세히 적으려고 노력했으니 코드를 읽어 보시면 도움이 되시리라 생각합니다.

 

또 한가지 고려해야 하는 사항이 있는데, MySQL에서 테이블에 파티션이 많을수록 INSERT 성능이 떨어진다는 점입니다.

SELECT, UPDATE, DELETE 문은 Partition Pruning 이 지원되지만, INSERT 문은 그렇지 않기 때문입니다.

로그가 대용량이 아니라면 파티션의 단위를 week, month 단위로 하는 것도 검토해 볼 필요가 있겠습니다.

 

이 글에서 소개한 스크립트를 적절히 응용하셔서 각자의 서비스에 적절한 형태로 만들어 보시면 좋겠습니다. ^^

p.s 댓글에 있던 월 단위 파티셔닝을 적용한 스크립트입니다.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
-- -----------------------------------------------------
-- PROCEDURE usp_manage_log_partition
-- -----------------------------------------------------
 
DELIMITER $$
 
DROP PROCEDURE IF EXISTS `usp_manage_log_partition`$$
 
CREATE DEFINER=CURRENT_USER() PROCEDURE `usp_manage_log_partition`(
      IN pi_int_partition_buffer int UNSIGNED   -- 버퍼로 미리 만들 파티션의 개수
    , OUT po_int_return int                     -- 리턴 값
)
DETERMINISTIC
SQL SECURITY DEFINER
CONTAINS SQL
COMMENT '
author : doeyull.kim
e-mail : dy.kim@hodoolabs.com
created date : 2021-12-17
description : 로그 파티션에 대한 sliding window 작업
parameter :
      IN pi_int_partition_buffer int UNSIGNED   -- 버퍼로 미리 만들 파티션의 개수
    , OUT po_int_return int                     -- 리턴 값
return value :
     0 = 에러가 없습니다.
    -1 = 예상하지 않은 런 타임 오류가 발생하였습니다.
commit message :
    최초 작성
/* ##ssp_debug_00## */
'
proc_body: BEGIN
    DECLARE v_dt5_now datetime(0DEFAULT(NOW(0));
    DECLARE v_dat_this_month date DEFAULT(CAST(TIMESTAMPADD(MONTH, -1, TIMESTAMPADD(DAY, 1, LAST_DAY(v_dt5_now))) AS date));
    DECLARE v_int_i int UNSIGNED;
    DECLARE v_int_j int UNSIGNED;
    DECLARE v_vch_log_table_name varchar(64);
    DECLARE v_vch_log_date_column_name varchar(64);
    DECLARE v_vch_partition_name varchar(64);
    DECLARE v_dat_start_date date;
    DECLARE v_int_partition_count int UNSIGNED;
    DECLARE v_dat_oldest_date date;
    DECLARE v_int_retention_period int UNSIGNED;
 
    SET SESSION group_concat_max_len = 1000000;
 
    -- STEP 1 : 파티셔닝 되어 있지 않은 로그 테이블에 최초 파티셔닝 적용
    -- 1.1 아직 파티셔닝 되지 않는 로그 테이블 목록 추출
    DROP TEMPORARY TABLE IF EXISTS tmp_create;
    
    CREATE TEMPORARY TABLE tmp_create (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        log_date_column_name varchar(64NOT NULL
    ) ENGINE = MEMORY;
    
    INSERT tmp_create (log_table_name, log_date_column_name)
    SELECT STRAIGHT_JOIN log_table_name, log_date_column_name
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_NAME IS NULL;
    
    SELECT 1, FOUND_ROWS()
    INTO v_int_i, v_int_j;
    
    -- 1.2 아직 파티셔닝 되지 않은 로그 테이블에 최초로 파티션 생성
    --  ㄴ 임시 테이블 `tmp_create`의 Rows 수 만큼 LOOP
    --   ㄴ 파티션 생성이 필요한 로그 테이블의 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        -- 테이블에 기록된 "가장 오래된 날짜"를 담을 세션 변수 초기화
        --  ㄴ 동적 쿼리를 사용해 조회한 결과를 외부로 추출해야 하기 때문에 로컬 변수를 사용할 수 없음
        SET @dt5_oldest_log_date = NULL;
        
        -- 이번 LOOP에서 파티션을 생성할 테이블에 대해, 파티션 생성에 필요한 정보를 추출
        --  ㄴ log_table_name, log_date_column_name은 tmp_create 테이블에서 직접 추출
        --  ㄴ oldest_log_date는 동적 쿼리를 만들어 추출
        SELECT CONCAT(
'SELECT ', log_date_column_name, '
INTO @dt5_oldest_log_date
FROM ', log_table_name, '
FORCE INDEX FOR ORDER BY (PRIMARY)
ORDER BY ', log_date_column_name, '
LIMIT 1;'
        ) AS dynamic_query, log_table_name, log_date_column_name
        INTO @vch_stmt, v_vch_log_table_name, v_vch_log_date_column_name
        FROM tmp_create FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
        
        -- oldest_log_date를 구하기 위해 동적 쿼리 @vch_stmt 실행
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
        
        -- 첫 파티션 일자 : 테이블에 기록된 가장 오래된 날짜가 속한 달. 테이블이 비어있다면 "이번 달"
        SET v_dat_start_date = IFNULL(CAST(TIMESTAMPADD(MONTH, -1, TIMESTAMPADD(DAY, 1, LAST_DAY(@dt5_oldest_log_date))) AS date), v_dat_this_month);
        
        -- 만드는 파티션의 총 개수 = 파티션 시작 일자 ~ 오늘까지 기간 + 버퍼 삼아 미리 만들 파티션의 수
        SET v_int_partition_count = TIMESTAMPDIFF(MONTH, v_dat_start_date, DATE(TIMESTAMPADD(MONTH, pi_int_partition_buffer + 1, v_dat_this_month)));
        
        -- ALTER TABLE .. PARTITION BY RANGE COLUMN .. 문을 동적 쿼리로 생성하여 실행
        SELECT CONCAT(
'ALTER TABLE `', v_vch_log_table_name, '` PARTITION BY RANGE COLUMNS (`', v_vch_log_date_column_name, '`) (', GROUP_CONCAT('
PARTITION p_', DATE(TIMESTAMPADD(MONTH, n - 1, v_dat_start_date)) + 0' VALUES LESS THAN 'IF(n = v_int_partition_count, 'MAXVALUE', CONCAT('(''', DATE(TIMESTAMPADD(MONTH, n, v_dat_start_date)), ''')')), ' ENGINE = InnoDB' SEPARATOR ','), '
);'
        )
        INTO @vch_stmt
        FROM tally FORCE INDEX FOR JOIN (PRIMARY)
        WHERE n <= v_int_partition_count;
        
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
        
        SET v_int_i = v_int_i + 1;
    END WHILE;
    
    DROP TEMPORARY TABLE tmp_create;
    
    -- STEP 2: 정기적인 파티션 추가
    -- 2.1 파티션 추가가 필요한 로그 테이블 목록 추출
    --  ㄴ 전제 조건
    --   ㄴ 마지막 파티션은 LESS THAN MAXVALUE로 설정되어 있어야 함
    --   ㄴ 파티션 이름의 이름 규칙은 p_{일자} (예) p_20180701
    DROP TEMPORARY TABLE IF EXISTS tmp_reorganize;
    
    CREATE TEMPORARY TABLE tmp_reorganize (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        start_date date NOT NULL,
        partition_name varchar(64NOT NULL
    ) ENGINE = MEMORY;
    
    INSERT tmp_reorganize (log_table_name, start_date, partition_name)
    SELECT STRAIGHT_JOIN LPM.log_table_name
        , DATE_FORMAT(RIGHT(P.PARTITION_NAME, 8), '%Y-%m-%d')
        , P.PARTITION_NAME
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_DESCRIPTION = 'MAXVALUE'
        AND P.PARTITION_NAME < CONCAT('p_', DATE(TIMESTAMPADD(MONTH, pi_int_partition_buffer, v_dat_this_month)) + 0);
    
    SELECT 1, FOUND_ROWS() 
    INTO v_int_i, v_int_j;
    
    -- 2.2 파티션 추가가 필요한 로그 테이블에 파티션 추가
    --  ㄴ 임시 테이블 `tmp_reorganize`의 Rows 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        SELECT log_table_name, start_date, partition_name
        INTO v_vch_log_table_name, v_dat_start_date, v_vch_partition_name
        FROM tmp_reorganize FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
        
        -- 추가할 파티션의 개수
        SET v_int_partition_count = TIMESTAMPDIFF(MONTH, v_dat_start_date, DATE(TIMESTAMPADD(MONTH, pi_int_partition_buffer + 1, v_dat_this_month)));
        
        -- ALTER TABLE .. REORGANIZE PARTITION .. 문을 동적 쿼리로 생성하여 실행
        SELECT CONCAT(
'ALTER TABLE `', v_vch_log_table_name, '` REORGANIZE PARTITION ', v_vch_partition_name, ' INTO (', GROUP_CONCAT('
PARTITION p_', DATE(TIMESTAMPADD(MONTH, n - 1, v_dat_start_date)) + 0' VALUES LESS THAN 'IF(n = v_int_partition_count, 'MAXVALUE', CONCAT('(''', DATE(TIMESTAMPADD(MONTH, n, v_dat_start_date)), ''')')), ' ENGINE = InnoDB' SEPARATOR ','), '
);'
        )
        INTO @vch_stmt
        FROM tally FORCE INDEX FOR JOIN (PRIMARY)
        WHERE n <= v_int_partition_count;
        
        PREPARE stmt FROM @vch_stmt;
        EXECUTE stmt;
        DEALLOCATE PREPARE stmt;
        
        SET v_int_i = v_int_i + 1;
    END WHILE;
    
    DROP TABLE tmp_reorganize;
    
    -- STEP 3. 보관 기간이 만료된 파티션 삭제
    -- 3.1 보존 기간보다 오래된 파티션을 가진 테이블 목록 추출
    DROP TEMPORARY TABLE IF EXISTS tmp_drop;
    
    CREATE TEMPORARY TABLE tmp_drop (
        seq int UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY,
        log_table_name varchar(64NOT NULL,
        oldest_date date NOT NULL,
        retention_period int UNSIGNED NOT NULL
    ) ENGINE = MEMORY;
    
    INSERT tmp_drop (log_table_name, oldest_date, retention_period)
    SELECT LPM.log_table_name
        , DATE_FORMAT(RIGHT(P.PARTITION_NAME, 8), '%Y-%m-%d')
        , LPM.retention_period
    FROM log_retention LPM
        INNER JOIN information_schema.PARTITIONS P ON P.TABLE_SCHEMA = DATABASE() AND P.TABLE_NAME = LPM.log_table_name
    WHERE P.PARTITION_ORDINAL_POSITION = 1
        AND P.PARTITION_NAME < CONCAT('p_', DATE(TIMESTAMPADD(MONTH, - LPM.retention_period + 1, v_dat_this_month)) + 0);
    
    SELECT 1, FOUND_ROWS() 
    INTO v_int_i, v_int_j;
    
    -- 3.2 로그 테이블에서 만료된 파티션 삭제
    --  ㄴ 임시 테이블 `tmp_drop`의 Rows 수 만큼 LOOP
    WHILE v_int_i <= v_int_j DO
        SELECT log_table_name, oldest_date, retention_period
        INTO v_vch_log_table_name, v_dat_oldest_date, v_int_retention_period
        FROM tmp_drop FORCE INDEX FOR JOIN (PRIMARY)
        WHERE seq = v_int_i;
        
        -- 만료된 파티션이 삭제되었을 때, 파티션의 시작 일자 (이 일자 이전의 파티션은 삭제 대상)
        SET v_dat_start_date = DATE(TIMESTAMPADD(MONTH, - v_int_retention_period + 1, v_dat_this_month));
        
        -- 만료된 로그를 임시로 적재할 테이블이 존재하지 않으면 생성
        --  ㄴ 이름 규칙 : {로그 테이블 이름}_trash (예) audit_log_trash
        --  ㄴ 이 단계에서 생성한 %_trash 테이블은 마지막에 drop하지 않고 계속 재활용합니다.
        --   ㄴ 파티션이 많은 사용자 로그 테이블로부터 CREATE TABLE .. LIKE .. 구문을 사용하여 %_trash 테이블을 만드는 비용이 크기 때문
        IF NOT EXISTS (
            SELECT *
            FROM information_schema.TABLES
            WHERE TABLE_SCHEMA = DATABASE()
            AND TABLE_NAME = CONCAT(v_vch_log_table_name, '_trash')
        ) THEN
            SET @vch_stmt = CONCAT(
                'CREATE TABLE `', v_vch_log_table_name, '_trash` LIKE `', v_vch_log_table_name, '`;'
            );
        
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
        
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '_trash` REMOVE PARTITIONING;'
            );
            
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
        END IF;
        
        -- 3.2.1 삭제해야하는 파티션의 개수 만큼 LOOP
        WHILE v_dat_oldest_date < v_dat_start_date DO
            -- ALTER TABLE .. EXCHANGE PARTITION .. WITH TABLE .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ 삭제할 파티션을 %_trash 테이블의 빈 .idb 파일과 교환
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '` EXCHANGE PARTITION p_', v_dat_oldest_date + 0' WITH TABLE `', v_vch_log_table_name, '_trash`;'
            );
            
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
            
            -- ALTER TABLE .. DROP PARTITION .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ 사용자 로그 테이블에서 빈 파티션을 삭제
            SET @vch_stmt = CONCAT(
                'ALTER TABLE `', v_vch_log_table_name, '` DROP PARTITION p_', v_dat_oldest_date + 0';'
            );
            
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
            
            -- TRUNCATE TABLE .. 구문을 동적 쿼리로 생성하여 실행
            --  ㄴ %_trash 테이블 비우기
            SET @vch_stmt = CONCAT(
                'TRUNCATE TABLE `', v_vch_log_table_name, '_trash`;'
            );
            
            PREPARE stmt FROM @vch_stmt;
            EXECUTE stmt;
            DEALLOCATE PREPARE stmt;
            
            SET v_dat_oldest_date = TIMESTAMPADD(MONTH, 1, v_dat_oldest_date);
        END WHILE;
        
        SET v_int_i = v_int_i + 1;
    END WHILE;
    
    DROP TEMPORARY TABLE tmp_drop;
    
    SET po_int_return = 0;
END proc_body$$
 
DELIMITER ;
cs