일반적으로 주별 통계를 구하기 위해서 date_format에 %U를 사용하는 경우가 있습니다.만약 1개월 또는 년만 간의 통계를 작성하는 경우에는 이 기호를 사용해도 되지만 연속된 기간에 대한 데이터를 사용하여 통계를 작성하게 되면 년도가 넘어서는 기간에서는 통계가 제대로 나타나지 않게 됩니다.
테스트를 진행하기 위해 2023년에서 2024년을 넘어서 계속해서 주별 통계를 구해보도록 합니다.
조회 결과에서 week 컬럼을 보면 년(year)+주번호(week number)로 잘 나와있지만 첫번째 컬럼의 start에는 날짜가 2023년을 넘어가면서 2023년의 마지막 주와 2024년의 첫번째 주의 시작이 같은 주에 맞물리게 되어 결과값이 중복되게 나오게 됩니다.
이번에는 주번호(week number)를 무시하고 통계를 구해보도록 하겠습니다.
여러 방법이 있겠지만 2단계를 통하여 구하도록 합니다.
먼저 입력된 날짜(INSERT_DT)의 시작 주일(이번에는 한주의 시작을 월요일로)인 월요일과 주의 마지막 요일인 일요일의 날짜 컬럼을 추가해서 목록을 조회합니다.
select ADDDATE( INSERT_DT, - WEEKDAY(INSERT_DT) + 0 ) AS MONDAY ,ADDDATE( INSERT_DT, - WEEKDAY(INSERT_DT) + 6 ) AS SUNDAY ,INSERT_DT ,VISIT_CNT FROM test.statistics ORDERBY INSERT_DT
DB에 있는 데이터의 입력일을 기준으로 월요일과 일요일의 날짜 컬럼을 구하여 조회가 되었습니다.
각각의 데이터에 대한 주의 시작일과 종료일을 구했으니 다음은 그냥 월요일끼리 그룹으로 묶어주기만 하면 되겠죠
SELECT dd.monday ,dd.sunday ,sum(VISIT_CNT) FROM ( select ADDDATE( INSERT_DT, - WEEKDAY(INSERT_DT) + 0 ) AS MONDAY ,ADDDATE( INSERT_DT, - WEEKDAY(INSERT_DT) + 6 ) AS SUNDAY ,INSERT_DT ,VISIT_CNT FROM test.statistics ORDERBY INSERT_DT ) DD GROUPBY DD.Monday
이렇게 처음에 구한 목록을 월요일로 그룹화 하면 간단하게 주별 통계를 구할 수 있습니다.
동일한 데이터에 대해 월간 통계도 비슷한 방법을 사용하면 쉽게 구할 수 있습니다.
먼저 날짜에 해당하는 년+월의 컬럼을 추가합니다.
SELECT DATE_FORMAT(INSERT_DT, '%Y%m') AS YM , VISIT_CNT FROM test.statistics ORDERBY INSERT_DT
그리고 구해진 년월을 그룹으로 묶어주면 월별 통계를 구할 수 있습니다.
SELECT dd.YM , SUM(dd.VISIT_CNT) AS SM FROM( SELECT DATE_FORMAT(INSERT_DT, '%Y%m') AS YM , VISIT_CNT FROM test.statistics ORDERBY INSERT_DT )DD GROUPBY DD.YM
JDBC Batch는 프로젝트와 별개로 작업하고 실행을 할 수 있어서 수정사항 발생시 바로바로 적용을 할 수 있다는 점이 운영하는 측에서는 편한 작업이 될 수 있습니다.그러나 Batch job의 개수가 많아지거나 Table 사이즈가 크거나 작업의 우선 순위가 있어야 하는 경우 등의 상황에서는 다른 방법과 병행해서 사용하는게 개인적으로는 좋았던 것 같습니다.
오늘 기록해 놓으려는 소스는 SELECT 문을 사용해 key값의 데이터가 기존에 입력 되어있는지 확인하고 존재하면 UPDATE, 없으면 INSERT하는 단순 작업입니다.
PreparedStatement : 쿼리를 높은 효율성으로 반복적으로 사용하기위한 저장 객체.
ResultSet : SQL 쿼리를 실행한 결과를 저장하는 객체.
nCnt : SELECT 결과의 개수를 저장하려고 만든 변수입니다.
쿼리 생성시 사용하는 변수를 물음표(?)로 표시하고 값을 대입해서 쿼리를 완성하게 됩니다.
변수가 변경되면 쿼리는 수정하지 않고 변수 값만 수정해주면 반복해서 쿼리를 사용할 수 있게됩니다.
물음표에 해당하는 값을 대입하는데 사용되는 메소드는 아래처럼 정수, 실수, 문자등을 구분해서 대입하게 됩니다.
public void setInt(int index, int value) public void setString(int index, String value) public void setFloat(int index, float value) public void setDouble(int index, double value)
index는 물음표의 순번으로 첫번째 물음표는 1이 됩니다.
쿼리를 실행하는 메소드는 여러 종류가 있는데 여기서는 SELECT 결과를 ResultSet에 담아야 하기때문에 리턴 값이 ResultSet인 메소드 executeQuery()를 선택해서 사용했습니다.
좀더 자세한 PreparedStatement 관련 메소드는 아래 링크를 참조하면 도움이 됩니다.
Select에서는 쿼리 실행을 위해 pstmt.executeQuery()를 사용하고 Insert와 Update에서는 addBatch()와 executeBatch()을 사용했습니다.
addBatch()는 쿼리를 바로 실행하지 않고 쿼리 구문을 메모리에 올려두었다가, 실행 명령(executeBatch)이 있으면 한번에 DB쪽으로 쿼리를 보내어 처리를 하게 됩니다.즉, 한 번의 SQL 수행으로 대량의 로우를 동시에 insert / update / delete를 진행할 수 있어 대용량 처리를 하는데 적합한 방법입니다.
여기서는 달랑 하나 처리했는데 동일한 작업을 진행하려면 loop 문을 이용해서 작업을 하면 됩니다.