포스트 코로나 시대의 뉴노멀 서비스 3편

자판기에서 무엇을 팔 것인가? _ 오프라인 지수 설계 및 결과

Posted by Minki on October 1, 2020

앞으로 이어질 2020 빅콘테스트 포스팅은 2020 빅콘테스트 준비부터 결과물제출까지의 모든 과정을 리뷰한 것입니다. 잘못된 내용은 언제든지 밑의 댓글로 알려주세요! 모든 코드와 모든 EDA 자료는 여기에있습니다.

들어가기

2편에서 뉴노멀시대와 매칭되는 최신 트렌드를 ‘비대면’, ‘중고거래’, ‘체험형’으로 정의하였고, 이 트렌드를 가장 잘 구현할 수 있는 형태로 자판기를 선택했다. 그렇다면 이제 자판기에서 무엇을 팔 지를 결정해야 할 차례이다.

1. 왜 지수 설계가 필요할까?

코로나 이후의 뉴스를 찾아본 결과 모든 산업군이 타격을 받은 것은 아니였다. 쿠팡, 줌과 같이 코로나 시대에 성장하고 있는 산업(기업)이 있는 반면, CGV, 삼성물산 등 쇠퇴하고 있는 산업도 있었다. 그렇기에 자판기의 업종을 선택하기 위해서는 산업군의 성장 및 쇠퇴를 파악하는 것이 우선적으로 중요하다. 따라서 우리팀은 이를 위한 지수 개발에 착수했다.

2. 어떻게 지수를 설계할 것인가?

그렇다면 어떻게 지수를 설계할 것인가? 이를 위해 자료를 찾아본 결과 많은 저널, 혹은 뉴스에서 다음과 같은 평가기법을 대중적으로 사용하고 있음을 발견했다.

일반적으로 각종 저널과 은행에서 경제 성장 및 경제 악화를 평가할 때 GDP의 ‘기울기’를 기준으로 경제 성장의 Type을 분류한다는 것을 파악했다. 이에 우리팀도 해당 방식을 근거로 GDP를 대변할 수 있는 매출데이터와 소비데이터를 분석해 매출과 소비의 기울기 추세를 각각 파악하기로 했다.
따라서 결론적으로 기울기의 추세를 근거로 해당 산업군이 얼마나 타격을 받았는지, 어떤 속도로 회복 및 성장을 하고 있는지를 측정했다.

  • 오프라인 소비의 추세 계산 -> 카드소비 데이터를 이용
  • 온라인 소비의 추세 계산 -> 물류건수 데이터를 이용

3. 무엇을 평가하는 지수를 개발할 것인가?

이제 어떻게 지수를 만들지까지 다 정했다. 그렇다면 무엇을 평가하는 지수를 개발할 것인가? 이를 위해 우리팀은 코로나가 기업에 타격을 끼치는 보편적인 과정을 살펴보았다. 먼저 기업은 코로나로 인해 매출에 타격(impact)을 입을 것이다. 이후 손실된 매출을 어느정도 회복(resilience)하고, 더 나아가서는 몇몇 기업들은 회복을 넘어 매출을 성장(growth)시킨다. 따라서 이런 과정에 맞게 우리팀도 다음과 같은 지수를 만들었다.

3-1. 오프라인 매출 평가 Index

  1. Negatice Impact Index
    • 코로나 확산기에 카드소비가 코로나 이전 대비 얼마나 감소했는지 측정한 정도
  2. Resilience Index
    • 코로나 확산 기간에 크게 감소한 시점을 기준으로 카드소비 매출이 코로나 확산 전 매출 수준까지 얼마나 빨리 회복했는지 측정한 정도

3-2. 온라인 매출 평가 Index

  1. Positive Impact Index
    • 코로나 확산기에 송장건수가 코로나 이전 대비 얼마나 증가했는지 측정한 정도
  2. Growth index
    • 코로나 확산기 이후 재난지원금 지급 직전까지 송장건수 비율이 작년 대비 얼마나 상승했고, 상승된 값을 얼마나 유지했는지 측정한 정도.

따라서 이 네 가지 지수 분석 결과를 기준으로 코로나 이후 가장 위기인 산업군을 선정하여, 해당 산업군에 도움이 될 수 있는 방향으로 뉴노멀 서비스 아이디어를 최종 전개 하겠다.

4. Negative Impact Index 설계 과정 및 결과

우선 Negative impact index는 코로나 이후 오프라인 매출의 감소를 측정하는 지수이다. 오프라인 카드소비를 의미하는 카드소비 데이터를 사용하여 해당 index를 설계하였다. 설계 과정을 요약하면 다음과 같다.

4-1. Negative Impact Index 요약

약한 Negative Impact Index 강한 Negative Impact Index

코로나 확산기 이후 매출 감소 기울기가 완만하다면 코로나로 인해 타격을 덜 받은 것이라고 간주했고, 이와 반면에 매출 감소 기울기가 가파르다면 코로나로 인한 타격이 크다고 간주했다. 따라서 산업군별로 카드소비 데이터의 기울기값을 Negative Impact Index 공식에 넣어 코로나가 산업에 끼친 타격을 수치화시켰다.

4-2. Negative Impact Index를 위한 카드소비 데이터 전처리 과정

Negative Impact Index를 만들기 위해서는 카드소비 데이터 전처리 과정이 필요했다. 전처리가 필요한 이유로는 우선 카드소비가 요일별로 주기성, 보통 금요일날 카드소비가 가장 많고 일요일날 적었다, 을 가지고 있기 때문에 날짜 데이터를 요일 데이터로 변환하는 과정이 필요했고, 두 번째로는 2019년 대비 2020년 카드소비 감소량을 산정해야 했다. 이 과정을 중구 유통업 그래프로 살펴보겠다.

카드소비의 요일 주기성 해소
카드소비차이를 통한 카드소비율 계산

이런 전처리 과정을 거쳐 최종적으로 지수 계산을 위한 그래프를 생성했으며 이는 다음과 같다. 여기서 카드소비율 그래프에서 발생하는 Noise를 제거하기 위해 Smoothing 기법으로 이동평균을 사용하여 Noise를 제거해주었다.

전년 대비 서울특별시 중구 유통업 카드소비율 그래프
전년 대비 서울특별시 중구 유통업 카드소비율 7일 이동평균 그래프

4-3. Negative Impact Index 최종 공식

다시한번 짚고 넘어가자면 Negative Impact Index는 코로나 확산이 해당 업종의 카드소비에 미치는 타격을 직관적으로 보여주는 지표이다. 따라서 최종적인 공식 도출은 다음과 같다.

  • Negative Impact Index \(= (\bar{R}_{T_{min}} - R_{pre})/R_{pre}\)
최종 Negative Impact Index 도출
  • \(T_{min}\) : 카드소비율 7일 이동평균선에서 가장 작은 값을 가지는 시점
  • \(R_{pre}\) : 코로나 확산 전 2주간 전년 대비 평균 물류건수 비율
  • \(\bar{R}_{T_{min}}\) : \(T_{min}\) 시점의 전년 대비 카드소비율 7일 이동평균선 값

공식의 의미는 코로나 확산 전 2주간의 평균 카드소비율과 코로나 확산 이후 최저 카드소비율 간의 격차를 보는 것이다. 따라서 코로나 확산 전후로 2019년 대비 2020년의 카드소비량이 얼마나 감소하였는가를 집중적으로 보여주도록 설계했다.

4-4. Negative Impact Index 최종 결과

이제 산업군별 최종 Negative Impact Index 결과를 살펴보자.

지수를 살펴보면 음료식품, 의료기관과 같이 생필품, 의약품과 관련있는 산업군은 코로나 확산기동안 상대적으로 타격을 덜 받았다. 그러나 레저, 서적문구, 의복과 같은 문화 및 패션 산업군들은 코로나 확산기동안 큰 타격을 받은 것으로 확인되었다.

음료식품 7일 이동평균 그래프
의복 7일 이동평균 그래프

실제 음료식품과 의복의 7일 이동평균 그래프를 살펴본 결과 본 지수의 결과와 같이 음료식품은 감소폭이 적어 기울기가 완만하고, 의복은 감소폭이 커 기울기가 가파르다.

이제 코로나 이후 오프라인 카드소비에 타격에 대한 것은 어느정도 살펴봤다. 다음으로 살펴볼 지수는 오프라인 카드소비가 얼마나 회복되었는지를 의미하는 Resilience Index이다.

5. Resilience Index 설계 과정 및 결과

두 번째로 Resilience Index는 코로나 확산 기간에 크게 감소한 시점을 기준으로 카드소비 매출이 코로나 확산 전 매출 수준까지 얼마나 빨리 회복했는지를 측정한 지수이다. 지수 설계 과정을 요약하면 다음과 같다.

5-1. Resilience Index 요약

약한 Resilience Index 강한 Resilience Index

어떤 산업군이 코로나 확산 이후 카드소비가 가장 낮은 지점으로부터 소비가 서서히 회복된다면 이 산업군은 코로나 타격으로부터 약한 회복력을 가졌다고 말할 수 있다. 반대의 경우로 어떤 산업군이 빠르게 회복된다면 그 산업군은 코로나 타격으로부터 강한 회복력을 가졌다고 말할 수 있다. Negative Impact Index와 같이 회복의 정도를 기울기로 측정해 이를 Resilience Index 공식에 넣어 수치화 시켰다.

5-2. 가중회귀계수를 사용하여 기울기를 파악한 이유는 무엇일까?

Negative Impact Index와 차이가 있다면, Resilience Index는 기울기를 파악하는 과정에 있어서 가중회귀를 사용한다는 것이다.

만약 가중회귀계수를 사용하지 않는다면 같은 기간동안 같은 상승을 보인 A, B, C Type은 모두 동일한 기울기값을 가질 것이다. 하지만 회복지수라는 개념을 생각해볼때, 얼마나 상승했냐도 중요하지만, 얼마나 빠른 시간 내에 회복하느냐도 매우 중요하다. 따라서 이를 반영하기 위하여 가중회귀를계수를 사용하였다. 따라서 이를 통해 B Type > A Type > C Type으로 모든 타입의 기울기값이 차등을 갖도록 했다.

5-3. Resilience Index를 위한 카드소비 데이터 전처리 과정

우선 모든 산업군의 회복을 동일한 기준으로 처리하기 위해 카드소비 7일 이동평균선 그래프의 전처리를 진행했다.

7일 이동평균 그래프 전처리 전 7일 이동평균 그래프 전처리 후

전처리의 일환으로 코로나 확산 시작 전 2주간 전년 동기간 대비 카드소비율의 평균값인 \(R_{pre}\)값과 확산 이후의 카드소비율의 최소값인 \(\bar{R}_{T_{min}}\)값이 1과 0이 되도록 정규화를 진행했다.

5-4. Resilience Index 최종 공식

Resilience Index를 요약하자면 카드소비가 코로나 확산 전 수준까지 얼마나 빨리 회복하는지 정도이다. 이를 공식화하면 다음과 같다.

  • Resilience Index 수식 \(= \sqrt{\hat{R}_{max} * argmin_\beta * 0.5 * \sum_{t = 1}^{7*window}{[1 + window - {t \over 7}] * (\bar{R}_{T_{min + t}} - {t \over 7*window}\beta)^2}}\)
최종 Resilience Index 도출

공식을 설명하자면 \(T_{min}\)이후 정해진 기간 \(T_{recover}\)동안 전년 대비 최대 소비액 비율 \(\hat{R}_{max}\)를 정의한다. 이후 가중회귀계수 \(\beta\)\(\hat{R}_{max}\)의 곱으로 Resilience Index를 계산하는 것이다.

5-5. Resilience Index 최종 결과

이제 산업군별 최종 Resilience Index 결과를 살펴보자.

Resilience Index 결과에서 주의할 점은 카드소비 데이터는 오프라인 위주의 데이터이므로 온라인 데이터에 대한 소비추세는 반영하지 않는다. 이 점을 주의하며 결과를 살펴보면 수리서비스, 가전, 자동차판매와 같은 중공업 산업군들은 코로나 이전 수준으로 소비수준이 빠르게 회복하는 반면에, 레저업소, 유통업(백화점, 쇼핑몰), 숙박 등의 서비스 산업군들은 소비수준이 코로나 이전 수준으로 더디게 회복하는 것으로 나타났다.

5-6. Resilience Index Cross Check

그렇다면 Resilience Index가 얼마나 신빙성이 있을까? 이를 보기 위해 통계청 산업활동동향 보고서를 살펴보았다.

설비투자(수리, 가전) 전년동월대비 산업활동동향 서비스업(레저업소, 숙박) 전년동월대비 산업활동동향

통계청 산업활동동향을 살펴본 결과 수리서비스와 가전을 포함하는 설비투자 산업군은 전년동월대비 산업활동동향이 증가했음을 알 수 있다. 그러나 레저업소, 숙박을 포함하는 서비스업 산업군은 전년동월대비 큰 폭으로 산업활동동향이 감소했다. 이를 보아 우리팀의 Resilience Index가 어느정도 신빙성이 있음을 알 수 있었다.

6. 오프라인 카드소비 지수 결과 요약 및 마무리

오프라인 카드소비 데이터로는 두 가지 Index를 만들었다. 하나는 오프라인 카드소비 타격을 살펴보는 Negative Impact Index이고, 다른 하나는 오프라인 카드소비의 회복을 살펴보는 Resilience Index이다. 이 두 가지 Index의 결과를 종합해보면 다음과 같다.

“중공업과 음료식품 산업군은 코로나로 인한 매출 감소가 상대적으로 적었고 회복도 빨랐다. 반면에 패션, 서비스업 산업군은 매출 감소도 컸을 뿐만 아니라 회복도 더뎠다. 이를 통해 서비스업과 여타 다른 산업군과의 피해정도를 어느정도 유추해 볼 수 있다.”

이제 이어서 온라인에서는 코로나 이후 어떤 경향이 나타났는지 살펴볼 차례이다. 다음 포스팅에서 이어서 설명하겠다.


reference