들어가기
전 포스팅인 3편에서는 오프라인 데이터인 카드소비 데이터를 가지고 코로나 확산기에 카드소비가 얼마나 감소했는지 측정하는 Negative Impact Index와 감소한 매출을 얼마나 빨리 회복하는지를 측정하는 Reseilience Index를 살펴보았다. 결과를 요약하면 다음과 같다.
카드소비 데이터 Index 결과
음식료품과 중공업 산업군들은 코로나 확산 이후 카드소비 감소가 상대적으로 적었고, 회복도 빨랐다. 그러나 레저, 문화와 같은 서비스업과 패션 산업군들은 카드소비 감소가 심했을 뿐만 아니라 회복도 더뎠다.
요약에서처럼 오프라인 산업 중 가장 위험한 산업군은 서비스업 및 패션 산업군이다. 그렇다면 온라인 데이터인 물류건수 데이터에서는 무엇을 알 수 있을까?
1. 온라인 데이터와 오프라인 데이터의 차이점
코로나 확산 이후 쿠팡, 마켓컬리와 같은 소셜커머스 서비스가 성장하고 이에 따라 택배량이 늘어났다는 기사를 다들 한번쯤은 접했을 것이다. 그렇다면 실제로 이런 현상이 데이터로도 나타날까?
2019년 대비 2020년 카드소비(오프라인) | 2019년 대비 2020년 물류건수(온라인) |
---|---|
우선 전체적인 경향을 살펴보면 카드소비(오프라인)는 2019년 대비 전반적으로 감소한 반면에 물류건수(온라인)는 2019년 대비 전반적으로 증가한 것을 볼 수 있다. 그렇다면 이런 현상이 단순히 평균의 함정이 아니라 세부적인 산업군들에게 골고루 나타나는 현상일까?
산업군별 2019년 대비 물류건수 비교 그래프 |
---|
위의 산업군별 2019년 대비 물류건수 비교 그래프를 살펴보면 모든 산업군에서 물류건수가 증가했음을 알 수 있다. 따라서 이런 물류건수의 증가는 한 산업군만이 해당되는 이야기가 아닌 모든 산업군에 해당되는 일반적인 이야기이다.
따라서 우리팀은 위와 같은 사실에 입각하여 ‘물류건수 데이터로 만드는 지수는 카드소비 데이터로 만든 지수와는 다르게 얼마나 감소했는지가 아닌, 얼마나 증가했는지를 측정하는 지수를 만들기로 결정했다.’
2. Positive Impact Index 설계 과정 및 결과
Positive Impact Index라는 이름에서 알 수 있듯이 이 지수는 뭔가 Negative Impact Index와 반대되는 지수일 것 같다. 맞다. Negative Impact Index와는 다르게 Positive Impact Index는 코로나의 확산이 해당 업종의 물류건수 증가에 얼마나 영향을 미치는지 직관적으로 보여주는 지표이다. 따라서 2019년 대비 2020년의 물류건수가 얼마나 증가하였는가에 초점을 맞추에 지수를 설계하였다.
2-1. Positive Impact Index 최종 공식
Positive Impact Index 설계 과정은 최소점에서 최대점으로 바뀐 것 말고는 Negative Impact Index와 매우 유사하다. 따라서 별도의 설명 과정을 첨부하지 않고 바로 도출 공식을 보도록 하겠다.
- Positive Impact Index \(= (\bar{R}_{T_{max}} - R_{pre})/R_{pre}\)
최종 Positive Impact Index 도출 |
---|
- \(T_{max}\) : 코로나 확산 이후 송장건수가 최대를 찍는 시점
- \(R_{pre}\) : 코로나 확산 전 1주간 전년 대비 평균 물류건수 비율
- \(\bar{R}_{T_{max}}\) : \(T_{max}\) 시점의 전년 대비 물류건수 비율
위의 공식에서도 알 수 있듯이 우리팀은 Positive Impact Index를 사용하여 산업군별 2019년 대비 2020년의 송장건수 증가 정도를 알아보고자 했다.
Negative Impact Index와는 다르게 이동평균을 사용하지 않은 이유
물류 데이터의 특성상 ‘요일’이 물류건수에 미치는 영향이 크다. 따라서 주말 및 공휴일 데이터를 전처리 과정에서 제거했기 때문에, 만약 이동평균을 사용한다면 특정 요일이 다른 요일에 비해 더 많이 포함될 수 있어 의도치 않게 요일마다 서로 다른 가중치를 줄 수 있다. 따라서 이런 오류를 방지하고자 Positive Impact Index 계산 과정에서는 이동평균선을 사용하지 않았다.
2-2. Postive Impact Index 결과
산업군별 최종 Positive Impact Index를 살펴보면 다음과 같다.
Positive Impact Index 결과를 보면 0.0 값을 전년기준선이라고 할 때, 식품 산업군은 Positive Impact Index가 1.75로 전년대비 물류건수가 거의 두배 가량 증가했다. 반면에 패션 산업군은 패션잡화와 패션의류 평균 0.105이므로 전년 대비 거의 증가하지 못했다.
2-3. 식품과 패션의류의 Postive Impact Index 그래프
그렇다면 강한 Positive 산업군인 식품과 약한 Positive 산업군인 패션의 Index 그래프를 살펴보면 어떤 양상일까?
식픔 Positive Impact Index |
---|
패션 Positive Impact Index |
위의 식품과 패션 각각 Positive Impact Index 그래프를 살펴보면 패션은 전년기준선을 기준으로 지수 산정 기간 내내 양의 범위에 있는 것을 확인할 수 있으나, 패션은 지수 산정 기간 초반에는 양의 범위에는 있지만 이후에는 음의 범위에 있음을 볼 수 있다.
띠리사 이를 통해 지수 산정 기간인 코로나 확산 기간동안 식품 산업군은 크게 성장한 반면에 패션 산업군은 거의 성장하지 못했음을 직관적으로 볼 수 있다.
2-4. Negative Impact Index & Positive Impact Index Cross Check
3편을 보고오신 분들은 바로 아시겠지만 Negative Impact Index와 Positive Impact Index가 일관된 결과를 도출하고 있음을 알 수 있다. 그 결과를 정리하면 다음과 같다.
- Negative Impact Index
- 데이터 : 카드소비(오프라인) 데이터
- 카드소비가 가장 적게 감소한 산업군 : 음료식품
- 카드소비가 가장 크게 감소한 산업군 : 의복
- Positive Impact Index
- 데이터 : 물류건수(온라인) 데이터
- 물류건수가 가장 크게 증가한 산업군 : 식품
- 물류건수가 가장 적게 증가한 산업군 : 패션
데이터가 아닌 실제로도 이런 현상이 나타나는지 뉴스 헤드라인을 통해 Cross Check를 해본 결과 과자를 포함하는 식품•음료 산업군은 ‘집콕’으로 인해 매출이 상승했음을 알 수 있었고, 반면에 패션업계는 1분기의 매출 감소에 이어 2분기도 전망이 좋지 않다는 것을 확인할 수 있었다.
최종 Positive Impact Index 도출 |
---|
이릁 통해 카드소비 데이터로 설계한 Negative Impact Index와 Positive Impact Index가 어느정도 신빙성이 있음을 알 수 있다.
3. Growth Index 설계 과정 및 결과
이제 마지막 지수인 Growth Index이다. Resilience Index가 오프라인 카드소비 데이터를 이용해 코로나 이후의 산업군별 회복 정도를 측정했다면, Growth Index는 온라인 데이터는 물류건수 데이터를 이용하여 코로나 이후의 산업군별 성장 정도를 측정하는 것이다.
3-1. Growth Index 산출 기간
지금부터 Growth Index를 어떻게 산출했는지 하나하나 살펴보겠다. 먼저 Growth Index 산출 기간이다.
외부적인 변수의 개입없이, 산업군별 성장 여부를 온전히 파악하기 위해서는 산출 기간 선정이 우선적으로 선행되어야 했다. 외부 변수의 개입을 최소화하기 위해, 우리팀은 Growth Index 기간을 코로나 확산 기간과 재난지원금 지급 사이의 기간으로 정했으며, 이를 통해 최대한 외부 변수를 통제하고자 했다.
3-2. Growth Index 공식
Growth Index 공식은 어떻게 구성되어 있을까?
-
Growth Index \(= {\sum_{t = 1}^{K}tR_t \over \sum_{t = 1}^{K}t}\)
- \(R_{t}\) : 동일 시점 t 기준 2019년 대비 2020년 물류건수 비율
- \({\sum_{t = 1}^{K} \over \sum_{t = 1}^{K}t}\) : 시점에 따른 가중평균
가중평균을 사용한 이유
가중평균을 사용한 이유는 모든 시점에 동일한 가중치를 부여하는 것이 아니라, 뒤쪽(최근)의 시점에 가중치를 조금 더 부여하여, 최근의 성장세를 수치에 반영하기 위함이다.
3-3. Growth Index 결과
산업군별 최종 Growth Index를 살펴보면 다음과 같다.
Growth Index는 코로나 확산기 이후 각각의 산업군이 온라인에서 얼마나 성장했고, 그 성장을 유지했는지 보여주는 지수이다. Growth Index를 살펴보면 도서•음반, 식품 산업군은 마켓컬리, 쿠팡과 같은 소셜커머스의 성장에 힘입어 물류건수가 증가했음을 볼 수 있다. 이런 물류건수의 증가를 통해 해당 산업군들이 온라인 매출이 증가했다고 유추할 수 있다.
반면에 패션, 출산과 같은 산업군은 코로나 확산 이후 전년기준선 대비 약간의 증가세가 있기는 하지만 다른 산업군에 비해 크게 낮은 수치이다. 따라서 이를 통해 출산/욱아, 패션 등의 산업군은 온라인 매출 증가가 더디다고 할 수 있다.
3-3. 도서/음반 & 패션잡화의 전년 대비 물류건수 비율 그래프
도서/음반 산업군 전년 대비 물류건수 비율 그래프 |
---|
패션잡화 산업군 전년 대비 물류건수 비율 그래프 |
실제로 전년 대비 두 산업군의 물류건수 증가량을 살펴보면 전년기준선보다 확실히 높은 위치에 그래프가 존재하는 도서/음반 산업군과는 다르게 패션 산업군은 그래프가 낮게 위치하는 것을 볼 수 있다.
3-4. 도서/음반 & 패션잡화의 Cross Check
또한 해당 결과는 ‘물류건수 = 온라인 소비’라는 가설을 세우고 분석한 것이기 때문에 실제로 이 가설이 맞는지 검증하는 것이 필요했다. 이를 위해 통계청에서 제공하는 온라인 쇼핑액의 변화 추이를 살펴보았다.
서적 상품군 전년동기비 대비 온라인쇼핑 거래액 비율 | 의복 상품군 전년동기비 대비 온라인쇼핑 거래액 비율 |
---|---|
통계청 자료를 살펴보면 서적 상품군은 전년동기비 대비 온라인쇼핑 거래액이 크게 상승했다. 그러나 의복 상품군은 코로나 확산기인 3월과 4월에는 감소하였고, 잠복기인 5월에 약간의 성장만을 했을 뿐이다. 이를 통해 우리팀이 세운 가설이 어느정도 들어맞는 것으로 보아 Growth Index 역시 신빙성이 있다고 할 수 있다.
4. index 결과 자판기에서 무엇을 팔 것인가?
지금까지 Negative Impact Index, Resiliene Index, Positive Impact Index, Growth Index 이렇게 총 네 가지의 index를 살펴보았다. 그렇다면 어떻게 이 네개의 지수를 활용하여 최종 자판기 산업군을 선정할 수 있을까?
4-1. 산업군 선정 의의 및 지수 적용 순서
우리팀은 우선 자판기를 설치하는 것이 무슨 의미가 있을지 생각해보았다. 자판기는 오프라인 플랫폼으로 최근 온라인 트렌드와는 다를 수 있으나, 값싼 유지비와 비대면으로 인해 이후 팬데믹과 같이 변동성이 심한 상황이 오더라도 큰 무리없이 유지할 수 있는 플랫폼이다.
따라서 자판기를 적절한 위치에 설치하고, 최근 체험형 트렌드에 맞춰 외부 형태를 바꾸고, 사람들이 소비할만한 제품을 채워넣는다면, 자판기는 기업들에게 불확실한 상황 속에서 발생한 오프라인 손해를 어느정도 만회할 수 있는 기회를 제공해줄 것이다. 따라서 자판기가 기업의 ‘회복탄력성’에 어느정도 도움이 될 수 있으리라 판단했다.
또한 우리팀은 네 가지 지수를 활용하기 위해 지수 적용 순서를 설정하였다. 먼저 코로나로 인해 기업이 타격을 받는 과정은 다음과 같다.
먼저 코로나 확산이 시작되면 재택근무 활성화와 유동인구의 감소 때문에 기업의 오프라인 매출이 감소한다. 이후 사람들의 소비패턴이 오프라인에서 온라인으로 급격히 변하면서 기업들의 온라인 매출이 성장할 것이다. 여기서 우리팀은 자판기의 ‘회복탄력성’에 초점을 맞췄기 때문에 다음의 업종 선정 기준을 마련했다.
온라인 성장이 가장 더딘 업종"
그리고 위 선정 기준을 충족시키기 위해 다음의 순서로 지수를 적용하여, 자판기 업종을 선정했다.
- Negative Impact Index
- 오프라인 카드소비 타격을 많이 받은 산업군 추출
- Resilience Index
- 오프라인 카드소비가 전년 대비 감소한 산업군 추출
- Postive Impact Index & Growth Index
- 온라인 물류건수(소비)가 많이 성장한 산업군 추출
4-2. 오프라인 카드소비를 통한 1차 산업군 필터링
지수 적용 과정에서 의사결정나무 방법을 휴리스틱하게 사용했다. 먼저 Negative Impact Index를 통해 평균 이상으로 오프라인 카드소비에 타격을 받은 산업군을 추출했다. 이후 추출된 산업군 중에서 Resilience Index값이 1보다 낮아 전년 대비 카드소비가 감소한 산업군을 1차 산업군으로 선발했다. 1차 산업군 목록은 다음과 같다.
- 보건위생, 의복, 신변잡화, 서적문구, 문화취미, 사무통신, 숙박
이렇게 선발된 1차 산업군을 가지고 2차 필터링 과정을 진행해 최종 산업군을 선발하겠다.
4-3. 온라인 물류건수 데이터를 이용해 최종 산업군 선정
카드소비 데이터의 산업군 카테고리와 물류건수 데이터의 산업군 카테고리가 다르다. 따라서 카드소비 데이터로 추출한 1차 산업군을 물류건수 데이터에 적용하기 위해서는 카드소비 데이터의 카테고리를 물류건수 데이터의 카테고리로 바꿔줘야 한다.
이제 변경된 카테고리를 가지고 Positive Impact Index와 Growth Index를 적용하면 다음과 같은 2차원 산점도 그래프를 얻을 수 있다.
1차 필터링 결과로 나타낸 2차원 산점도 그래프를 보면 ‘패션의류’와 ‘패션잡화’ 산업군의 온라인 성장이 가장 더딘 것을 확인할 수 있다. 따라서 최종 종합하면 다음과 같다.
온라인 매출 성장이 가장 더딘 산업군은 패션 산업군.
5. 자판기에서 무엇을 팔 것인가_마무리
우리팀은 뉴노멀 서비스 아이디어를 구현하기 위한 플랫폼으로 자판기를 선정했다. 우리팀이 자판기를 통해 최종적으로 제안하고자 하는 아이디어는 코로나 이후 팬데믹과 같은 예상치 못한 상황이 왔을때, 기업의 회복탄력성을 증진시켜 지속가능한 성장을 돕는 아이디어이다.
따라서 이를 위해 현 코로나 상황에서 회복탄력성이 가장 낮은 패션 산업군을 자판기 업종으로 선정했고, 이를 더 매력적으로 만들기 위한 아이데이션을 추후 분석에서 진행할 예정이다.
이제 자판기에서 무엇을 팔지 정했으므로 다음 문제는 ‘자판기를 어디에다 설치해야 좋은가’이다. 다음 포스팅에서 자판기 입지 선정을 진행해 패션 자판기를 설치할 최적의 위치를 정하겠다.