🚩 대외활동/KT 에이블스쿨

[KT AIVLE School] KT에이블스쿨 5기 - 1차 미니 프로젝트

dlalwl_jpg 2024. 4. 4. 22:32

🗓️ 일정

1차 미니 프로젝트: 3/4 ~ 3/6

KT에이블스쿨 미니프로젝트란?

미니 프로젝트는 이론, 실습 강의가 끝난 후 배운 강의를 토대로 실제 사례에 적용해보는 시간이다. 

해결해야 할 미션, 데이터, 도메인 정보, 가이드가 제공되면 개별 실습을 통해 스스로 문제를 해결한 후, 조별 실습을 통해 공동과제를 수행한다. 그리고 전체 발표 시간을 가져 다양한 솔루션을 공유한다.


📑 1일차

주제 및 미션

처음으로 시작하는 1일차 1차 미니 프로젝트 주제는 서울시 생활 정보 기반 대중교통 수요 분석이다. 수요 분석을 통해 버스 노선 추가가 필요한 서울 시 내 자치구를 선정하는 것이 최종 미션이다.

1일차에는 개별 과제로 도메인을 이해하고, 데이터를 분석하였다.

 

💡도메인 이해

2013년부터 현재까지 서울 생활 이동이 얼마나 일어나고 있는지, 지금까지 노선 결정과 교통 분야 정책을 어떻게 설계해 왔는지를 살펴보았다. 또한, 서울시에서 가장 인구가 많은 구, 서울 소속 버스 노선과 야간 노선의 운행 시간 등을 알아보았다.

도메인을 이해하는 시간을 통해 어떤 요소를 많이 반영하여 노선 추가가 필요한 자치구를 선정해야 할지 방향성을 잡을 수 있었고, 데이터를 분석할 때 어떤 부분을 집중적으로 분석해야 할지 파악할 수 있었다.

 

📊데이터 분석

데이터는 구별 버스정류장 분석, 구별 이동인구 분석, 구별 등록 인구 분석, 구별 업종 분석을 진행하였다. 

구별 버스정류장 분석에서 어느 구에 버스정류장과 노선이 많은지, 각 구별 승차, 하자 평균 승객수 등을 파악할 수 있었다.

구별 이동인구 분석에서는 각 자치구별 총 이동인구 수, 이동시간 등을 파악했고, 이를 통해 어느 구에서 제일 유출입이 많고 적은지 등을 확인할 수 있었다. 

구별 등록 인구 분석에서는 각 자치구별 성별 인구수와 버스정류장 개수 간의 관계를 파악하였다.

구별 업종 분석에서는 자치구별 등록 업종 상위 10개의 종사자 수를 확인하여 종사자 수가 많은 업종이 많이 위치하고 있는 자치구와 대중교통 수요가 관련이 있을까 고민해보았다.


📑 2일차

주제 및 미션

1일차에 이어서 데이터 분석을 바탕으로 팀원들과 가설을 세워 가설을 검정하고 결론을 도출하는 시간을 가졌다.

 

📌가설 수립

우리 조가 세운 가설을 다음과 같다.

가설1. 자치구별 면적이 클수록 정류장수가 많고 평균이동시간이 길 것이다.

가설2. 서울 자치구별 차량 등록수가 많을 수록 버스 이용량이 많을 것이다.

가설3. 음식점 종사자 수가 많을 수록, 유동인구가 많고 평균 이동 시간이 길 것이다.

우리 조는 1일차에서 주어진 데이터로 분석한 요인 외에 대중교통 수요에 영향을 줄 수 있는 것들이 무엇이 있을까 추가로 조사하고 의논하여 가설을 수립하였다.

 

📊데이터 분석

단변량 분석, 이변량 분석을 통해 가설에서 설정한 독립변수가 종속변수에 영향을 주는지 확인하였다.

자치구별 넓이에 따른 버스정류장 개수와  정류장수에 따른 정차 빈도 그래프

가설1은 위 그래프 외에도 같은 자치구 내 평균 이동 시간 분석 등을 통해 자치의 넓이가 클수록 정류장의 수가 많고, 정류장의 수가 많을 수록 정차 빈도가 잦아 평균 이동 시간이 자치구별 면적과 관련이 있을 것이라고 판단하였다.

피어슨 상관계수를 확인했을 때, 넓이과 정류장 수는 강한 양의 상관관계를 가지고, 넓이아 평균 이동시간은 약한 양의 상관관계를 가진다는 것을 확인하였다.

서울 자치구별 차량 등록 수에 따른 버스 출발 이동인구합

 

가설2는 서울 자치구별 차량 등록 수 데이터를 따로 찾아서 자치구별 개인 자동차만 파악하기 위해 영업용 차 등을 제외한  승용차 등록 대수를 파악하였다. 그리고 버스 이용량을 버스 출발 이동 인구로 확인한 이유는 유출입 등 고려해야 할 요소가 많아 버스 이용이 출발되는 인구로 버스 이용량을 확인하기로 하였다.

그래프와 피어슨 상관계수를 통해서 서울 자치구별 차량 등록수와 버스 출발 인구합은 강한 양의 상관관계를 가진다는 것을 확인하였다.

음식점 종사자 수에 따른 유동인구 수와 평균 이동 시간

가설 3은 위 그래프와 피어슨 상관계수를 통해 음식점 종사자 수에 따라 유동인구 수는 강한 양의 상관관계를 가지지만 평균 이동 시간은 관계가 없는 것으로 확인하였다.

 

🔑 결론

우리 조는 위 가설을 종합하여 최종적으로 버스 노선 추가가 필요한 서울 시 내 자치구를 강서구, 중랑구, 도봉구, 영등포구를 선정하였다. 가설 1에서 동일한 자치구 내에서 분석했을 때, 면적이 넓지도 않고, 정류장 수도 많지 않은데 평균 이동시간이 많은 지역이 영등포구였고, 가설 2와 3의 분석을 도합했을 때, 음식점 종사자수가 많고, 대중교통 이용자에 비해 차량 등록 숫자가 높은 자치구가 강서, 중랑, 도봉구였기 때문이다.


📑 3일차

주제 및 미션

1,2일차에 거쳐 첫 번째 미션을 완료하고, 3일차에는 새로운 주제와 미션이 주어졌다. 두 번째 주제와 미션은 날씨에 따른 따릉이 수요 분석이다. 어떠한 날씨요소가 따릉이 수요와 관련 있는지 데이터를 다각도로, 입체적으로 분석하여 인사이트를 도출하는 것이다.

 

💡도메인 이해

따릉이 수요가 증가함에 따라 늘어나는 적자를 개선하기 위해 따릉이 데이터를 활용한 인사이트 도출 및 정책 제안 사례를 살펴보았다. 이를 통해 따릉이 수요를 파악하기 위해 어떤 데이터 분석이 필요하고, 데이터 분석을 기반으로 어떤 식으로 인사이트를 도출해야 하는지 파악할 수 있었다. 또한, 주어진 날씨 데이터와 따릉이 수요 데이터를 분석하여 데이터를 이해하였다. 

 

📌 가설 수립

우리 조는 주어진 날씨 데이터 외에 추가로 불쾌지수, 체감온도, 환절기, 가시도에 따른 따릉이 대여량과의 관계를 조사하였다. 따라서 최종적으로 시간, 온도, 강수 여부 등과 따릉이 대여량 간에 관계가 있다/없다로 총 13개의 가설을 세웠다.

추가한 변수에 대해 가설을 수립한 이유는 날씨가 좋고 안 좋고를 잘 나타내는 지표가 불쾌지수, 체감온도라고 생각하여 불쾌지수와 체감온도를 따릉이 수요량을 연관지어 가설을 도출하였다. 또한, 환절기는 대체로 온도가 적당하여 사람들이 외출을 많이 하는 시기라고 유추하여 사람들의 외출양과 따릉이 수요량을 연관지을 수 있다고 생각하여 가설을 수립하였다.

 

📊데이터 분석

단변량 분석과 이변량 분석, 피어슨 상관계수를 통해 독립변수 x와 종속변수 y와의 관계를 살펴보았다.

시간, 미세먼지 농도, 초미세먼지 농도, 오존농도, 온도, 풍속, 습도, 시정에 따른 따릉이 수요량

 

강우와 환절기에 따른 따릉이 수요량
불쾌지수, 가시도, 체감온도에 따른 따릉이 수요량

시각화와 피어슨 상관계수를 통해 주어진 날씨 독립변수가 따릉이 수요량에 영향을 미친다는 것을 파악하였다.

 

🔑 결론

위 데이터 분석을 통해

시간이 따릉이 대여량에 중요한 영향을 미치고, 특히 낮 시간대에 대여량이 증가하는 경향이 있어, 이용자들의 활동 패턴과 밀접한 관련이 있음을 보여주고 있는 것을 알 수 있었다. 따라서, 대여 서비스 운영 시 시간대별 수요를 고려한 자전거 배치 및 관리 전략이 필요하다고 결론을 내렸다.

또한, 오존 수치, 온도, 풍속, 가시성과 같이 좋은 날씨 조건이 따릉이 이용 증가하고 반면, 습도가 높을 때는 대여량이 감소하는 경향을 보이는 것을 확인하였다. 이를 통해 날씨 예보와 환경 상태를 모니터링하여 이용자에게 적절한 시간에 대여를 권장하는 마케팅 전략을 수립해야 한다고 결론을 내렸다.

강우 여부는 이용자의 대여 결정에 중요한 요소임을 나타내는 것을 확인하였고, 비가 오는 날 대여 수요가 많이 변동할 수 있으므로, 이에 대비한 운영 전략이 필요하다고 결론 내렸다.


💭1차 미니프로젝트를 마치고

데이터를 파이썬으로 처리하고, 분석하는 것이 처음이라서 속도도 많이 느렸고, 팀에 잘하는 사람들이 너무 많아서 도움만 받았던 첫 미니 프로젝트였다.

데이터 분석 뿐만 아니라 도메인을 이해하기 위해 관련된 논문과 기사 자료를 많이 찾아보기도 하였다. 이를 통해 도메인 이해에 대한 중요성을 느낄 수 있었다. 도메인 이해를 통해 어떤 방향으로 인사이트를 도출해 내야 하는지 방향성을 잘 잡을 수 있었기 때문이다.

다음 프로젝트에는 팀 프로젝트에 더 많이 기여할 수 있도록 열심히 해야겠다는 생각도 들었다.