목록Data Scientist (15)
Dende

1. 고객특성별 데이터 탐색(성별) · 511,064명의 고객데이터 중 여성 고객은 233,267명, 남성은 277,797명 · 방문 편의점의 가지수는 *최대 5개 기준으로 여성이 남성보다 높은 수치를 보여주는 등, 여성이 더 다양한 프랜차이즈에 방문하는 것으로 나타남 *CU, 세븐일레븐, GS25, emart24, 미니스톱 · '여성'의 평균 편의점 방문횟수가 '남성'의 평균보다 높은 것으로 도출됨. · 한번 방문할 때마다 더 많은 금액을 결제하는 성별은 ‘여성’으로 도출됨. · 방문횟수 평균과 평균 구매총액은 비슷한 차이를 보여주었으나, 건별 결제액은 성별 간 큰 차이가 나오지 않음. 2. 고객특성별 데이터 탐색(충성고객) ■ 충성고객에 대한 기준 - 통계 기간 22.03.01 ~ 22.05.31(9..

1. 시간대별 매출데이터 탐색 현재 레코드는 업장들의 은행 입출금 데이터도 하나의 거래건수로 포함되어 있어 비정상적으로 높거나, 음수 값을 가진 데이터가 존재. => 결제금액이 200,000 이상이거나, 음수 값일 경우 Outlier로 판단하여 제거 outlier = (df['amount'] 200000) df.drop(df[outlier].index, inplace=True) ■ 시간대별 매출 및 거래건수 정보 ▶ EDA를 통해 도출된 인사이트 · 야간 시간대(22시~05시)가 그 이외의 시간(06~21시)보다 평균적으로 높은 건당 매출액 기록 · 세 항목 모두 가장 가파른 변화추세를 보이는 시간대는 06시~07시 · 거래건수와 매출총액은 양의 상관관계를 가지고..

1. 프로젝트 개요 - 편의점 고객정보와 고객카드결제 정보를 토대로 고객 특성 별 구매 습성 파악 - 고객 특성 별 구매 습성 파악으로 편의점 운영 개선 방향 수립 2. 원천데이터 - Ten_trans.csv : 고객 정보와 카드결제 정보 111,129,376건 3. 데이터 정제 및 Load ■ 프로젝트 목적에 맞는 컬럼 선정 - 거래ID, 거래월, 거래날짜, 거래시간, 금액, 고객ID, 성별, 생년월일, 나이, 카드종류, 업장, 결제주소, 프랜차이즈명 등 프로젝트 목적에 맞는 컬럼 선정 ■ 프로젝트 목적에 맞는 레코드 선정 - 원천데이터는 편의점 이외의 거래 건도 존재하며, 거래날짜가 대부분 2022.03 ~ 2022.05에 분포 → 편의점 관련 거래 건이며, 날짜는 2022.03 ~ 2022.05 이..
데이터를 구하는 가장 쉬운 방법은, 이미 누군가 만들어둔 데이터를 사용하는 것입니다. 대표적으로, 국가 기관에서는 공익 목적으로 여러 데이터를 공개합니다. 그 외에도 데이터를 검색하는 사이트나, 데이터를 공유하는 사이트들이 있죠. 국내 사이트 서울열린데이터광장 https://data.seoul.go.kr/ 공공데이터포털 https://www.data.go.kr e-나라지표 http://www.index.go.kr/ 국가통계포털 http://kosis.kr 서울특별시 빅데이터 캠퍼스 https://bigdata.seoul.go.kr/ 통계청 http://kostat.go.kr/ 각 사이트를 보면, 여러 분야의 데이터를 다운로드 받을 수 있습니다. 혹은 원하는 데이터를 신청하면 제공해주기도 합니다. 그 외에..