Skip to content

heleownae/Data_Quality_Check_PJT

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

63 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

⌛ 이커머스 데이터 품질 검사

이커머스 데이터 품질을 검사하고,

태블로 대시보드를 제작하여 이상치를 지속 트래킹합니다 🚨


👩🏻‍💻 팀원

박나영
박나영

이소희
이소희

이정희
이정희 (팀장)

이해원
이해원


📊 분석 내용

1. event 테이블 데이터 품질 검사

  • unique user가 2명 이상인 세션

  • city가 2개 이상인 유저 수

  • 일별 user id가 없는 이벤트 수

    • 🚨 이상치 발견: 500~700건 사이의 일관적 값, 엔지니어링 단계의 오류로 판단
  • 위 세 항목 월별 집계


Dashboard1 Dashboard2_EDA


2. event & order items 테이블 데이터 품질 검사

  • event가 발생하지 않은 유저-상품 쌍 여부

  • 구매 시각과 event 발생 시각 비교

  • 30분 경과로 인한 session 종료 여부와 원인 파악

    • 🚨 이상치 발견: 전체 데이터의 11%가 세션 종료 존재하며, event type이 purchase인 경우에만 발생

Dashboard3_sessionover30m


3. 세션 종료 원인 분석 & 액션 플랜

over30m1 over30m2 over30m3 over30m4 over30m5


About

이커머스 데이터 품질 검사

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 100.0%