Chaelist
Data Analytics Blog
YouTube Trending Videos Dataset (EDA)
Amazon Bestselling Books Dataset (EDA)
Telco Customer Churn Dataset (EDA)
Kiva Crowdfunding Dataset (EDA)
뉴스 기사를 수집해 전처리를 거쳐 단어별 빈도를 파악 & 기사의 내용을 워드클라우드로 압축적으로 표현
Harry Potter Network Analysis (인물 네트워크 분석)
소설 <Harry Potter> 시리즈 속 인물들 간 연결 관계 및 권별 인물의 중요도 변화를 분석
Sementic Network Analysis (언어 네트워크 분석)
뉴스 기사 속 주요 단어들 간의 연결 관계를 파악해, 기사의 핵심 내용을 유추
Movie Review Sentiment Analysis (영화 리뷰 감성 분석)
영화 100개의 평점-리뷰 데이터를 수집해, 리뷰의 감성(긍정/부정)을 예측하는 모델을 구축
서로 다른 토픽의 뉴스 기사들을 Clustering을 통해 유사한 기사들끼리 묶어줌
Time Series Data Forecasting (시계열 데이터 예측)
Facebook의 Prophet 라이브러리를 활용해 시계열 데이터를 예측 & 파라미터 튜닝
Google Play Store의 ‘Netflix’ 앱 리뷰 데이터를 활용해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 토픽 모델링 구현
Logistics Optimization (물류 최적화)
PuLP, ortoolpy 라이브러리를 활용해 최적화된 운송 경로 & 생산 계획을 계산
OpenCV 라이브러리를 활용해 이미지 / 동영상 데이터를 처리 & 이미지 속 사람 검출