0%
New Project
Data for new project
- 광고와 광고 노출여부 확인 데이터
- 하루치 데이터밖에 없으므로 결과해석에서는 한계가 있으나 분석에 대한 인사이트를 얻을 수 있음.
- final classification (0,1로구분하여 확률을 머신러닝으로 계산하기)
- 문제 정의를 명확하게 해줘야 함.!!!!!!! (이번 주 동안에)
- 머신러닝 추천문제로 어떤 문제를 해결할 것인가
- feature vector, 유사도 등 어떻게 구성할 것인가..
- 문제를 얼마나, 어떻게 구현할 것인가
Guidelines for a project
- 머신러닝 문제 정의 — 분류, 클러스터링 등 머신러닝 기법 사용
- 데이터 정의 (어떤 컬럼이 있는지, 비정형데이터의 경우 size가 어떻게 되는지…)
- 분석에 사용할 데이터 정의
- 문제 정의가 우선되어야 함. (테이블 join, 어떤 feature vectors, user-item matrix)
- 환경세팅 (github, slack, notion 등 활용)
- 협업 (발표 보고서 - 노션 활용), 코드 공유 환경(github)
어떤 문제를 어떻게 해결할 것인지
- 기획서!!
- 문제 정의 - 데이터 정의 - 기존 방법론 (문제에 대한) - 모델리스트 - 수행 환경..
My idea
- 이미지 url을 이용해서 크롤링하고 이미지 분석 후 추천 시스템..
- 광고 데이터에서 제품 별 컨텐츠 주 단어를 활용하여 텍스트 분석을 통한 추천 시스템
- 카테고리별 (id별, 시간별, 제품별) 등으로 추천시스템
- 예측을 통한 추천시스템 (카테고리, 이용시간대, 성별 등)