New Project with a company

New Project

Data for new project

  • 광고와 광고 노출여부 확인 데이터
  • 하루치 데이터밖에 없으므로 결과해석에서는 한계가 있으나 분석에 대한 인사이트를 얻을 수 있음.
  • final classification (0,1로구분하여 확률을 머신러닝으로 계산하기)
  • 문제 정의를 명확하게 해줘야 함.!!!!!!! (이번 주 동안에)
    • 머신러닝 추천문제로 어떤 문제를 해결할 것인가
    • feature vector, 유사도 등 어떻게 구성할 것인가..
    • 문제를 얼마나, 어떻게 구현할 것인가

Guidelines for a project

  1. 머신러닝 문제 정의 — 분류, 클러스터링 등 머신러닝 기법 사용
  2. 데이터 정의 (어떤 컬럼이 있는지, 비정형데이터의 경우 size가 어떻게 되는지…)
    • 분석에 사용할 데이터 정의
    • 문제 정의가 우선되어야 함. (테이블 join, 어떤 feature vectors, user-item matrix)
  3. 환경세팅 (github, slack, notion 등 활용)
    • 협업 (발표 보고서 - 노션 활용), 코드 공유 환경(github)
  4. 어떤 문제를 어떻게 해결할 것인지
    • 기획서!!
    • 문제 정의 - 데이터 정의 - 기존 방법론 (문제에 대한) - 모델리스트 - 수행 환경..

My idea

  • 이미지 url을 이용해서 크롤링하고 이미지 분석 후 추천 시스템..
  • 광고 데이터에서 제품 별 컨텐츠 주 단어를 활용하여 텍스트 분석을 통한 추천 시스템
  • 카테고리별 (id별, 시간별, 제품별) 등으로 추천시스템
  • 예측을 통한 추천시스템 (카테고리, 이용시간대, 성별 등)