Machine Learning Project with the end

Machine Learning Project (END!!!) with feedback

드디어 어제부로 머신러닝 그룹 프로젝트가 끝이 났다.. 피드백과 함께 프로젝트를 앞으로 할 때 어떠한 부분들이 필요할 지를 정리했다.

  • 질문에 대하여 연쇄 작용이 일어날 수 있도록 해주는 것이 좋음 (청중들이 계속해서 다음 내용을 궁금해 하고 다음에 뭐가 나올지 바로 판단할 수 있도록 ppt를 구성하는 것이 좋다)
  • 너무 많은 내용을 한 페이지에 담지 않게 해당 페이지의 내용이 명확하게 눈에 딱 들어올 수 있도록..
  • EDA라면 raw data에 대한 분석을 목적으로 하는 것이기 때문에 이 부분에 초점을 두고 진행해야 함.
  • 단순히 시각화만 표현한다고 되는 것이 아님. 시각화에 담겨있는 내용이 무엇인지 나타낼 수 있어야 함.
  • 플로우 진행사항이 보일 수 있게 ppt 진행사항이나 방향을 명확하게 해둘 필요가 있음.
  • 서론 부분이 너무 길지 않게 표현하기 (배경)
  • 내용의 핵심이 무엇인지… (발표의 방향이 흩어져 보이지 않도록 주의하기 = 플로우의 방향이 유지될 수 있도록 하기)
  • 직접 수집한 데이터를 사용한 점 (크롤링 등의 노동량을 투입한 것)은 좋았으나 발표 시 표현하지 않았다는 점에서 아쉬움.
  • 배우지 않은 모델을 적용했다는 점도 좋았음.

앞으로의 프로젝트 시 확인해야하는 부분들

  • 데이터를 가져와서 그 안의 파생 변수를 만들어본 시도가 필요함.
  • GUI 환경에서 구현하여 실행해보는 시도가 필요함.
  • 데이터 전처리와 모델링에서 많은 노력을 투입하는 것이 필요함 (체계적으로 수행하는 것이 필요함.)
  • 새로운 파생변수를 추가하면서 비교해나가는 것이 필요함.
  • 최적의 파라미터를 통해 가장 좋은 파라미터를 가진 모델들끼리 비교하고 최적의 결과를 내는 그 과정이 의미있으므로 필요함.
  • 수상작 그대로 clone하는 것이 프로젝트가 가치가 있는가는 생각하지 말기
  • 그대로 레퍼런스를 참고할 수 없는 경우도 존재함.
  • 저품질 사양의 컴퓨터로 한 프로젝트를 통하여 만든 질이 낮은 성과물을 무조건으로 나쁘다고 볼 수 없음
  • 레퍼런스를 스터디하고 어떻게 카피할 것인지가 중요함.
  • 개선해야 하는 부분들을 공부하고 찾아나가야 함.