FM and autoencoder model
프로젝트가 거의 마무리 되어가고 있다. 마무리 되어가고 있는 현 시점에서 한 번 짚고 넘어갈만한 부분을 정리해볼까 싶다.
- SMOTE로 불균형 처리된 데이터로 학습을 시키면 확실히 성능이 올라가는 것을 볼 수 있다.
- 현재 이용하고 있는 데이터 자체가 불균형이 상당히 심해서 불균형 처리를 하지 않으면 성능이 상당히 낮게 나온다.
- 검증데이터에 한해서 불균형 처리를 하면 성능은 괜찮은데 테스트 데이터는 음…
- FM model 성능이 autoencoder model 보다 좀 괜찮게 나온다. (논문에서는 오토인코더가 괜찮다고 했던 것 같은데 데이터 문제로 성능이 차이가 있는 것처럼 보여진다.)