스파르타 코딩클럽 내일배움캠프 AI 웹개발자양성과정 3회차 2022.12.06. 68일차 - TIL 1. 데이터 전처리 프로젝트를 위해 크롤링을 했는데 결과를 살펴보면 사이트 자체에서 잘못 올린 값, 양식 불일치 등의 문제로 데이터를 가공할 필요성을 느꼈다. 그래서 내용을 찾아보다 데이터 전처리에 대해 알게 되었다. 데이터 전처리란 데이터를 분석 및 처리에 적합한 형태로 만드는 과정을 총칭한다. 일반적으로 비어있는 부분이 있거나 형식이 맞지 않는 경우가 많이 있다. 따라서 이러한 데이터를 보다 품질이 좋게 만드는 과정이라고 생각하면 될 것 같다. 실제로 우리도 값을 양식에 맞추어 수정하는데 오래 걸렸는데 데이터 과학자는 시간의 60%를 데이터를 정리하고 구성하는데 보낸다고 한다. 데이터 세트 수집이 19..