반응형
안녕하세요~!
28년차 진로탐색꾼 조녁입니다!
오늘은 pandas에서 csv 파일을 불러올때 만났던 간단한 에러에 대해 기록해 두려고 합니다.
1. 상황
- 대회용 데이터 샘플을 csv 파일로 전달받았는데 pandas.read_csv 함수 사용했을때 위와 같은 에러메시지 발생
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte
2. 해결
- 인코딩 과정에서의 에러이므로, pandas.read_csv 함수의 파라미터로 "encoding='cp949'"를 포함시켜준다.
df = pd.read_csv(PATH , encoding='cp949')
3. 다른에러
ParserError: Error tokenizing data. C error: Expected 5 fields in line 3, saw 6
- 위와 같은 에러메세지를 뱉는다.
4. 해결
- 파일포맷 에러로, 파일이 저장될때 구분자가 달라져서 발생하는 에러다. 그러므로 seperate 되는 구분자를 지정해준다.
df = pd.read_csv(PATH , encoding='cp949', sep='\t')
https://link.coupang.com/a/NS6XF
"이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다."
참고자료
반응형
'프로그래밍 공부 > 보면 도움이 될걸?!' 카테고리의 다른 글
구글클라우드(GCP)에서 최신 GPU(V100) 인스턴스 할당받기 (vs-code, ssh, gcp) (2) | 2023.04.19 |
---|---|
[오류해결] ValueError: Mixing dicts with non-Series may lead to ambiguous ordering (0) | 2022.06.14 |
[오류해결] Pyenv & Poetry 사용하다가 만난 에러 정리 (0) | 2022.03.03 |
주피터노트북(jupyter notebook)에 가상환경(virtual env) 연결하기 (0) | 2021.11.18 |
[오류해결] VS code에서 ssh 연결해서 사용하다 만난 오류들 (0) | 2021.09.20 |