반응형

안녕하세요~!
28년차 진로탐색꾼 조녁입니다!
오늘은 pandas에서 csv 파일을 불러올때 만났던 간단한 에러에 대해 기록해 두려고 합니다.
1. 상황
- 대회용 데이터 샘플을 csv 파일로 전달받았는데 pandas.read_csv 함수 사용했을때 위와 같은 에러메시지 발생
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte
2. 해결
- 인코딩 과정에서의 에러이므로, pandas.read_csv 함수의 파라미터로 "encoding='cp949'"를 포함시켜준다.
df = pd.read_csv(PATH , encoding='cp949')
3. 다른에러
ParserError: Error tokenizing data. C error: Expected 5 fields in line 3, saw 6
- 위와 같은 에러메세지를 뱉는다.
4. 해결
- 파일포맷 에러로, 파일이 저장될때 구분자가 달라져서 발생하는 에러다. 그러므로 seperate 되는 구분자를 지정해준다.
df = pd.read_csv(PATH , encoding='cp949', sep='\t')
** 강의문의 [기업/대학/기관 등] : https://forms.gle/cdmRhvGpfGjihc4B7
기업 교육 신청서
조녁 컴퍼니 대표 이종혁 입니다. 생성형 AI 활용 기업강의, AI 개발자 부트캠프 강의합니다. 1. 현대백화점 그룹, 우리금융지주, 기아대책본부, 관동대, 울산대 등 생성형 AI 활용/데이터 리터러시
docs.google.com
참고자료
반응형
'프로그래밍 공부 > 보면 도움이 될걸?!' 카테고리의 다른 글
| 구글클라우드(GCP)에서 최신 GPU(V100) 인스턴스 할당받기 (vs-code, ssh, gcp) (2) | 2023.04.19 |
|---|---|
| [오류해결] ValueError: Mixing dicts with non-Series may lead to ambiguous ordering (0) | 2022.06.14 |
| [오류해결] Pyenv & Poetry 사용하다가 만난 에러 정리 (0) | 2022.03.03 |
| 주피터노트북(jupyter notebook)에 가상환경(virtual env) 연결하기 (0) | 2021.11.18 |
| [오류해결] VS code에서 ssh 연결해서 사용하다 만난 오류들 (0) | 2021.09.20 |