본문 바로가기

프로그래밍 공부/보면 도움이 될걸?!

[오류해결] UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte

반응형

 

 

안녕하세요~!

28년차 진로탐색꾼 조녁입니다! 

 

오늘은 pandas에서 csv 파일을 불러올때 만났던 간단한 에러에 대해 기록해 두려고 합니다. 

 

1. 상황

- 대회용 데이터 샘플을 csv 파일로 전달받았는데 pandas.read_csv 함수 사용했을때 위와 같은 에러메시지 발생

 

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte

 

2. 해결

- 인코딩 과정에서의 에러이므로, pandas.read_csv 함수의 파라미터로 "encoding='cp949'"를 포함시켜준다. 

 

df = pd.read_csv(PATH , encoding='cp949')

 

3. 다른에러 

ParserError: Error tokenizing data. C error: Expected 5 fields in line 3, saw 6

 

- 위와 같은 에러메세지를 뱉는다.

 

4. 해결

- 파일포맷 에러로, 파일이 저장될때 구분자가 달라져서 발생하는 에러다. 그러므로 seperate 되는 구분자를 지정해준다. 

 

df = pd.read_csv(PATH , encoding='cp949', sep='\t')

 

 

** 강의문의 [기업/대학/기관 등] : https://forms.gle/cdmRhvGpfGjihc4B7

 

기업 교육 신청서

조녁 컴퍼니 대표 이종혁 입니다. 생성형 AI 활용 기업강의, AI 개발자 부트캠프 강의합니다. 1. 현대백화점 그룹, 우리금융지주, 기아대책본부, 관동대, 울산대 등 생성형 AI 활용/데이터 리터러시

docs.google.com

 

 

 

참고자료 

반응형