Data miner/Development log

[python] [pandas] encoding='cp949'로 저장하는데 에러 발생 문제

carayoon 2020. 10. 15. 17:02
728x90

 

 

한국어가 포함된 dataframe을 cp949로 인코딩하는 과정에서 '\u119e' 때문에 저장에 실패할 경우,

UnicodeEncodeError: 'cp949' codec can't encode character '\u119e' in position 189: illegal multibyte sequence

dataframe 전체에서(하단의 코드에서는 raw_data) 존재하는 '\u119e'의 값을 지운다(''로 교체)

 

raw_data = raw_data.replace(to_replace ="\u119e", value ="")
raw_data.to_csv("test.csv", encoding="cp949")