한국어파일인코딩에러
-
[python] [pandas] encoding='cp949'로 저장하는데 에러 발생 문제Data miner/Development log 2020. 10. 15. 17:02
한국어가 포함된 dataframe을 cp949로 인코딩하는 과정에서 '\u119e' 때문에 저장에 실패할 경우, UnicodeEncodeError: 'cp949' codec can't encode character '\u119e' in position 189: illegal multibyte sequence dataframe 전체에서(하단의 코드에서는 raw_data) 존재하는 '\u119e'의 값을 지운다(''로 교체) raw_data = raw_data.replace(to_replace ="\u119e", value ="") raw_data.to_csv("test.csv", encoding="cp949")