-
[mac환경 ]Konlpy_kkma(꼬꼬마) 형태소 분석기에 분석 단어 추가 하기Data miner/Developer 2021. 3. 15. 17:38728x90
윈도우 사용자는 다음의 블로그를 참고하길 바란다.
1. 문제 상황 발생
Kkma().pos("고성과자 구성원")
기존의 분석기에서는 '고성과자'를 한 단어로 인식하지 못하였다. '고'와'성과자' 개별적으로 인식하고 있었다. '고성과자' 한 단어로 보고, 이 단어에 대한 빈도수를 계산해야 했다. 즉, 사전에 구축된 꼬꼬마 사전기에 사용자가 추가하고 싶은 단어가 있는 경우다.
2. Mac command에서 site-packages/konlpy/java의 경로로 수정한다
사용자$ cd /Users/user-id/opt/anaconda3/lib/python3.7/site-packages/konlpy/java
3. kkma-2.0.jar 압축을 풀어준다
java 사용자$ jar xvf kkma-2.0.jar
출처 ; devkimgoon.tistory.com/54
결과 화면은 다음과 같이 뜬다.
4. dic/ 폴더에서 하위에 있는 단어 세트에 사용자가 추가하고 싶은 단어를 넣으면 된다.
5. kkma-2.0 폴더 위치로 경로를 바꿔주고, 거기에서 temp_kkma.jar (추후에 kkma-2.0.jar로 바꿔줄 파일)을 생성한다.
kkma-2.0 사용자$ jar -cvf temp_kkma.jar
그러면 kkma-2.0폴더에 해당 jar파일이 생성된다. 아래의 메세지가 커멘트창에 뜨면 성공
Manifest를 추가함
기존 파일은 백업으로 kkma-2.0_original.jar로 저장하고, temp_kkma.jar를 kkma-2.0.jar로 바꿔준다.
다시 파이썬 아나콘다/주피터를 실행한 후, 꼬꼬마 형태소 분석기를 사용하면 된다
'Data miner > Developer' 카테고리의 다른 글
[프로그래머스] 특정 기간동안 대여 가능한 자동차들의 대여비용 구하기 (0) 2023.06.29 [colab 환경] colab환경에서 돌리고자 할 때, argparse에 포함된 인자들을 편하게 처리하는 방법 (0) 2021.04.08 [AI service api] 네이버의 AI 기술 서비스 API 신청하여 사용해보기 (0) 2020.01.29 [Developer] [node.js] 10. 입력 정보에 대한 보안 (0) 2020.01.29 [Developer] [node.js] 9. 글 수정하기 기능 만들기 3) 수정된 내용 저장하기 (0) 2020.01.28