본문 바로가기
코딩코딩/머신러닝, 딥러닝

파이썬 자연어 처리 패키지 rhinoMorph

by g0n1 2020. 7. 10.
728x90
import rhinoMorph

rn = startRhino()	# 라이노 사전 객체를 불러와 rn에 저장합니다. 
                    # 이 사전을 기반으로 형태소를 분석합니다.

 

rhinoMorph.onlyMorph_list( rn, text, *args)

# 형태소(morphemes)만 processed_text에 list 형식으로 반환해줍니다.
# 본인이 원하는 품사만 골라주는 pos, 
# 어미를 결합해주는 eomi=True, 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다.
# 동사의 경우 뒤에 '하'를 결합해주는 xrVv=True
# 연결된 명사를 결합해주는 combineN=True 등의 arguments가 있습니다.

rhinoMorph.onlyMorph_list(rn, text, *args)

# 최종 진화형 
rhinoMorph.onlyMorph_list(rn, text, pos = [NNG, NNP, ...], eomi=True, xrVv = True, combineN=True)

rhinoMorph.wholeResult_list( rn, text )

# "형태소"와 그 형태소가 어떤 "품사"인지를 반환해줍니다.
# 따라서 리턴값을 변수 두개로 받을 수 있습니다.
# 여기서도 eomi, xrVv, combineN의 arguments는 사용가능합니다.

rhinoMorph.wholeResult_list(rn, text)

rhinoMorph.wholeResult_text( rn, text )

# 이번엔 string 타입으로 morph/pos의 모습으로 보여줍니다.
# xrVv, eomi, xrVv 사용 가능
rhinoMorph.wholeResult_text(rn, text, *args)
728x90

댓글