제8장 텍스트 마이닝과 워드 클라우드 활용

 

제8장 텍스트 마이닝과 워드 클라우드 활용2. 지역별 인구수의 변화에 대한 클라우드 출력2-1. 지역별 순이동에 따른 워드 클라우드2-2. 단어들의 색 변환2-3. 다양한 단어 색 출력을 위한 팔레트 패키지의 활용2-4. 페이지 로딩 및 데이터 파일 열기2-5. 데이터 정제: 불필요 지역 제외 ('전국' 지역 제외)2-6. '구’ 단위 지역 통계 삭제2-7. 전입자 수가 많은 지역2-8. 전출자 수가 많은 지역3. 연설문의 워드 클라우드 만들기3-1. 패키지 설치3-2. 세종 사전 업로드3-3. 연설문(data/speech.txt 또는 data/speech2.txt) 파일 불러오기 3-4. Keyword와 사용횟수 추출하기3-5. word_count의 차트 작성 (그래픽 시각화)3-6. wordcloud 작성 (그래픽 시각화)3-7. 3-4.의 보완 사전에 단어 추가 및 추출된 명사의 삭제1) 사전에 새로운 단어 추가 : mergeUserDic() 함수 이용2) 불필요한 단어 사전에서 제거하기 : gsub() 함수 이용3-8. word_count의 차트 작성3-9. wordcloud 작성 (그래픽 시각화)3-10. 출력 결과의 이미지 저장[연습문제]

 

2. 지역별 인구수의 변화에 대한 클라우드 출력

2-1. 지역별 순이동에 따른 워드 클라우드

 

2-2. 단어들의 색 변환

2-3. 다양한 단어 색 출력을 위한 팔레트 패키지의 활용

2-4. 페이지 로딩 및 데이터 파일 열기

2-5. 데이터 정제: 불필요 지역 제외 ('전국' 지역 제외)

 

2-6. '구’ 단위 지역 통계 삭제

 

2-7. 전입자 수가 많은 지역

 

2-8. 전출자 수가 많은 지역

 

3. 연설문의 워드 클라우드 만들기

3-1. 패키지 설치

############################################################# # library(KoNLP) 에러발생과 처리방법 ############################################################# # <에러발생> # Error: package or namespace load failed for ‘KoNLP’: # .onLoad가 loadNamespace()에서 'rJava'때문에 실패했습니다: # 호출: fun(libname, pkgname) # 에러: JAVA_HOME cannot be determined from the Registry ############################################################# #<처리방법> # 자바 다운로드 : http://www.java.com/ko 혹은 http://java.com/ko/download/manual.jsp (32비트 / 64비트) # 설치하면 됨. #############################################################

 

3-2. 세종 사전 업로드

 

3-3. 연설문(data/speech.txt 또는 data/speech2.txt) 파일 불러오기

 

3-4. Keyword와 사용횟수 추출하기

 

3-5. word_count의 차트 작성 (그래픽 시각화)

 

3-6. wordcloud 작성 (그래픽 시각화)

 

3-7. 3-4.의 보완 사전에 단어 추가 및 추출된 명사의 삭제

1) 사전에 새로운 단어 추가 : mergeUserDic() 함수 이용
2) 불필요한 단어 사전에서 제거하기 : gsub() 함수 이용

 

3-8. word_count의 차트 작성

 

3-9. wordcloud 작성 (그래픽 시각화)

 

3-10. 출력 결과의 이미지 저장

[연습문제]

1) 역대 대통령의 연설기록 사이트(http://www.pa.go.kr/research/contents/speech/index.jsp)에서 대통령들의 취임연설문을 비교분석하라.

2) 목원대 총장 취임사 분석

 

 


R pdf_image


l-arrow home-arrow r-arrow