텍스트 감정 시각화

텍스트에서 감정을 찾아내다

제목은 거창하네

원래 목적은  텍스트를 시각화 하는것이었다

상대적으로 숫자는 시각화 하기가 쉽다.

그럼 텍스트는?  사실 텍스트의 내용을 시각화 하는 것은 오래전부터 사례를 무수히 찾아 볼수 있다

나는 텍스트 그 자체를 시각화 하는 방법을 찾아봤는데……

나 같이 생각하는 사람 이미 많이 있더라….최근에 데이터 시각화가  붐이 일면서 텍스트 테이터 시각화 분야로 다양한 실험적인 시도들이 많이 있다 (그건 다음에 정리)

우선 내가 한 짓은?

글자를 시각화 하는것

먼저 텍스트를 골랐다.. 좀 품격도 있어야 겠고 , 너무 짧지고 길지도 않은 단편소설을 골랐다

그래도 중고등학교 때 수업시간에 배운 단편소설중 재미있게 봤던 “사랑손님과 어머니”를 골랐다.

2015-08-12 02 39 33

여기서 감정을 나타내는 단어를 골라서 PROCESSING 코딩을 해서 색을 입혔더니

2015-08-12 03 19 18 2015-08-12 03 39 08

2016-04-15 21 14 48

 

지금 before 와 after만 보니 단순해 보이지만 수많은 고난과  시련이 있었다.

1.감정이란?  — 세상에 이게 첫번째 시련일 줄이야

많은 단어들 중에 감정어를 뽑아서 시각화 하겠다고 한건 … 허세였다 보다…

우선 인간의 감정을 분류 할 필요가 있었다. 감정에 분류에 대해선 동서고금에 많은 학자들이 연구를 했으나

감정은 무 자르듯이 분류 할 수 있는게 아니였다. 요로코롬 인사이드 아웃처럼 5개로 쉽게 갈리지 않았다.  (추후 부가 설명하겠음)

107279-full

그래도 나름 여러 학자님의 분류 표를 참고 해서..내가  8개로 분류 해 보았다…

희노애락 + 좋다,싫다+ 수치   정도…. 현대인이 자주 표현하는 감정으로 8개를 선정해봤다….(내 맘대로…ㅋㅋㅋ)

2.  감정과 색상?

그럼  8개로 나눈 감정에 색상을 어떻게 매치 시킬지?

제일 쉬운건 ” 화, 분노” 였다. 이건 뭐 빨강 만한게 없지..그럼 나머진?  검색해 보니까 플러칙이란 분이 이런 표를 만들어 놨더군…

이표는 색상에 관한건 아니고  감정의 관계, 강도에 따라 여러가지의 감정들의 관계를 원추형 입체로 표현 하셨다.

 

114-emoticonstheory1

그런데 감정이란게  동양 서양이 다르고 과거와 현재가 또 다른데  거이에 관념적으로 연상되는 색상도 충분히 다르다…라는걸 보여주는 인포그래픽이 여기 딱하니…있다……. 한 80여개 나라 별로..10가지 감정을 표현하는 색상을 말해준다…. 젠장…

2015-08-11 20 28 48

난…이것도 내맘대로 그냥 정했다….여러가지 자료 들을 참고해서…..(결과는 내맘대로..)

2016-04-15 21 14 48

 

3. 한글 이렇게 어렵다니…..

사랑손님과 어머니….의 사랑은 love이 아니었다

그리고  다양한 어미 변화…….아…..한글 어렵다……

한글 자연어 처리에 관한  연구는 영어에 비해서는 많이 뒤쳐진듯하다…….  ICT 가는길에  한글이  중요하다는걸..난 이번에 처음알았다.

사랑손님과 어머니 를 단어별로 쪼개고  그 단어가 감정을 표현하는 단어인지를….손으로 수작업 할 수는 없으니  자동화 과정을 거쳐야 하는데……  다양한 어미 변화로 인해  ……….

 

 

 

You may also like...