트위터를 이용한 결과물 2가지

2011, Mar 18    

주변 형들고 함께 프로그래밍 실력으로 잉여로운 배틀이 3번째를 맞이했네요

저번에는 아이유가 주제라서 아이유 트윗봇을 만들었는데요

이번엔 주제가 "트위터"네요;;

음.흠.. 저번주에 아이유봇을  만드는 바람에 할 것이 없더라구요;;

곰곰히 생각해보니 트위터가 어떤 커다란 일(이집트사태 나 일본 지진)이 있을때 활발한 맨션이 발생했었는데요

그 맨션안에는 그 사건에 대한 단어가 포함 되어있다는 생각이 들었는데요 ㅋ

모든 맨션에 대해서 단어를 추출하면 좋을 것 같았지만.. 시간상 문제가 되니  

일단 저의 Following을 대상을 한다면 Following 한사람들의 그 때의 주요 화제를 찾을 수 있지 않을까 라는 생각에

결과를 내어 봤습니다.

결과는 처참 했습니다. 결과물을 보시면 아시겠지만 가장 많이 사용된 단어가 ㅋㅋ,ㅎㅎ,ㅠㅠ,ㅋㅋㅋ 이런 것 들이네요

이러한 이모티콘의 사용량이 엄청나다는것만은 확실하네요 

사실 단어만 추출할려면 조사을 제거하고 할것이 참 많은데요 자연어처리를 배운적이 없는 저는 안되겠더군요..

재밌는 사실은 
결과중에 맨션에서 언급된 아이디가 많이 나오더군요..

맨션은 저의 Following을 대상이니 제가 관심있는 어떤 사람을 많이 언급했나는 사실은
어떻게 보면 저의 Following을 대상이 좋아하는 순서가 아닐까 하고 정규표현식으로 작업을 해봤습니다.

물론 1등은 저더군요.. 저의 Following을 대상으로 나온것이니 당연한 것 같구요.. 아닐수도 있겠지만요.ㅋ

결과물은 트위터에서 저의 Following간에서 인기있는 또는 언급이 많이 되는 사용자 추출을 하는 프로그램이 되어버렸네요;;