미 과학자, 블로그-노래가사 등 컴퓨터로 분석

 

미국인 가장 행복했던 날 오바마 당선 날

가장 슬펐던 날은 마이클 잭슨 사망일

 

 

정치인들은 입만 열면 민생을 위해라고 뇌까리지만 하는 짓이라고는 결국 자기 뱃속 챙기기가 전부인 이 나라에도 앞으로 진정한 국민 행복도를 실시간으로 측정할 수 있는 날이 오리라는 희망을 주는 소식이 미국에서 날아들었다.

 

미국 학자들이 온라인에 떠도는 수많은 말들의 행복도를 분석해 오늘은 국민들이 행복하다아니면 불행하다는 전국적인 측정을, 또는 경상도는 행복하지만 전라도는 불행하다고 지역별로 분석할 수 있는 방법을 개발했기 때문이다.

 

미국 과학진흥협회(AAAS)가 발행하는 과학 정보매체 유레칼러트(eurekalert.org) 24버몬트 대학의 컴퓨터 과학자 피터 다즈(Peter Dodds)와 크리스 댄포스(Chris Danforth) 두 교수가 온라인에서 사용된 단어들을 컴퓨터로 분석해 전국 또는 지역별 행복도를 측정할 수 있는 방법을 개발했다고 보도했다.

 

블로그-노래가사 등 1천만 개 문장 분석

 

이들은 블로그와 노래가사, 대통령의 연설 등 온라인에 올라오는 글들을 컴퓨터로 분석해 점수를 매긴다. 점수를 매기는 방법은 영어 단어에 대한 감정 기준(Affective Norms for English Words, ANEW)’ 연구가 정한 기준에 따랐다.

 

ANEW는 여론 조사 등을 토대로 1034개의 영어 단어에 대해 최저 1점부터 최고 9점까지의 행복 점수를 부여해 놓았다. 예를 들자면 승리에 벅찬(triumphant)’8.87점으로 거의 최고점을 받는다. 이어 낙원(paradise) 8.72, 공허(vanity) 4.30, 인질(hostage) 2.20점이며, 자살(suicide)은 거의 최하 점수인 1.25점을 받는다.

 

수학자, 컴퓨터 학자이면서 사회과학에도 관심을 기울여온 두 교수는 영어권의 블로그 230만 개로부터 문장 1천만 개 이상을 끌어내 컴퓨터 프로그램에 돌리고 있다. 그 동안 확인된 결과로는 최근 4년간 미국인들이 가장 기뻐했던 날은 오바마 대통령이 당선된 날이란다. 이날 영어권에서는 자랑스럽다(proud)’란 단어가 곳곳에서 터져 나와 행복미터가 수직상승 했단다.

 

그리고 최근 미국인들이 가장 슬퍼한 날은 마이클 잭슨 사망 소식이 전해진 지난 625일이었단다. 그리고 해마다 910, 11일이 되면 슬픈 영어 단어들이 블로그 등에 많이 올라오면서 행복미터가 푹 꺼진다고 했다.

 

이 두 교수는 자신들의 이러한 방법과 행복도 측정 실적을 행복 과학 저널(Journal of Happiness Studies)’ 이번 주 호에 발표했다.

 

청소년들 행복도 낮고 나이 들면서 행복해져

 

그 동안 행복학을 연구하는 사회과학자들이 사람은 누구나 행복을 느끼는 정도가 비슷하다고 주장해온 것과는 달리 이 논문은 연령별로 행복도에 큰 차이가 있다고 밝혔다. 청소년들은 싫다, 혐오, 멍청하다, 슬퍼, 우울하다, 지루하다, 외롭다, 미쳤다 그리고 살쪘다 같은 단어들을 많이 사용하기 때문에 연령대 중 행복도가 가장 낮은 것으로 나타났다. 행복도는 나이가 들어가면서 올라가다가 늙으면서 떨어지기 시작한다.

 

이들이 이처럼 연령별 분석을 할 수 있었던 것은 블로거들이 자신에 대해 밝히는 경우가 많기 때문이다. 이 때문에 두 교수가 개발한 프로그램은 연령별, 남녀별, 인종별 행복도분석도 가능하다.

 

직접 물어보면 행복도에 대해 거짓말

 

다즈 교수는 과거 행복을 여론조사로 측정하려는 시도가 많았지만 정확한 측정을 했다고 볼 수 없다그 이유는 사람들은 조사를 당한다는 생각이 드는 순간 사실과 다른 말을 하기 때문이다라고 말했다. 즉 지금 불행하면서도 조사원에게 나 불행해라고 말하기는 싫기 때문에 살만해라고 말한다는 것이다.

 

그는 이어 우리는 사람들에게 직접 당신 행복해?”라고 물어보는 게 아니라 사람들이 오픈된 공간인 온라인에 올리는 글을 분석하는 것이기 때문에 어깨 너머로 쳐다보면서 수많은 사람들의 행복도를 비교적 객관적으로 측정할 수 있다고 설명했다. 직접 물어보지 않기 때문에 오히려 정확하다는 주장이다.

 

물론 이 방법에도 한계는 있다. 블로그를 하는 사람은 대개 교육받고 젊은 층이기 때문이다. 그러나 한편으로는 젊고 똑똑한 블로거들이 장래 여론을 만들어나가는 사람들이란 점에서, 또 블로그에 참여하는 연령층이 넓어지고 있다는 점에서 결정적 단점은 아닌 듯 싶다.

 

우리도 빨리 진짜 국민 행복도 조사 프로그램돌리자

 

이 보도를 보면서 우리도 어서 빨리 국민 행복도 조사 컴퓨터 프로그램을 만들어야겠다는 생각이 들었다.

 

정부-여당 또는 기업 연구소가 만들어내는 조작된 국민 행복도 조사따위는 이제 필요 없고, 컴퓨터가 냉정하게 파악한, 그리고 창피하기 때문에 전 불행하진 않답니다라고 거짓 대답한 말을 데이터로 삼지 않는, 진짜 한국인의 행복도 조사가 필요하기 때문이다.

 

이를 위해서는 두 가지만 하면 된다. ANEW라는 곳에서 했듯 한국어의 주요 감정 단어에 행복도 점수를 매기는 것이 하나다. 그리고 나머지는 이들 두 교수가 했듯 블로그, 노래가사, 대통령 연설 등에 나온 단어들을 긁어 모아 정해진 점수를 부여해 결과를 알려 주는 컴퓨터 프로그램이다.

 

만약 이런 프로그램이 이미 만들어졌다면 한국인에게 가장 행복했던 날은 언제였을까? 미국인들이 오바마를 뽑아놓고 프라우드(proud)’를 연발했듯 한국인들이 자랑스러워 가슴 뿌듯했던 날은 언제였을까?

 

그리고 2009 7월 지금 이 프로그램을 돌린다면 한국인의 행복도는 과연 몇 점이나 나올까. 우석훈 연세대 교수가 한겨레신문 칼럼에서 이 나라의 주인은 국민이 아닌 조중동 3개 신문사인 것 같다고 쓴 눈물겹게 자랑스런 대한민국의 행복도 점수는?



Posted by
,