[우리말 어휘 빈도]

우리말에는 어떤 말이 많이 쓰이고 있을까

조남호(趙南浩) / 국립국어연구원

우리말에는 어떤 말이 많이 쓰이고 있는지 정확히 알기는 어렵다. 사람마다 알고 있는 말이 제각각인데 그것을 모두 알아내기는 불가능하기 때문이다. 사전에 올라 있는 말로 추정해 보는 방법이 있다. 일반 사람이 흔히 이용하는 소사전에 10만 이상의 단어가 수록되어 있으므로 그보다 많은 단어가 있다고 해야 할 것이다. 그렇지만 사전에 오른 단어를 모두 아는 사람은 없다. 사전에 있는 말 중에는 자주 쓰이는 말이 있는가 하면 실제로는 거의 보거나 듣기 어려운 말도 있다.
    사정이 이렇기는 하지만 통계적으로 어떤 말이 어느 정도나 사용되는지를 파악하는 일은 중요하다. 하나의 예를 들어 보자. 어린 학생이나 외국인에게 우리말을 가르치고자 할 때 어느 말부터 가르쳐야 할까? 자주 사용되는 말부터 가르쳐야 할 것이다. 그래서 외국의 경우에는 자기 나라 말의 사용 빈도를 조사하여 그 결과를 다양하게 활용하고 있다. 우리나라에서도 1956년에 문교부에서 발표한 자료가 있다. 그렇지만 시간이 많이 흘러 문교부 자료는 낡은 자료가 되었고 새로운 조사 자료가 필요하게 되었다.
    이에 따라 연구원에서는 지난 3년에 걸쳐 현대 국어의 사용 빈도를 조사하여 최근에 결과를 발표하였다. 문학 작품, 신문, 잡지 등으로 나누어 적정한 분량의 자료를 표본으로 조사하는 방법을 썼다. 조사는 일반 단어, 고유명사, 조사(助詞), 어미로 나누어 진행되었는데 자료의 양과 한 번 이상 나온 모든 말의 수를 정리한 것을 표로 보이면 아래와 같다.

범 위 자료 양 항목 수
일반 단어 1,484,463 58,437
고유명사 74,321 16,855
조 사 637,319 184
어 미 637,319 702

일반 단어를 예로 든다면 1,484,463개의 단어를 조사하니 58,437개의 다른 단어가 1회 이상 나왔다는 뜻이다.
    아래의 표는 빈도가 높게 나타난 순서로 5위까지의 항목을 제시한 것이다.

일반 단어 고유명사 조 사 어 미
항목 빈도 항목 빈도 항목 빈도 항목 빈도
것/의존명사
하다/동사
있다/보조용언
있다/형용사
되다/동사
25,567
22,064
18,553
18,202
11,506
한국
미국
일본
서울
1,646
1,216
1,197
1,087
1,025




이다
72437
71370
57750
50894
49507




76,710
69,661
60,551
46,689
35,239

빈도에 나오는 숫자가 크다는 것은 그만큼 자주 사용되었다는 뜻이다. 따라서 제일 빈도가 높은 항목들인 '것', '한국', '의', '다'가 각각의 범위에 속하는 항목 중에서 우리가 가장 자주 접하는 말인 셈이다. 일반 단어는 품사별로 조사를 했기 때문에 '있다'가 보조용언과 형용사로 나뉘어 있다. 품사를 따지지 않는다면 일반 단어에서 '것'보다 '있다'가 더 자주 쓰이는 말이 될 것이다.
    이 빈도 자료를 잘 활용하면 많은 흥미로운 결과를 얻을 수 있다. 연구원에서는 이 자료를 한국어 교육에 필요한 어휘를 선정하는 작업에 활용하고 있다. 빈도 조사 결과를 자세히 알고자 하는 사람을 위하여 연구원 홈페이지(korean.go.kr)의 공개 자료실에 빈도 조사 결과 전체를 올려 두었다.