새로운 사전관의 필요성 한영균 울산대학교 국어국문학과 교수 1. 들어가는 말 지난 10여 년 사이 국내에서의 사전 연구 및 사전 편찬과 관련된 움직임은 괄목할 만한 진전을 보이고 있다. 영역별로 특수한 사전(학습자 사전·동사 구문 사전·조사 사전·관용구 사전·용례 사전·갈래 사전·고유어 사전·시어 사전·작가 사전·고어 사전 등)들이 속속 새로 간행되었거나 간행을 준비중인가 하면, 사전 편찬에 컴퓨터와 말뭉치가 도입되어 컴퓨터를 활용한 말뭉치 분석 결과를 반영한 사전이 만들어지고 있는 것이다. 그러나 그러한 변화가 사전(편찬)학의 이론적 발전을 의미하지는 않는다는 것이 필자의 생각이다. 지금 보이는 가시적 업적들은 이미 이루어졌어야 할 것들이 보충된 것이거나 종래의 언어학적·사전학적 틀 속에 말뭉치 활용이라는 새로운 방법을 도입한 것일 뿐, 오늘날의 사전 나아가 앞으로의 사전이 지향해야 할 방향에 대한 이론적 탐구나 그러한 이론을 바탕으로 한 실천과는 거리가 있는 것으로 생각되기 때문이다. 사전학의 발전을 위해서는 사전 편찬을 위한 전문 교육의 활성화 등 저변 확대를 위한 노력과 함께, 오늘날의 사전과 사전 편찬 방법론이 환경의 변화와 학문의 발전에 걸맞게 변화해야 한다는 사실을 정확히 인식하고, 그러한 인식을 바탕으로 새로운 사전학 이론을 정립해야 할 시점에 도달했다는 것이 필자의 생각이다. 2. 사전과 관련된 여건의 변화 2.1. 사전 개발 및 이용 환경의 변화 사전학 혹은 사전편찬학은 전통적으로 언어학과 밀접한 관련을 가지고 있는 것으로 인식되어 왔다. 그러나 오늘날의 사전학 혹은 사전편찬학은 언어학 이외에도 전산과학·정보과학 등과도 밀접한 관련을 가지고 있으며, 이들 언어학·전산과학·정보과학 등의 인접 학문은 급격한 연구방법론상의 개신을 겪고 있다. 거기에 사전의 개발 환경이나 이용 환경은 과학기술의 발전과 함께 불과 4~5년 전과도 전혀 다른 양상을 띄게 되었다. 사전 개발의 측면에서 보면 이제 우리는 방대한 규모의 말뭉치와 검색 도구, 그리고 편집 도구를 갖추고 사전 편찬 작업에 임할 수 있게 되었다. 좋은 사전을 만드는 일이 단순히 개별 언어항목의 용법에 대한 충실한 언어학적 분석이나 그를 바탕으로 한 유효적절한 뜻풀이를 해내는 능력만으로 감당할 수 있는 일이 아닌 것으로 변했다는 뜻이다. 더구나 인지언어학·전산과학·정보과학적 측면에서의 언어 연구의 대두 등을 통해서 볼 수 있듯이, 언어 연구의 방법과 목적이 변화하고 있으며 개별 언어 항목에 대한 기술 방법도 달라졌다. 이러한 변화는 직접 사전 편찬 혹은 사전 연구에 종사하는 이들이 갖추어야 할 자격 요건이 달라지고 있음을 의미하며, 단적으로 오늘날의 좋은 사전 편찬자(lexicographer)는 자료 처리를 위한 하드웨어와 소프트웨어의 사용 능력을 갖춘 사람이어야 하며, 나아가 사전편찬학뿐만 아니라 정보과학과 전산학, 그리고 언어학에 관한 폭넓은 지식을 바탕으로 사전이라는 (언어)지식의 저장고를 만들고 관리할 능력을 갖춘 사람이어야 한다. 사전학의 이론 역시 그러한 변화를 감당하고 앞서 갈 수 있는 것이 되어야 함을 의미한다. 사전 이용 환경이라는 측면에서는 정보 저장 기술의 발전과 네트워크 확산이 큰 영향을 미치고 있다. 더구나 개인용 컴퓨터를 기반으로 한 멀티미디어의 확산은 사전 사용의 환경을 완전히 바꾸어 놓았다고 해도 과언이 아니다. 이제 사용자들은 특별한 경우를 제외하고는 더 이상 책상 위에 두꺼운 사전을 놓아두지 않는다. 마우스를 움직여 살짝 아이콘을 누르기만 하면 국어사전뿐만 아니라 영어·일어 등 각종 언어사전과 백과사전까지 하나의 모니터 화면에 떠오르기 때문이다. 그것도 텍스트뿐만 아니라 음성, 사진, 경우에 따라서는 동영상까지 볼 수 있게 된 것이다. 2.2. 사전에 대한 언어학적 정의 : 그 실현상의 문제 언어학자가 생각하는 사전이 어떤 것인가는 다음 글에서 잘 드러난다. “사전이란 일정한 언어 항목을 표제항목으로 설정하고 그에 대한 필요충분한 음운·문법·의미상의 정보를 압축해서 체계적으로 제시하여 표제항 중심의 사전적 조항을 이루고서 그 표제항들을 일정한 순서로 배열하여 체계화시킨 하나의 텍스트를 말한다.(이병근 1990 : 554)” 위의 인용문은 사전에 대한 언어학적 관점에서의 정의를 압축해서 보여준다고 할 수 있다. 그런 만큼 언어학자가 생각하고 있는 사전이 가지는 특징과 문제점을 그대로 드러낸다. 이 정의는 크게 ① 표제항의 성격, ② 표제항에 대한 풀이(미시구조)의 내용, ③ 표제항의 배열이라는 세 부분으로 이루어져 있는데, 이 중 둘째 사항은 이 부분의 논의와는 직접 관련이 없는 것이므로 첫째 사항과 셋째 사항을 중심으로 이야기를 진행하기로 한다. 우선 사전의 표제항이 언어 항목이어야 한다는 점을 첫번째로 꼽고 있음을 볼 수 있다. 그러나 언어 항목이라는 용어는 중의적인 것이어서, 표제항이 언어 기호로 이루어진다는 포괄적 의미를 나타내는 것일 수도 있고 사전의 표제항은 특정 영역의 개념 지식(conceptual knowledge)을 나타내는 용어가 아닌 언어 자체에 한정된다는 의미일 수도 있다. 전자의 뜻이라면 “한산도 대첩”과 같은 역사적 사실도 사전의 표제항이 될 수 있는 것이지만, 후자의 뜻이라면 사전의 표제항으로 부적절한 것이 된다. 전통적인 언어사전 편찬자들은 분명히 후자쪽을 고수해 왔다. 그러나 오늘날의 사전들은 꼭 그렇지만은 않다. 언어 학습이 단순히 언어 항목의 학습만으로 이루어지는 것이 아니라, 해당 언어를 사용하는 사회의 정치·경제·사회·문화 전반에 대한 지식을 필요로 한다는 사실을 인식하고, 그러한 점을 사전에 반영하기 시작한 것이다. 대표적인 예로 LDOCE(Longman Dictionary of Current English)라는 영어학습자 사전으로 유명한 롱맨(Longman) 출판사에서 ꡔ영어 언어 문화 사전ꡕ(Dictionary of English Language and Culture)을 1992년 출간한 것과, 프랑스의 로베르(Robert) 출판사에서 1984년 학습자 사전인 ꡔ로베르 소사전ꡕ(Petit Robert)을 고유명사 사전과 한 세트(Petit Robert 1 : Dictionnaire alphabétique et analogique de la langue française, Petit Robert 2 : Dictionnaire universel des noms propres)로 출판한 것을 들 수 있다. 학습자 사전에 한정된 것이기는 하지만 전통적인 언어사전의 한계를 인식하고 그것을 극복하는 방법을 찾은 결과라 할 것이다. 더욱더 큰 문제는 후자의 관점을 사전 편찬에 적용하는 일이 쉽지 않다는 점이다. 어떤 언어 항목이 백과사전적 항목인가 아니면 언어학적 항목인가를 결정짓는 가장 중요한 기준은 해당 항목의 의미가 어느 쪽인가에 달려 있는데, 인지적 측면에서 이들을 구별하기가 어려운 경우가 많다는 사실이 새롭게 인식되고 있기 때문이다. 테일러(Taylor 1989/1995)의 제5장은 인지언어학적 관점에서 언어적 지식과 백과사전적 지식의 경계를 구분짓기 어렵다는 문제를 다루고 있다. 어떤 언어 표현, 예를 들어 ‘월요일’과 같은 가장 일상적이고 기초적인 단어조차 언어 내적 의미 맥락을 통해서만 제대로 이해될 수 있고, 그것은 바로 해당 언어 사회의 구성원이 가지고 있는 외부세계에 대한 인지 양식 나아가 외부세계에 대한 지식을 바탕으로 하는 것이므로, 순수한 언어적 지식 혹은 언어학적 의미란 존재하기 어렵다는 것이다. 이 문제는 학습자 사전에서의 문화적 어휘의 처리라는 측면에서는 더 심각한 문제를 제기한다. 예를 들어 ‘김치, 김장, 배추속’ 등의 단어는 우리에게는 친숙한 일상용어이지만, 한국 문화를 전혀 알지 못하는 외국인에게는 어떤 전문용어 못지 않게 어려운 단어인 것이다. 여기에 사전의 소비자로서의 사용자의 요구라는 문제를 고려에 넣으면, 과연 백과사전적 항목이 절대로 언어사전에 포함되어서는 안될 것인가를 심각하게 고려할 필요가 있다. 표제항의 배열과 관련하여서는 일정한 순서―대개의 경우 자모순이 되지만―로 표제항을 나열한다는 언급이 있는데, 이는 사전의 검색과 관련해서 사용자와 사전 편집자 사이의 약속의 체계로서 존재한다고 할 수 있다. 이러한 약속은 책자 형태의 사전인 경우 필수적인 것이지만 사전의 활용이라는 측면에서는 상당한 제약으로 작용한다. 사전의 사용자는 유의어·반의어 등 의미 관계에 바탕을 둔 검색이나 표제어 역순 검색 등 다양한 방식으로 사전을 활용할 수 있기를 바라는데, 이러한 욕구를 충족시키는 일은 책자 형태의 사전에서는 불가능하지는 않을지라도 많은 부담을 안게 되는 것이다. 그런데 이러한 사용자의 요구까지도 사전의 전자화로 어느 정도 실현될 수 있게 되었다. 전자 사전의 경우 표제어의 배열 방식은 내부적인 검색기능과 관련되는 것일 뿐이어서 사전 사용자는 일일이 배열 순서를 기억할 필요가 없을 뿐 아니라 다양한 검색 기능을 이용해서 각 표제항에 접근할 수 있기 때문이다. 비록 간단한 검토이지만, 표제항의 선정과 배열이라는 거시구조의 문제만 보더라도 전통적으로 언어학자·사전학자들이 생각해 온 사전의 구조와 오늘날의 사전적 실현 사이에는 상당한 거리가 있음을 알 수 있다. 이러한 괴리는 사전 사용자의 사전에 대한 인식과 일반인들이 사전에 대해 요구하는 바 사이에 더 심각하게 드러난다. 2.3. 사전에 대한 사용자의 인식과 요구 : 학습자 사전의 경우 사전에 대한 일반적 인식은 대개 “언어의 용법에 대한 권위를 지닌 참조용 텍스트(reference book)” 정도라고 할 것이다. 이러한 인식은 한편으로는 사전이 지니고 있는 ‘규범적 텍스트’로서의 기능을 다른 한편으로는 ‘교육적 텍스트’로서의 기능에 바탕을 둔 것이라고 할 수 있다. 일반 사용자는 주로 어떤 단어의 의미를 알고 싶을 때, 혹은 올바른 표기나 용법 그리고 한자 표기법 등을 확인하려 할 때 사전을 참조한다. 국내의 경우, 사전 사용자에 대한 연구는 거의 이루어진 것이 없다. 여기서의 서술은 필자가 임의로 학생들을 대상으로 조사한 것을 정리한 것이다. 이 경우 사전이라는 저작물에 등재된 내용에 대해 전적으로 권위를 인정하여 믿고 따른다. 한편 많은 사용자는 언어학자 혹은 사전편찬학자들의 생각과는 달리 사전에서 단순히 ‘언어의 용법’에 대한 설명만을 기대하는 것이 아니라 어떤 항목이든 자신이 알고자 하는 내용을 담고 있기를 바란다. 특히 학습자 사전의 사용자는 그러한 경향이 강해서 초등학생이 ‘한산도 대첩’이 무엇인가를 알고자 할 때에도 먼저 국어사전부터 들춰보는 것이 보통이고, 그러한 항목이 없는 경우 “에이! 사전이 뭐 이래?”라는 반응을 보이게 된다. 이때 사전의 권위는 앞의 경우와는 달리 여지없이 폭락하고 마는 것이다. 이는 학습자로서의 사전 사용자는 사전 안에 언어 기호로 표상되는 모든 지식 체계에 대한 정보가 담겨 있을 것을 기대한다는 것을 의미한다. 사용자의 이러한 요구를 어떻게 수용할 것인가 하는 문제는 앞에서 언급한 바 있는 어떤 단어의 언어적 의미와 백과사전적 의미가 그리 쉽게 분리될 수 있는 것이 아니라는 점과 함께 사전의 거시구조를 결정하는 데에 심각하게 고려되어야 할 문제인 것이다. 2.4. 새로운 사용자의 등장 10여 년 전만 하더라도 사전의 최종 사용자는 일반인이었다. 그러나 컴퓨터에 의한 인간 언어의 이해라는 새로운 과제가 전산과학 분야의 한 영역으로 등장하면서 사전의 중요성은 전혀 다른 측면에서 부각되기 시작하였다. 이른바 자연언어처리 혹은 전산언어학에서 언어처리시스템을 개발하는 이들이 사전을 시스템의 개발에 활용하기 시작한 것을 들 수 있다. 그것은 구문 분석, 문법 개발, 의미 구분, 음성 합성, 텍스트 이해 등 자연언어처리시스템 개발의 모든 영역에 적용되는 것이었는데(보구라에브 Boguraev 1994), 인간이 사용할 목적으로 만들어진 언어사전을 자연언어처리시스템의 개발에 활용하는 것은 상당한 인력과 시간 그리고 비용이 소요되면서도 효율적으로 정보를 추출해 내는 일이 쉽지 않았다. 그것은 사전이 지니고 있는 구조상의 문제 때문이기도 했고, 사전에 사용된 언어가 일반 문서의 언어와는 다른 독특한 구조를 가지고 있다는 데에도 이유가 있었다. 이러한 과정에서 제기된 문제가 사전이 구조적으로 일관성을 결여하고 있다는 것과 자연언어처리시스템용 어휘부를 구성하기에는 언어 정보가 부족한 부분이 많다는 점이었다. 그 결과 한편으로는 사전의 구조 분석과 관련된 문제가, 다른 한편으로는 일반 언어사전에서 얻을 수 없거나 있더라도 불충분한 언어 정보의 습득을 위한 방안을 강구하는 문제가 검토되기 시작하였다. 사전 사용자의 요구, 그리고 인지과학적으로 볼 때 언어 항목의 의미 해석이 단순하지 않다는 문제와 함께 이제 사전은 또 다른 요구에 직면하게 된 것이다. 사전이 언어로 표상되는 인간의 지식 체계, 폭을 좁혀서 보더라도 언어 지식에 관한 포괄적이면서도 미시적인 정보를 담고 있을 것을 요구하는 새로운 사용자가 등장한 것이다. 어떤 이는 전산과학이나 전산언어학에서의 어휘 정보 습득을 위한 사전 활용의 문제가 왜 사전편찬학이나 언어학의 관심사가 되어야 하는가 하는 의문을 품을 수도 있겠다. 그러나 우리가 앞에서 본 바와 같이 언어 연구, 특히 사전의 개발은 이제 사전학자나 언어학자만의 문제가 아니다. 단적으로 전산과학 혹은 정보과학적 연구를 통해 얻어진 언어처리도구 및 사전편찬도구를 활용할 때와 그렇지 않을 때의 효율성을 비교해 보면 잘 알 수 있을 것이다. 전산과학 혹은 정보과학자들이 풍부하고 정확한 언어 정보를 얻을 수 있게 하는 일은 바로 언어 연구 및 사전학의 발전과 직결되는 일인 것이다. 여기서 주목되는 것은 자연언어처리시스템의 개발에 활용되는 사전이 주로 외국인을 위한 학습자 사전(Learner's Dictionary)과 두 언어 대역사전(Bilingual Dictionary)이라는 점이다. 이 중 후자는 주로 기계번역에 사용되는 대역 어휘부의 구성에 필요한 정보를 추출하는 데에 사용되었지만, 다른 한편으로는 어휘 의미의 변별이라는 영역에도 활용될 수 있다. 대역사전 역시 언어의 학습을 위한 도구라는 점을 감안하면, 전산과학 혹은 정보과학에서 언어 정보의 추출에 사용하는 사전은 넓은 의미의 학습자 사전임을 알 수 있는 것이다. 여기에는 무엇보다도 학습자 사전이 표제항이 되는 언어(source language)를 잘 알지 못하는 이들을 위한 사전이라는 것이 크게 작용한 것이라고 할 수 있다. 언어에 대한 직관 혹은 지식이라는 면에서 보면, 어떤 언어를 새로 습득하는 사람의 처지는 원래 인간의 언어를 전혀 알지 못하는 컴퓨터와 다를 바 없기 때문이다. 3. 마무리:문화적 ‘상품’으로서의 사전 우리는 20세기가 마감되는 시점에 와 있다. 그런데 사전을 생산해 내는 사전 편찬자나 사전 편찬과 밀접한 관련을 가지고 있는 언어학자들은 여전히 19세기의 사전관 19세기의 사전관이란 한편으로는 언어 항목을 표제항으로 하는 사전은 ‘백과사전적 항목’이나 고유명사의 등재를 가급적 피하는 것이 옳다는 전통적인 유럽의 사전학자들이 가지고 있던 생각을 가리키며, 다른 한편으로는 만들어진 사전의 사용자 즉 사전의 소비자에 대해서는 전혀 배려하지 않는 편찬자 중심의 사전관을 말한다. 국내의 경우에도 이러한 관점이 주를 이루고 있다고 볼 수 있다. 1980년대 말 이후 활발하게 이루어졌던 국어사전의 평가에서 가장 큰 문제점의 하나로 지적된 것이 ‘백과사전적 항목’이 많다는 점이었던 것이다.으로 사전을 구상하고, 그러한 구상을 실현하기 위해 애쓴다. 그래도 괜찮은 것인가? 앞에서 보았듯 사전 개발 및 사용과 관련된 제반 여건들이 변화하고 있다. 무엇보다도 사전 사용의 환경이 달라졌고, 그와 함께 사전의 사용자가 사전에 대해 요구하는 바가 달라졌다. 사용자의 요구가 달라진 것은 사전 사용 환경의 변화와 함께, 사용자들이 알아야 할 지식의 내용과도 관계가 있다. 언어 항목에 대한 지식만으로 감당해 내기에는 너무도 사회의 변화가 빠르고, 사용자는 그러한 변화의 결과로 만들어지는 지식의 내용을 사전에서 찾기 때문이다. 앞으로 만들어질 사전은 이에 적절하게 대응하지 못하면 사전 사용자로부터 외면을 당하게 될 것이다. 따라서 아무리 많은 예산과 인력을 투자하여 말 그대로 언어학자나 사전편찬학자가 생각하는 좋은 사전을 만들더라도 사용자가 외면하는 사전으로는 그에 값하는 효과를 거두기 어려울 것이다. 시장의 확보와 투자비용의 회수에 실패할 것이라는 뜻이다. 일반적으로 사전학자나 언어학자는 사전이 “상품”이라고 생각하는 것을 기피한다. 그러나 사전의 편찬을 위한 경제적 기반을 확보하는 일은 좋은 사전의 생산을 위한 전제조건이므로 이를 무시해서는 안 되고, 최소한의 투자 비용의 회수는 사전의 유지·보수를 위해서 필수적이며, 따라서 투자 비용 회수에 실패한 사전은 학문적인 평가와는 별개로 잘못 만들어진 사전이라고 이야기할 수밖에 없다는 것이 필자의 생각이다. 그 경우 “우리는 좋은 사전을 만들었다”는 자기 만족에서 위안을 구하거나, “다시는 그런 사전 편찬은 기획하지 않겠다”는 자조에 빠지기 십상이다. 그런 최악의 상황을 피하기 위해서라도 이제 사전이라는 문화적 상품의 생산자로서 우리는 사전에 대해 새로운 인식을 가질 필요가 있다. 과연 사전이란 무엇이며, 어떤 유형의 것들이 존재할 수 있는가. 각각의 유형의 사전들이 지향하는 목표와 그 목표를 가장 효율적으로 달성할 수 있는 방법은 무엇인가. 사전의 사용자들이 요구하는 것은 무엇이며 사전의 소비자로서의 사용자들의 요구와 사전의 생산자로서 사용자들에게 제공하고자 하는 혹은 제공하여야 할 사항을 어떻게 조화시킬 수 있는가 등등을 새로운 각도에서 검토해 볼 필요가 있는 것이다. 참 고 문 헌 이병근(1990). 「사전 및 사전학」. ꡔ국어연구 어디까지 왔나ꡕ. 서울대 대학원 국어연구회 편. 서울 : 동아출판사. 이상섭(1989). 「뭉치언어학 : 사전 편찬의 필수적 개념」. ꡔ사전편찬학연구ꡕ 2. 서울 : 탑출판사. Boguraev, Branimir(1994). Machine-Readable Dictionaries and Computa- tional Linguistic Research, in Zampolli et al.(ed.) Current Issues in Computational Linguistics: In Honor of Don Walker, Kluwer Academic Publishers. Taylor, John R.(1985/1995). Linguistic Categorization, Oxford University Press. (조명원·나익주 공역(1997). ꡔ인지언어학이란 무엇인가-언어학과 원형이론ꡕ. 서울:한국문화사.) Walker, D. E., Antonio Zampolli, Nicoleta Calzolari(ed.)(1995). Automating the Lexicon - Research and Practice in a Multilingual Environment, Oxford University Press.