日本語의 辭典
1. 역사
사전 편찬은 먼저 외국어 사전으로부터 출발하며, 자국어의 사전, 그것도 현대어까지 포함한 것은 훨씬 후대에 등장하는 것이 보통이다. 일본에서도 漢和辭典은 가나 문자의 발명에 이어 비교적 이른 시기에 만들어졌다. '新撰字鏡'(900)·'類聚名義抄'(12세기) 등. 에도(江戶) 시대에 널리 보급된 '節用集'이라고 불리는 사전 역시 주로 漢字의 읽기와 쓰기를 목적으로 하여 만들어져 사용된 것이다. 후에는 古語 辭典, 方言 辭典 등도 만들어졌으나 이런 것은 그리 많지 않았다. 더구나 현대어의 의미 설명을 주된 목적으로 하는 사전은 존재하지도 않았다. 17세기 초에 포르투갈 인들이 만든 일본어·포르투갈 어 對譯 辭典은 바로 그때 당시의 현대어를 대상으로 하는 것으로서, 기본 단어를 중심으로 단어 4만 개를 올린 훌륭한 것이었으나 후세의 일본인들에게는 아무런 영향도 미치지 않았다.
古語와 어려운 단어만이 아니라 잘 아는 단어들까지 포함하여 표기·의미·문법적 자질·어원 등을 전체적으로 기술한 근대적인 사전은 大槻文彦(오츠키 후미히코)의 '言海'(1891)로부터 시작된다. 이것은 영어의 웨브스터 사전을 본뜬 것이다. 그 후 '大言海'·'大日本國語辭典'·'大辭典'과 같은 큰 사전들도 만들어져서 형식상 일본의 사전은 근대화되었다. 그러나 주의해야 할 점은, 일본어 자체의 근대화가 아직 충분히 이룩되지 않았다는 점, 따라서 국어사전의 근대화 역시 불충분하였다는 점이다. 明治시대에는 일반 문장은 文語文, 즉 약 1000년 전의 문법에 기초한 문장이었다. 이것은 점차 현대어 문법에 기초한 口語文에게 그 자리를 물려주었으나, 완전히 口語化가 된 것은 2차 대전 이후의 일이라 할 수 있다. 이러한 상황에 부응하듯이 사전 역시 古代語가 중심이 되어 있었으며 현대어는 일단 실어 놓았다고 할 정도였다.
이에는 연구자들이 관심이 古代語에 있었고, 현대어의 연구는 거의 없었다는 사정도 영향을 미치고 있다. 현대어의 연구가 본격적으로 시작된 것은 2차 대전 후에 국어 개혁의 필요성이 인식되면서 國立國語硏究所가 창설된 이후라 할 수 있다(지금도 연구의 주류는 日本語史 혹은 방언이다. 현대 표준어를 주된 연구 대상으로 하는 연구자는 그리 많지 않다.). 특히 최근에는 외국인을 대상으로 하는 일본어 교육의 수요가 많아지면서 이에 따라 현대어 연구, 현대어 중심의 사전에 대한 요구가 높아지고 있다. 일본어를 배우려고 하는 외국인들이 일차적으로 목표로 하는 것은 현대어이지, 옛말이 아니기 때문이다. 文化廳 編 '外國人のたぬの基本語用例辭典(외국인을 위한 기본어 용례 사전)'과 같은 외국인을 대상으로 하는 사전도 몇 종 출판되게 되었는데, 이들 사전은 어구의 해석을 단순한 어구의 치환으로 호도해 버리는 경향이 있는 국어사전에 대한 좋은 자극제가 되고 있다.
2. 출판과 사용의 현황
일본의 사전의 특징으로서는 먼저 그 종류와 출판 부수가 많다는 것을 들 수 있다. 주로 외국인을 위한 일본어 교육을 대상으로 하는 '日本語敎材리스트'(凡人社)의 사전의 항목에는 약 330종류의 사전이 등록되어 있다. 그 대부분은 '言語學 大辭典'과 같은 事典, 혹은 '外來語 辭典'·'古語 辭典'·'表記 辭典'과 같은 특수 사전이기 때문에 이들과 英和 辭典·漢和 辭典 따위를 제외한 순수 국어사전의 수는 그리 많지는 않으나 그래도 약 30종류가 된다. 이들 국어사전의 발행 부수를 알 수는 없는데, 예를 들어서 작년에 발행된 '廣辭苑(岩波書店) 제4판은 100만 부를 넘었다고 한다. 다른 언어에 관한 통계는 잘 모르겠는데, 영어 이외의 언어로써 이렇게 많은 종류의 사전들이 해마다 출판되고 있는 언어는 그리 많지 않으리라 생각된다.
뿐만 아니라 국어사전은 상당히 널리 사용된다. 日本放送協會가 1971년에 실시한 조사에 의하면 국어사전을 전혀 사용하지 않는 사람은 15%에 불과한데 비해, '자주 사용한다 18%', '가끔 사용한다 43%'로, 합치면 61%나 된다. 다만 국어사전을 어떤 목적으로 사용하는가 하면, 가장 많은 것은 아마 깜빡 잊어버린 漢字를 찾기 위해서일 것이다. 편집자가 가장 힘들여 만드는 부분인 기본 어휘의 설명 등은 보통 일본인들은 거의 읽지 않을 것이다.
여기서 현재의 일본 사전의 존재 방식과 관련하여 중대한 단점을 하나 지적해 두고자 한다. 그것은 이처럼 사전 편찬이 성행되며 거기에 많은 언어학자들이 참가하는데도 불구하고, 辭典 編輯法(lexicography)에 대한 학문적 연구가 부족하다는 점이다. 이것은 歐美 각국의 학계에서 근년에 이 방면에 대한 관심이 높아져서 전문 잡지(International Journal of Lexicography)까지 발행되고 있는 상황에 비해서 대조적이다. 다행히 일본은 歐美의 학문을 소개하는 데에는 비교적 열심이어서 이들 연구 가운데 몇몇은 번역되었다. 예를 들어서,
등이 번역되었으며, 이들은 앞으로 좋은 영향을 미칠 것으로 믿어진다. 일본어 연구자들의 사전 연구란 주로 옛날 사전들을 언어 자료로서 다룬다는 것이었지, 새로운 사전을 어떻게 만들 것인가 하는 것은 아니었다.
辭典 編輯法의 연구는 먼저 현재 있는 사전의 분석으로부터 출발하여야 한다. 그러나 사전 편찬자는 연구자들과 말하자면 同業이므로 서로 잘 아는 사이일 경우도 많다. 그래서 장점을 칭찬하는 선전을 하기 쉽지만 객관적 분석은 하기 어렵다는 문제가 발생한다. 이 점에서는 편집자들과 직접 안면이 없는 英美 사전을 대상으로 하는 일본의 영어 학자들이 더 객관적인 태도를 취할 수 있어 사전 편집법의 연구도 발달되어 있다. 위에 든 번역도 그런 예인데 이 밖에도 英美 사전을 자세히 분석한 '英語 辭書의 比較와 分析'이란 시리즈도 출판되고 있다.
3. 大辭典
사전은 규모에 따라
과 같이 나누어진다. 대사전이란 이름이 지어진 사전이 몇 종 있긴 하지만 이 기준에 따른다면, 대사전이라 부를 수 있는 것은 '日本國語大辭典(小學館)밖에 없다. 세계의 대사전의 모범으로서 영어의 OED(Oxford English Dictionary)를 드는 데에는 이의가 없으리라 생각한다.'日本國語大辭典' 역시 이를 의식하고 만들어진 것이 분명하지만 그 수준에는 전혀 도달하지 못하였다. OED의 가장 큰 특징은 풍부한 예문에 있다. '日本國語大辭典'도 문헌의 양이 한정된 古代語에 대해서는 꽤 많이 예문을 모았으나 근대에 대해서는 너무나도 불충분하다고 할 수밖에 없다.
대사전이 만들어지게 된 사정은 나라마다 다르다, 영국의 경우, 방대한 예문을 모을 수 있었던 이유는 교양 시간이 있고, 무엇인가 사회에 도움이 되는 일을 하려고 생각하는 계급이 있었기 때문이었다. 즉 귀족 제도가 이를 만들어 낸 것이다. 독일의 대사전이라면 Grimm의 사전인데, 이것은 100년이 넘도록 단어 하나하나에 전력을 기울인 학자들, 즉 아카데믹한 사회의 소산이다. 프랑스에는 '프랑스 어 寶典'(Tresor de la langue française)이란 대사업이 진행 중인데, 이것은 프랑스 어를 프랑스 자체의 위신으로 간주하는 국가의 힘에 의한 사업이다. 한편 미국의 대표적인 사전인 웨브스터는 민간 대자본에 의한 것이다. 일본의 '日本國語大辭典'은 小學館이라는 민간 자본의 힘에 의한 것으로서, 말하자면 미국형이다.
사전은 일반적으로 그 언어에 대한 연구 수준을 반영한다. 이 사실은 특히 대사전의 경우 더욱 그러하다. 서둘러서 큰 돈을 쏟아 넣어도 배경을 이루는 연구들의 수준이 높지 못하면 어떻게 할 도리가 없다. 예를 들어 OED를 편찬 때에 많은 예문을 모을 수 있었던 배경에는 그 예문을 채집할 만한 본문이 확정되어 있었다는 사정을 들 수 있다. 어떤 작품에서 예문을 채집하려고 하여도 몇몇 서로 다른 텍스트가 있어서 표준 텍스트가 확정되지 않았을 경우 그 신뢰도는 낮아질 수밖에 없다.
4. 中辭典
중사전으로서 가장 대표적인 것은 '廣辭苑'(岩波書店)으로서, 말의 정의가 문제될 때에는 '廣辭苑'에 따르면 이러하다는 식으로 의논을 전개하는 뿌리 깊은 습관이 있었을 정도이다. 최근에 이에 대항할 수 있는 것으로서 '大辭林'(三省堂書店)이 등장했다. 이들 (및 '日本國語大辭典') 사전에 공통된 특징으로 백과사전적 요소를 겸비했다는 점을 들 수 있다. 즉, 人名, 地名, 作品名 등을 올려놓고 간단한 해설을 붙였으며, 動植物 이름 등도 상당한 부분을 차지했다. 이것은 말의 용법을 설명한다는 국어사전 본래의 역할에서 벗어나긴 했으나, 실용적으로 편리하다는 사실을 부정할 수 없다. 백과사전적 요소를 가지게 되면 최신 정보를 담기 위해 자주 개정할 필요가 생긴다. '廣辭苑'은 1954년에 초판을 냈고, 1991년에는 제 4판을 냈다. 그런데 최근에 이들 중사전은 전산화되었다. 즉, 전체가 CD-ROM에 입력되어 여러 형식으로 검색할 수 있을 뿐만 아니라, 예를 들어서 새 이름의 항목에서는 그 새의 울음소리를 들을 수 있다는 식의 이용도 할 수 있게 되었다.
'日本國語大辭典'은 물론 '廣辭苑'도 현대어만이 아니라, 역사적 부분에 상당히 힘을 쏟았다. 이에는 좋은 면과 나쁜 면이 있다. 나쁜 면이란 예를 들어 1000년 전의 용법과 현대어의 용법이 구별 없이 나란히 기술되어 있어서 어느 것이 현대어의 용법인지 알기 어렵다는 점이다. 이것은 특히 일본어를 배우려는 외국인에게는 결함이 될 것이다. 이 점에서 특색이 있는 것이 '學硏國語大辭典'(學習硏究社)이다. 이 사전은 대상을 현대어에 한정한 데다가 신문 잡지 등에서 모아진 실제 용례를 수록하였다.
사전은 일반적으로 지면의 제약성 때문에 만든 예문을 드는 경우가 많아 그 때문에 의미 설명까지 부자연스러워지게 마련인데, '學硏國語大辭典'은 대상을 현대어의 용법에 한정한 것과, 實例를 중요시한 것에 의해 의미 설명까지 좋아졌다고 생각된다.
덧붙여 말한다면 국어사전은 아니지만 현대 일본어 사전 중 무시할 수 없는 것으로서 '新和英大辭典'(硏究社)이 있다. 국어 학자가 만드는 사전이 자칫하면 고전 쪽에 기울기 쉬운 데 비해, 이 사전은 현대어의 용례가 풍부한 점에서는 국어사전을 훨씬 능가하는 것으로서, 어떤 의미에서는 최고의 현대 일본어 사전이다.
5. 小辭典
수량적으로는 물론 소사전이 가장 많이 출판되고 있다. 이용자의 입장에서 보면 어느 사전이나 대동소이한 것처럼 보인다. 사실 깜빡 잊어버린 漢字를 찾는다는 정도의 이용법이라면 무슨 사전을 써도 마찬가지일 것이다. 그러나 자세하게 보면 漢字 하나하나에 자세한 설명을 붙임으로써 漢和辭典의 역할도 다할 수 있게 하거나, 유의어와의 의미 구별에 중점을 두거나 하는 식으로 한정된 지면에서 그 나름대로 특색을 내려고 노력하고 있다.
상황 변화에 대해 신속히 대응할 수 있는 것이 소사전의 장점이다. 즉 대사전은 물론, 중사전도 전면적 개정을 하기는 매우 어렵지만, 소사전은 개정하기 쉬워 신판에서 여러 가지로 개량할 수 있다. '新明解國語辭典'(三省堂書店)을 예로 들어 보자. 이 사전은,
처럼 신판을 내고 있다. 제2판은 제1판에 곧 이어서 출판되었기 때문에 그렇게 큰 변화는 없었으나, 제3판에서는 단어 결합의 모습을 자세히 제시하였다. 예컨대 제2판에서는 '(허덕이다)'란 단어에 대해서
라는 예문밖에 없었던 데 비해, 제3판에서는
처럼 잘 결합되어 사용되는 단어의 예를 들고 있다. 또 예문이 없었던 '影響에,
처럼 수많은 결합례를 제시하였다.
제4판에서도 제3판에 비해 설명이 좋아진 예가 있는데 특히 눈에 띄는 특색으로 가산 명사의 명수사를 제시한 것을 들 수 있다. 예를 들어서 'ホ-ムラン'(홈런)을 찾아보면 '一本·一發'(한 방)이란 명수사를 쓰는 것을 알 수 있다. 마찬가지로 'バツト'(방망이), 'ヒット'(안타)는 '一本'(한 자루, 한 방), 'グロ-ブ'(글러브)는 '一枚'(한 개), 'マスク'(마스크)는 '一面'(한 개)처럼 각 항목마다 기술되어있다.
이처럼 소사전은 대사전에 비해서 개정하기가 쉬우므로 기술법의 진보는 오히려 소사전에 있어서 더 기대할 수 있다. 기본 어휘의 현대어로서의 용법에 관해서는 대사전보다 소사전이 더 기술이 상세하다. 최근에 한국어로 번역된 '例解新國語辭典'(三省堂書店)도 여러 가지 면에서 지금까지 볼 수 없었던 새로운 방법이나 체제를 보여 준 소사전 중의 한 實例이다.
6. 특수 사전
기본적인 모든 단어를 전면적으로 다루는 일반 국어사전과는 달리 특수 사전의 존재 역시 중요하다. 특수 사전에는 일부 단어만을 대상으로 한
등과 특정한 측면만을 기술한
등이 있다. 이들 하나하나에 대해서 설명할 여유는 없는데, 의미·용법에 중점을 둔 것으로 다음과 같은 사전도 있다.
보통 국어사전의 간단한 해설에서는 똑같은 의미가 되어 버리는 단어가 많이 있다. 그러나 엄밀한 의미에서의 同義語는 극히 드문 것이 사실이다. 이들 구별을 표시하기 위해서는 단순한 치환이 아니라, 상세한 설명이 필요하다. 이들 유의어 사전은 단어 수는 수천 개 정도이지만 이러한 요구에 부응한 것이다.
이것은 가장 기본적인 단어만을 대상으로 하여 한 단어당 몇 면씩이나 되는 자세한 기술을 한 것으로서 각 항목이 의미 기술의 논문이라고 해도 과언이 아닐 정도이다. 또, 類義語와의 구별에도 언급하고 있어 유의어 사전으로 사용할 수도 있다.
동사로 일괄할 수 있는 단어들 중에서도 자세히 보면 용법은 하나하나 다 다르다. 예를 들어서 어떤 동사에는 명령법이 없고, 의미적으로는 가까운 두 개 동사 사이에 격 지배의 차이가 있는 경우도 있다. 그리고 이러한 문법적 용법의 차이는 多義的인 동사의 경우 의미별로 고찰할 필요가 있게 된다. 이 사전은 국어사전에서는 간단하게 넘어가는 이런 용법들을 자세히 기술하고 있다.
형용사는 평가를 나타내는 일이 많은데, 이 사전은 형용사 하나하나에 대해서 플러스 이미지를 동반하는가, 아니면 마이너스 이미지를 동반하는가를 지적하였다는 데 그 특색이 있다. 예를 들어서 사람의 성격에 대해서도, 'ねばづよい'(끈기 있다)는 플러스 이미지를 가지지만, 'しつこい·ねちっこい'(치근치근하고 집요하다)는 마이너스 이미지를 가진다는 것과 같은 지적이다.
이상과 같은 특수 사전은 일반 국어사전에서는 다 기술하지 못하는 부분을 보충하기 위해서 만들어진 것인데 이들의 성과가 국어사전에 반영되어 간다는 형식으로 사전의 진보에 기여해 준다. 예를 들면 유의어와의 의미 차이를 표시한 국어사전이 있다.
이 사전은 '意圖'의 항목에서
意圖 | 意向 | |
相手の~を知る (상대방의 ~를 알다) | ○ | ○ |
敵の~をくじく (적의 ~를 꺽다) | ○ | - |
住民の~を汲む (주민들의 ~를 참작하다) | - | ○ |
~した所と食い違う (~한 바와 어긋나다) | ○ | - |
引退の~を表明する (은퇴의 ~를 표명하다) | - | ○ |
와 같은 표를 제시함으로써 간단하긴 하지만 '意向'과 어떻게 다른가를 표시하고 있다.
순수한 언어 연구와 사전 작성은 이상적으로는 서로 영향을 미쳐야 할 것이다. 그러나 언어학 이론이 직접적으로 사전의 내용에 반영되는 일은 드물다. 어떤 이론을 이용한 소형 특수 사전이 먼저 만들어진 다음 그것이 소형 국어사전에 적용되어 대형 사전에까지 영향을 미친다는 것이 더 보편적이다. 독일에서 발달된 '結合價'(Valenz) 이론은 그 실천으로서의 사전 작성을 동반하는데, '日本語基本動詞用法辭典'은 그 영향을 받은 것이라 할 수 있다. 미국의 원형 의미론 등 역시 앞으로 의미 기술에 있어서 중요한 역할을 다하게 되지 않을까 생각되는데 그 응용에서도 개정하기 쉬운 소형 사전에서 먼저 실험해 볼 필요가 있을 것이다.
7. 시소러스
특수 사전의 일종인 시소러스(意味 分類體 辭典, Thesaurus)에 대해서도 언급해 두고자 한다. 그것은 그것 자체로서의 의미보다는 사전의 올림말을 찾는 데 꼭 필요하기 때문이다. 일본어 시소러스로서는 國立國語硏究所의 '分類語彙表'와 '類語國語辭典'(角川書店)이 있다. (이 밖에 과학 기술 용어 관계에 대해서는 정보 검색의 필요성이 높기 때문에 독자적인 시소러스가 작성되고 있다.)
'分類語彙表'는
와 같이 단어들이 나열되어 있을 뿐인 데 비해 '類語國語辭典'은 각각 그 의미가 설명되어 있다. 이 점이 실용적으로 볼 때 큰 차이가 되겠는데 원리적으로 보아도 이 두 사전은 전혀 다른 분류 방식을 채용하고 있다. 가장 큰 차이점은 '分類語彙表'가 명사·동사·형용사 등을 대분류로 분류한 데 비해, '類語國語辭典'은 같은 의미 분야의 속하는 것이라면 가리지 않고 같은 번호로 통일하였다는 점이다. 예를 들어서 '分類語彙表'가 '바람'에 관한 동사인
등을 명사와는 전혀 다른 2.515란 항목에 수록한 데 비해 '類語國語辭典'은 이들 바람에 관한 명사·동사를 일괄하여 수록하였다.
가장 유명한 시소러스는 영어 시소러스인 로제이(Roget)의 시소러스인데 이것은 오래된 데다가 너무나도 논리주의적이어서 상식에서 동떨어져 있다. 그럼에도 불구하고 이것이 많이 사용되는 이유는 단어 수가 많고 색인이 완비되어 있기 때문이다. 이용자들은 로제이의 분류 체계와는 상관없이 색인을 이용해서 유의 표현을 찾는 것이다. 이것과 비교하면 일본어 시소러스는 훨씬 더 상식적인 분류이지만 색인 없이는 쓸 수 없다.
시소러스의 실용적 목적은 적절한 표현을 찾는 데 있다. 그리고 최근에는 컴퓨터에 의한 언어 정보 처리 면에서 시소러스의 필요성이 인식되기 시작했다. 어떤 정보를 검색할 때, 그 同義語 때로는 上位語, 下位語를 참조할 때 필요가 있기 때문이다.
시소러스는 사전 편찬에도 꼭 필요하다. 사전은 일반적으로 형식면에서 일정한 규칙에 따라 올림말을 배열한다. 그러나 의미·용법의 기술에 있어서 형식에 따라 분담·기술하는 것은 좋지 않다. 그래서 類義 단어를 모아서 기술하기 위해서 시소러스가 꼭 필요하게 되는 것이다. 예를 들어 많은 편자들이 분담해서 만들 경우 a로 시작하는 단어는 누구, b로 시작되는 단어는 누구라는 식으로 분담시키는 것은 매우 어리석은 방법이다. 身體 部位 名稱·移動 動作 感覺 形容詞처럼 의미 분야별로 분담을 정해야 되며 그렇게 하기 위해서 시소러스가 필요한 것이다.
8. 진행 중인 대사전의 계획
현재 있는 대사전으로서는 위에서 든 '日本國語大辭典'이 있는데 이것도 출판 이래 20년이 지났기 때문에 개정을 고려하고 있는 모양이다. 그 밖에 진행 중인 대규모 사전 편찬 사업이 적어도 두 가지가 있다.
8.1 國立國語硏究所
國立國語硏究所는 1948년에 창립되었다. 그 목적은 文部省 組織令에 의하면 "국어 및 국민의 언어생활에 관한 과학적 조사, 연구를 실시하며, 아울러 국어 합리화를 위한 확실한 기초를 구축하기 위한 사업을 행하는 기관으로 함."이라고 규정되고 있다. 창립의 직접적 계기는 2차 대전 이후의 언어 개혁이었다. 일본어, 특히 그 표기법이 복잡하고 비합리적이라는 사실은 이미 오래전부터 지적되었었고 戰前에도 몇 차례 개혁안이 만들어졌으나 그때마다 보수 세력의 방해 때문에 좌절되고 말았다. 그러다가 戰後 민주화의 물결을 타고 겨우 漢字 制限·가나 표기법 개정이 실현되었다. 그러나 그것이 전후 즉시 실시되었기 때문에 충분한 학문적 근거를 가진 것이었는지 의심스럽다는 비판도 있어 앞으로의 언어 정책의 기초를 공고히 하기 위하여 현대어의 과학적 연구가 필요하게 된 것이다. (從前의 국어학은 주로 옛날 일본어를 대상으로 하였으며, 현대어의 과학적 연구는 國立國語硏究所 창립에 의해 시작되었다고 할 수 있다.).
國立國語硏究所 組織令에 보면 연구소가 실시할 사업으로서 '現代語 辭典, 方語 辭典, 歷史的 國語 辭典 기타 연구 성과의 편집 및 간행'을 들었다. 그러나 지금까지 연구소가 간행한 사전은 '沖繩語辭典','基礎日本語活用辭典 인도네시아語版'이란 특수한 것뿐이며, 일반인들이 당연히 기대하게 되는 대사전에 관해서는 이를 위한 조사가 간신히 계속되고 있을 따름이다. 왜 이러한 상태에 있는가? 그것은 국립 기관에서 대사전을 만들 계획을 세울 때 참고로 고려해 둘 만한 사례가 될 것이다.
國語硏究所로서는 일단 20세기 전반의 용례를 풍부히 실은 대사전을 기획, 작업을 진행하고는 있다. 그러나 지금까지 출판된 것으로서는 國定讀本用語總索引(그것도 미완성)밖에 없다. 사전 편찬에는 먼저 풍부한 용례가 필요하다. 그리고 그것을 위해서는 믿을 만한 底本이 있어야 한다. 그러나 근대의 문장, 그것도 가장 표준화되어 있다고 생각되는 國定讀本과 같은 것에도 실은 여러 가지 판이 있어 어느 것을 골라야 할지 결정하기 힘들다. 이리하여 학문적으로 하려면 할수록 문제는 한없이 기초적 부문으로 되돌아가고 만다. 이대로 가다가는 國語硏究所는 수세기 후에야 기대에 부응할 만한 20세기 일본어 사전을 출판할 수 있게 될 것이다. Grimm의 사전은 100년 이상 만에 완성되었는데 그런 태도는 현대에 있어서도 존중해야 할 것인가?
어떻게 보면 이것은 돈 문제이기도 하다. 현재 國語硏究所 사전 부문 담당자는 겨우 3명밖에 안 된다. 게다가 이 인원은 전체 정원이 80명으로부터 70명으로 매년 한 명씩 감원되어 온 가운데서 딴 부문을 희생시키면서 우선적으로 확보한 인원이다. 일반적으로는 국립 연구소는 민간 출판사보다 예산이 넉넉해서 큰 사업을 하기 쉬우리라 생각하겠지만 사실은 정반대이다.
8.2 電子化辭書硏究所
여러 가지 의미에서 國立國語硏究所와 대조적인 것이 日本電子化辭書硏究所의 사업이다. 이 연구소는 基盤技術硏究推進센터와 민간의 관련 8개 회사의 공동 출자(자본금 143억 엔)에 의해 1986년에 창립된 것으로서, '컴퓨터의, 컴퓨터에 의한, 컴퓨터를 위한 사전'을 목표로 하고 있다. 창립된 지 얼마 안 되었는 데도 불구하고 앞으로 1년 정도 후에는 의미 해석을 가한, 단어 수가 20~30만 개 정도 되는 日英·英日 辭典을 발표할 예정인 것 같다. 기계가 언어 해석을 하는 데 이용하기 위한, 기계가 읽을 수 있는 사전이므로 그 내용이 인간을 위한 것과 전혀 다름은 말할 것도 없거니와, 그것보다도 다소 틀린 데가 있더라도 방대한 대규모 자료를 짧은 시간에 먼저 한번 모아 보자는 발상법이 문과계 연구자들의 눈에는 매우 신선하게 보인다. 지금까지 장인 정신으로 만들어져 왔다고도 할 수 있는 사전 만들기에 이런 연구 기관과의 교류는 앞으로 방법론적으로 좋은 자극을 줄 것으로 예상된다.
이상 두 가지 사업을 통해서도 대규모 사전을 만든다는 것이 여간 어려운 일이 아님을 알 수 있다. 풍부한 문헌을 가진 언어의 대규모 사전을 만들려면 적어도 100명의 전담자와 그에 부응한 예산이 필요할 것이다. 그렇게 하지 않으면 충분한 성과를 거둘 수 없게 된다. 정부가 自國의 언어와 대사전에 그만큼의 가치를 인정한다면 그러한 규모의 사전 편찬 기관을 만들 수 있는 것이다.
그러나 정부의 책임은 고사하고 연구자들이 비록 소규모이지만 대사전을 위해서 할 수 있는 일은 있다. 일차적으로는 사전론의 구축이 그것이다. 올림말의 선정, 의미 기술의 견본 제작, 시소러스에 의한 의미 분야 설정, 기본 자료 수집 등 생각이 나는 대로 열거해도 많은 과제들이 있는데 이들이 이에 포함된다. 과거의, 혹은 외국의 경험에서 배우면서 어떤 순서로 전체 작업을 진행해 나갈 것인가 하는 시스템 연구도 필요할 것이다.(이것은 개인적 연구가 중심이었던 문과계 연구자들이 다루기 어려워하는 테마이다.) 나아가서 채산이 맞지 않아도 실험적 소사전의 제작·일반 사전 편집자를 위한 자료 제공 등도 대규모 사전 제작 이전에 할 수 있는 일이다. 비록 대사전의 궁극적 이상이 OED형 역사 사전에 있을지라도 우선 필요한 방법론 탐구는 현대어 위주로 해야 한다는 점, 그리고 지금까지와 같이 자국어 연구자만이 종사해서는 안 되며 외국어 학자, 공학자들의 교류가 필요하지는 점을 지적해 두고자 한다.
9. 전자계산기와 사전
앞으로의 사전 편찬은 전자계산기의 이용 없이 생각할 수 없다. 일반 사회에서도 'computer Literacy'라는 표현이 쓰일 정도인데, 이는 즉 문자를 읽고 쓸 수 있는 능력과 더불어, 컴퓨터를 사용할 수 있는 능력이 사회의 모든 분야에서 요구되고 있다는 것이다. 앞으로의 연구자는 어떤 분야이든 간에 컴퓨터에 대한 지식은 필수적이다. '계산기'라는 이름에 현혹당해서는 안 된다. 언어연구자에 있어서 컴퓨터는 통계 처리와 같은 계산 처리에 이용할 수 있는 것이라기보다는 정보 처리와 검색의 도구로서 유용한 것이다. 일본어 연구의 분야에서도 예를 들어 수년 전에 國語學會와 國立國語硏究所가 공동 편집한 '日本語硏究文獻目錄'에는 약 8만 건의 문헌명이 수록되어 있어 논문 표제에 사용된 字句, 필자명 등으로 특정 테마·필자에 관련된 논문을 순식간에 알 수 있다. 이것을 이용하는가 안 하는가에 의해서 연구의 질이 결정된다. 또, 수만 개나는 되는 단어를 알파벳순으로 배열시키는 작업도 컴퓨터를 이용하면 몇 분만에 할 수 있다. 이전에는 대형 컴퓨터를 이용하지 않으면 할 수 없었던 이러한 일들을 지금은 퍼스컴으로 충분히 할 수 있게 되었다.
특히 대규모·정확·통일적 등등의 성격이 필요한 사전 편찬에 있어서 컴퓨터 이용은 필수적이다. 먼저 용례를 수집하는 데 컴퓨터를 이용할 수 있다. 본문이 컴퓨터에 입력되어 있으면 어떤 단어의 용례를 문맥과 함께 찍어 내는 일은 매우 간단하다. 이미 고성능 자동 판독기(OCR)의 수준은 漢字·가나 혼효문인 경우에도 그 정확도가 99% 이상이다. 앞으로 성능이 더 향상되면 인간의 눈으로 문장을 읽고 눈에 띄는 용례를 찾아내어 이를 카드에 베끼는 작업은 대폭 감소될 수 있다. 이제부터는 책의 출판 역시 컴퓨터에 의한 출판이 많아질 것으로 예상되어 그것을 이용할 수만 있다면 일부러 OCR로 다시 입력할 필요는 없게 된다. 예를 들어서 문학 전집의 데이터를 그대로 이용할 수 있다면 용례를 찾기 위한 노력은 아예 없어지고 만다. 그러나 이는 기술상의 문제보다는 판권 문제가 있어 쉽게 실현되지 않고 있다.
용례 수집만이 아니라, 편집 과정에서도 컴퓨터는 활약한다. 표기·표현의 통일과 같은 일은 컴퓨터가 가장 좋아하는 일이다. 'ビルマ'(버마)가 'ミヤソマ一'(미얀마)가 되거나 어떤 단어의 철자법이 변경되거나 했을 때 이를 수정하기가 매우 쉬운 데다가 복수 필자가 쓴 원고의 스타일을 통일하는데 쓸 수 도 있다. 또, 카드형 원고가 아니라도 추가·삭제가 간단하다.
더 본질적인 기술법의 측면에서도 컴퓨터는 중요하다. 인간을 상태로 한 사전이라면 어느 정도 엄밀성이 부족한 기술일지라도 읽는 사람이 유추, 해석할 수 있다. 그러나 컴퓨터에는 그러한 융통성이 전혀 없기 때문에 엄밀하게 기술하지 않으면 통하지 않는다. 그리고 그 결과가 타당한가의 여부를, 예를 들어 기계 번역이 제대로 되는가를 봄으로써 검증할 수 있다. 인간을 상대로 한 사전에서는 컴퓨터의 그것과 다른 기술을 하게 되는 것은 당연하지만 지금까지 간과되어 온 결함이 컴퓨터를 상대로 한 사전을 만드는 과정에서 발견될 가능성이 있다. (융통성이 없다는 점에서는 외국인과 유사한 점이 있다. 현대 일본어의 기술은 외국민들에게 가르칠 필요성이 증대됨에 따라 비약적으로 진보하였다.).
나아가서 장래의 모습을 그려 본다면 종이에다 인쇄한 책 형태의 사전이 아니라, 컴퓨터에 들어 있는 것이 사전의 理想像이라 할 수 있다. 사전은 당연히 그 규모가 클수록 정보가 풍부해지는데, 방대한 규모의 사전을 각자가 집에서 소유하는 것은 큰 부담이 된다. 몇 십 권짜리 사전을 가지고 있어도 어느 시점에서 필요한 것은 그중 한 항목에 불과하다. 중앙에 있는 데이터를 필요에 따라 얼마든지 찾아낼 수 있다면 그 찾아낸 정보를 읽을 수 있을 만한 자그마한 화면이 있으면 된다. 지금 우리가 사용하는 탁상 계산기 정도의 기계로 몇 십 권짜리 대사전의 역할을 있는 것이다.
유리한 점은 지면만이 아니다. 이것은 국어사전보다 백과사전에 대해서 할 수 있는 말이 되겠는데 중앙에 있는 데이터가 매일 갱신된다면 이용자는 항상 최신 개정판을 소유하게 되는 셈이다. 책 형태로는 모형 사전의 경우에도 1년에 몇 번씩 개정하기 힘들지만 컴퓨터라면 전혀 문제가 없다. 21세기에는 사전 형태는 그러한 방향으로 나가지 않을까 생각된다. <번역 이토 히데토>