국어 정보화

옛 글자의 배열 순서와 북한의 자모 배열 순서

이승재(李承宰, 국립국어연구원)

얼마 전 한글과 컴퓨터사가 미국의 마이크로소프트사로부터 지원을 받는 대가로 우리들이 많이 사용하는 ‘글’ 워드프로세서 개발을 중단한다고 하여 문제가 된 적이 있었다. 문제는 ‘글’이 구현하고 있는 기능을 대체할 만한 프로그램이 없다는 것이었는데 그 중에서도 특히 옛글자나 확장 한자를 지원하는 한글 코드를 다른 프로그램에서 지원할 수 없다는 것이 문제의 상당 부분을 차지했다. 우리말을 보다 완벽하게 컴퓨터에서 표현하기 위해서는 옛 글자도 한글 코드에 반영되어야 하기 때문에 이러한 문제가 생긴 것인데 특히 국학 연구나 국어 연구에 쓰이는 모든 글자를 표현하기 위해서는 컴퓨터에서 옛 글자를 입력할 수 있어야 한다.


옛 글자의 자모 배열 순서는 별도로 정해야

옛 글자를 컴퓨터의 한글 코드에 반영하기 위해서는 우선 옛 글자의 자모에 대한 배열 순서를 결정해야 한다. 현대에 쓰이고 있는 우리말에는 한글 맞춤법 규정이 있어 현대 한글 자모의 배열 순서는 비교적 쉽게 결정할 수 있다. 그러나 옛글의 경우 예전에 자모 배열 순서를 정할 만한 기준이 되는 맞춤법이 없었기 때문에 우리는 별도의 기준을 세워 옛 글자의 자모 배열 순서를 정해야 한다.
   현재 윈도 95나 윈도 98과 같은 운영 체계를 많이 사용하고 있는 우리들은 이들 프로그램을 사용하면서 가끔 유니코드라는 말을 듣게 된다. 유니코드는 전 세계의 문자를 표현하고자 만들어진 컴퓨터 문자 코드 체계이다. 유니코드 안에는 각국의 영역이 나누어져 있어 그 안에 각국의 문자를 배열하게 되어 있다. 우리나라도 여기에 한글 코드의 표준안을 제출한 바 있다. 이 코드 안에는 완성형 한글과 조합형 한글, 그리고 옛 글자가 모두 들어 있다.
   옛 글자의 자모 배열 기준을 세우기 위해서 우리는 우선 옛 글자를 모양(자형) 중심으로 배열할 것인지 소리(음가) 중심으로 배열할 것인지를 결정해야 한다.


옛 글자는 자형 중심으로 배열하는 것이 바람직

그런데 옛 글자는 일반적으로 정확한 음을 알 수가 없다. 예를 들어 ‘딸’을 나타내는 ‘’이라는 단어의 경우 이 단어의 음을 정확하게 결정할 수가 없다. 아무도 ‘ㅳ’의 정확한 음을 알고 있지 못하기 때문이다. 그래서 옛 글자의 배열 순서를 정하기 위해서는 불명확한 글자의 소리(음가)보다는 더 확실한 글자의 모양(자형)을 중심으로 배열의 기준을 마련해야 한다.
   그래서 유니코드에서는 옛 글자의 모양 순서대로 문자를 배열하여 ‘ㅸ’과 같은 순경음은 ‘ㅂ’ 항목의 끝에, 반치음 ‘ㅿ’은 순경음과 같이 취급하여 ‘ㅅ’ 항목의 끝에 배열하였고 ‘ㆆ’은 ‘ㅎ’ 항목의 끝에 배열하였다. 그리하여 글자 배열 순서는 ‘…, ㅳ, ㅄ, ㅴ, ㅵ, , , , ㅶ, , ㅷ, , ㅸ, ㅹ, ㅺ, ㅻ, ㅼ, ,  , ㅽ, …’과 같은 순서로 정하였다.


북한의 가나다순은 남한과 달라

그런데 현재 쓰이고 있는 우리말이긴 하지만 우리와 다른 맞춤법 규정을 사용하고 있는 북한어에서 쓰이고 있는 한글 자모의 배열 순서는 어떻게 되어 있을까? 남북한의 문화 교류나 학술 교류를 생각한다면 서로간의 자료 교환을 위한 한글 코드를 마련하기 위하여 한번쯤 생각해 보아야 할 일이다.
   1992년 북한에서 나온 국어사전인 『조선말대사전』에서 ‘ㅇ’으로 시작하는 단어를 찾다 보면 우리는 우리 사전과 다른 점을 발견하게 된다. 예컨대 ‘오리’라는 단어를 찾으면 자음 항목에 이 단어가 없는 것이다. 그 대신 이 단어는 자음 뒤에 나와 있는 모음 항목 중에서 ‘ㅕ’ 다음의 ‘ㅗ’ 항목에 나와 있다. 이것은 북한에서 사용하고 있는 언어 규범이 우리와 다르기 때문이다. 북한은 다음과 같이 「조선말 규범집」(1988)에 나와 있는 맞춤법에 따라 자모의 배열 순서를 정하고 있다.

자음(19자): ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅅ ㅈ (ㅇ) ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ ㄲ ㄸ ㅃ ㅆ ㅉ
모음(21자): ㅏ ㅑ ㅓ ㅕ ㅗ ㅛ ㅜ ㅠ ㅡ ㅣ ㅐ ㅒ ㅔ ㅖ ㅚ ㅟ ㅢ ㅘ ㅝ ㅙ ㅞ
받침(27자): ㄱ ㄳ ㄴ ㄵ ㄶ ㄷ ㄹ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅁ ㅂ ㅄ ㅅ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ ㄲ ㅆ

이에 따르면 북한에서 정해 놓은 자모의 숫자와 기본 글자의 배열 순서는 남한과 같다. 하지만 초성 ‘ㅇ’의 경우만은 예외적으로 이를 자음으로 인정하지 않고 모음 항목을 따로 만들어 ‘ㅏ’∼‘ㅞ’에 포함시키고 있다. 그러나 받침으로 쓰이는 ‘ㅇ’의 경우는 남한과 마찬가지로 ‘ㅅ’ 다음의 순서를 유지하고 있다. 그리고 ‘ㄱ, ㄷ’ 등의 홑자음자와 ‘ㄲ, ㄸ’ 등의 겹자음자의 경우 북한은 모든 홑자음자를 배열하고 난 후에 겹자음자를 따로 배열하여, 홑자음자와 겹자음자를 ‘ㄱ, ㄲ, …, ㄷ, ㄸ’과 같이 통합 배열하고 있는 남한과 방식을 달리하고 있다.
   ㄳ, ㄵ, ㄲ’과 같은 겹자음자의 경우 북한은 합용병서(서로 다른 두 자음의 결합) 뒤에 각자병서(서로 같은 두 자음의 결합)를 배열하지만 남한은 이를 자형 중심으로 ‘ㄲ, ㄳ, ㄵ’과 같은 순서로 통합 배열한다. 겹모음자의 경우도 북한은 ‘ㅏ, ㅑ, ㅓ’ 등과 같은 홑모음자 뒤에 ‘ㅐ, ㅒ, ㅔ’와 같은 겹모음자를 배열하고 있으나 남한은 홑모음자와 겹모음자를 자형 중심으로 통합 배열하고 있다.


한글 코드를 남북한이 같이 쓰기는 어려워

이러한 자모 배열 순서는 컴퓨터에서 쓰이는 한글 코드에도 그대로 반영되므로 남한과 북한에서 쓰이는 한글 코드의 자모 배열 순서는 서로 다를 수밖에 없다. 결국 남북한이 현재의 자모 배열 순서를 가지고 있는 한 서로 같은 한글 코드를 쓰기는 어려운 것이다. 서로 다른 한글 코드를 쓴다는 것은 각자가 보유하고 있는 자료를 서로 교환하기가 어렵다는 것을 의미한다. 따라서 원만한 자료 교환을 위해서는 남북한의 자모 배열 순서가 먼저 통일되어 그것을 바탕으로 한 남북한 공통의 한글 코드가 만들어져야 한다. 그렇기 때문에 남북한의 통일된 한글 코드를 만들어 보려는 노력이 필요한 것이다.