국어 정보화

두음법칙과 한자의 정렬 방식

이승재(李承宰) / 국립국어연구원

흔히 우리말을 알타이 어족에 속하는 언어로 분류한다. 알타이 어족의 공통적인 특징 가운데 하나는 단어 첫머리에서 ‘ㄹ’ 등과 같은 유음이나 여러 개의 자음이 한꺼번에 발음되는 것을 꺼린다는 것이다. 우리말에서도 ‘녀, 뇨, 뉴, 니’에서 구개음으로 쓰인 ‘ㄴ’이나 ‘ㄹ’과 같은 유음이 특정 환경에서 ‘ㅇ, ㄴ’ 등으로 바뀌는데 이를 두음법칙이라고 한다.

같은 한자도 두음법칙에 따라 발음이 달라지는 경우가 있어

우리말의 두음법칙은 ‘녀(女)’가 어두에 쓰이면 ‘여자(女子)’에서와 같이 ‘여’로 읽히지만 그렇지 않은 경우에는 ‘남녀(男女)’에서와 같이 ‘녀’로 읽히는 현상을 빚어낸다. 이처럼 우리말은 같은 한자가 여러 음을 갖는 경우도 있지만 위와 같이 위치에 따라 음이 달라지는 경우도 있다. 컴퓨터로 ‘女’를 입력했다면 이 글자가 단어 첫머리에서는 ‘녀’로 발음되어 ‘ㄴ’ 항목의 순서에 들어가야 하고 그렇지 않은 경우라면 ‘여’로 발음되어 ‘ㅇ’ 항목의 순서에 들어가야 하는 것이다.

 

정순 순방향 코드순 정렬

정순 순방향 발음순 정렬

무리

무리

이성

無理

女子

修女

理性

女子

無理

이성

修女

理性

 

위의 예에서 단어 첫머리에 쓰인 ‘女’와 ‘理’가 각각 ‘녀’와 ‘리’에서 변환된 글자일 경우 코드순 정렬을 하면 왼쪽 예와 같이 된다. 하지만 발음순으로 정렬을 하면 오른쪽과 같이 두음법칙에 따라 배열 순서가 정해진다. 같은 ‘女’자나 ‘理’자라 하더라도 그 글자가 나타나는 위치에 따라서 발음이 결정되고 그 발음에 따라서 정렬 순서가 결정된다.

 

두음법칙의 현상과 여러 음을 내는 현상은 처리 방식이 같아

그래서 컴퓨터에서 한자가 위치에 따라 소리가 달리 나는 현상을 반영하여 올바른 정렬 순서를 만들기 위해서는 한 글자가 여러 음을 갖는 경우와 같이 음마다 글자를 배열해 주면 된다. 즉 ‘녀’로 입력한 ‘女’는 ‘ㄴ’ 항목에, ‘여’로 입력한 ‘女’는 ‘ㅇ’ 항목에 배열해 주면 된다. 그런데 만일 위의 ‘女子’를 입력할 때 ‘녀자’라고 입력한 후 한자로 변환하면 어떻게 될까?

‘글’에서 ‘녀자’를 ‘女子’로 한자 변환을 한 후 이를 ‘修女’와 다른 줄에 놓고 코드순 정렬을 하면 ‘修女’가 ‘女子’보다 앞에 오게 된다. 그런데 ‘女子’의 ‘女’에 쓰인 코드값을 찾아보면 ‘修女’의 ‘修’보다 앞쪽이다. 즉 코드값으로 보면 ‘女子’가 ‘修女’보다 앞에 와야 하는 것이다. 그런데 실제 정렬 결과는 이와는 반대이다. 이것은 어찌된 일인가?‘女子’를 만들기 위해 ‘녀자’로 입력하여 변환하면 컴퓨터는 ‘女子’를 ‘녀자’ 발음을 가진 단어로 인식하게 되어 정렬 결과가 잘못 나올 수 있다. 이러한 현상을 방지하기 위하여 컴퓨터 프로그램에서는 비록 ‘녀자’와 같이 잘못 입력된 음이라 하더라도 이를 올바로 잡아 준다. 즉 그 글자가 한 단어 안에 쓰였을 때에는 그 단어를 사전에서 찾아보아 맞는 어형을 찾아낸 후 그것을 가지고 정렬을 하는 것이다. 그래서 ‘녀자’로 ‘女子’를 입력했다 하더라도 올바른 정렬 순서를 찾게 되는 것이다.