외국인을 위한 한국어사전과 말뭉치
강현화
경희대학교 한국어학과
Hyoun-Hwa Kang. Kyung Hee University. Korean dictionary for foreigners & corpus. Journal of The Applied Linguistics Association of Korea Vol. 16. No1, 2000
This paper1) discusses the necessity of Korean dictionary for foreigners and specifies some descriptive methods in Korean dictionary and their usefulness. First of all, this study points out the pitfalls of the current Korean dictionary and proposes publication of a new Korean dictionary for foreigners that can be distinguished from Korean dictionary for Koreans. For this purpose, this study carries out a thorough investigation into validity of Korean dictionary based upon the corpus. Second, this study analyses the grammatical information essential to a Korean dictionary for foreigners and attempts to differentiate from the currently available Korean dictionaries in terms of grammatical description based upon corpus. In this regard, a new dictionary covers useful information such as pronunciation, lexical unit, the case frames of predicates, idiomatic expression! and spoken language and delivers a practical advantage for users. Lastly, this paper suggests how a new form of Korean dictionary can help with Korean language learners in their personal learning and study supplementary to their classes. Furthermore, this paper discusses the importance of error analysis in learner’s corpus.
Ⅰ. 도입
최근 우리 나라의 국제적 위상 제고와 국력 신장에 힘입어 국제적 교류가 매우 활발해지고 있다. 이에 따라 한국 문화 및 한국어의 국제적 위상 또한 높아지고 있다. 이제 한국어는 우리 사회 내부의 의사 소통의 수단일 뿐만 아니라 정치, 경제, 문화 등의 분야를 망라한 국제적 의사 소통 및 정보 교환 수단으로서의 역할을 담당해 나가는 언어가 되었으며, 해외 각국에서의 한국어 학습 수요가 지속적으로 증가하고 있다. 그러므로 이렇게 늘어가는 한국어 학습자들을 위한 새로운 개념의 사전의 편찬은 필수적인 일이 되었다. 하지만 정작 한국어를 습득하는 외국인들을 위한 사전은 현재 전무한 실정이다. 그나마 몇 개의 외국인들을 위한 사전들은 주로 이중언어 사전이다.2) 영어나 일어의 예를 보면 외국어로서의 영어, 일어를 습득하는 사람들만을 위한 사전들이 여러 종류가 나와 있는데, 한국어의 기초적인 어휘만을 수록하고, 쉬운 의미풀이와 용례를 수록한 사전은 국내에 아직 없는 실정이다. 그렇기 때문에 한국어를 공부하는 외국인들은 성인용 국어 사전을 볼 수밖에 없는데, 이에는 중대한 몇 가지 문제가 있다.
첫째, 대상의 측면이다. 기존에 출판된 국어 사전은 주로 한국어 모국어 화자를 주 대상으로 하여 기획, 출판되었기 때문에 외국인들을 위한 한국어 교육을 위한 요소들을 반영하지 못했다고 하겠다.
둘째, 표제어 선정 방식의 측면인데, 기존의 사전은 실생활에서 거의 안 쓰이는 단어가 태반이다. 표제어는 기초 조사를 통하여 실제 상황에서 자주 쓰이는 고빈도 어휘와 교육에 필수적인 어휘가 선정되어야 할 것이다.
셋째는 의미풀이의 측면으로 기존 국어 사전의 의미풀이는 더 어려운 말로 부연하거나, 서로 단어를 바꿔서 설명하는 순환론의 오류를 범하고 있다. 기초 어휘를 바탕으로 뜻풀이를 기술하는 메타언어의 어휘를 제한해야 한다. 또한 실제 용례를 통한 의미의 제시가 이루어지지 못했다.
넷째는 용법 설명의 측면이다. 기존 사전이 표제어를 부풀리는 데만 치중하여, 실제로 의미와 용법을 파악하는 데 반드시 필요한 적절한 용례를 제시하지 못한 것이 사실이다.
다섯째는 응용의 측면인데, 작문에 꼭 필요한 문형 제시가 없고 연어(collocation) 정보를 충분히 제시하지 못함으로 해서, 작문을 할 때 적절한 어휘와 문형을 선택하여 쓰기 어려웠다
여섯째는 구어의 중요성으로, 언어 교육이 의사소통 능력의 성취를 목적으로 이행하는 현 시점에서 글말 못지 않게 입말의 중요성이 강조된다. 따라서 입말 어휘의 설명과 자료 제시가 필수적이다.
이 글에서는 이러한 문제점을 바탕으로 외국인을 위한 한국어사전이 갖추어야 할 요소들을 짚어보고자 한다. 사전에서 고려해야 할 요소들은 위에서 열거한 것처럼 여러 가지가 있으나 본 논문에서는 문법 정보에 초점을 맞추어 살펴보고자 한다.
Ⅱ. 말뭉치 연구와 한국어 사전
1. 말뭉치와 한국어 교육
1) 말뭉치3) 연구와 한국어 연구
말뭉치 연구가 가지는 효용은 이미 여러 논문들을 통해 알려지고 있다. 말뭉치의 효용성은 언어 연구면, 언어 교육면 등에서도 찾아볼 수 있겠으나, 여기서는 사전 편찬에 있어서의 효용성을 생각해 보기로 하겠다. 우선 말뭉치는 언어 전체의 문법을 수량화하는 일이 가능하기 때문에 문법 이론의 가설들을 검증하는 경험적 데이터를 제공할 수 있다. 과거의 문법이 개인의 직관에 의존해서 기술되는 한계를 가지고 있는 경우가 많았으나 말뭉치의 등장은 이러한 한계를 넘어서 공통된 직관에 근거해 이론을 도출하는 것을 가능하게 한다. 따라서 말뭉치는 언어학의 학습에도 곧바로 이용될 수 있어서 Kirk(1994)에 따르면 Queen’s University of Belfast에서는 학생들에게 직접 말뭉치를 바탕으로 한 문법 교육을 실시하고 있다고 한다.4) 말뭉치의 언어 교수를 위한 효용성을 살핀다면, 우선 외국인 학습자를 위한 문법의 구축에 활용될 수 있는 점을 들 수 있다. Mindt(1997)는 우선 한 언어의 말뭉치를 바탕으로 교수용 문법이 구축되고 다음 단계로 교육용 문법이 구축될 수 있음을 밝히고 있다. 이는 자료를 통한 언어 교육의 필요성을 강조한 것이라 하겠다. 둘째, 어휘의 빈도와 문법에 관한 정보를 제공할 수 있다는 점과 셋째, 실제 생활에서 사용되는 언어의 예를 풍부히 제공할 수 있다는 점, 넷째로 컴퓨터를 기반으로 한 말뭉치가 제공하는 교육용 패키지들의 활용을 가능하게 한다는 점 등을 들 수 있을 것이다. 기존의 교재에 있어서의 문법 설명은 하나의 예문만을 제시하며 기술하므로, 실제 학습자가 길고 복잡한 실제 예문을 분석할 수 없는 문제점이 있었으나 말뭉치의 활용으로 예문을 통한 용법들을 익힐 수 있으며, 교재상의 언어와 실제 언어 사용의 차이를 밝혀줌으로 해서 학습자의 의사소통 능력의 향상에 도움을 줄 수 있다. 또한 말뭉치는 자료의 출처별로 따로 구축하여 활용할 수 있으므로 특정 분야나 특수 목적의 교육에 활용할 수 있다는 장점도 있다. 더불어 다중언어 병행 코퍼스를 통해 번역 교육에 이용될 수 있는데 다중 코퍼스의 이점은 두 개 언어의 문체와 관용어의 예를 나란히 제공하여 학생들이 자신의 번역문과 전문적인 번역문 혹은 원문과 비교할 수 있게 하는 역할을 함으로써 번역에 대한 연습을 가능하게 한다. 또한 학습자 말뭉치(Learner’s Corpus)는 학습자의 오류 분석을 통해 오류를 파악하고 수정하는 데에 도움을 줄 수 있을 것이다.
2) 한국어교육용 말뭉치의 구축
그렇다면 한국어사전을 위한 말뭉치는 어떻게 구성되어야 할까? 올바른 사전을 위해서는 우선 한국어 교육용 말뭉치의 구축이 가장 선행되어야 할 작업이다. 한국어 교육용 말뭉치는 국어 교육용 말뭉치와도 구별되어야 한다. 즉, 모국어 교육에서는 정확한 국어문장을 풍부하고 다양하게 사용하는 능력을 배양하는 데에 주안점이 놓이지만 외국인 학습자를 대상으로 하는 한국어 교육에서는 기본적인 의사소통의 문제부터 다루어져야 하기 때문에 교육용 말뭉치의 구성에 있어서도 이러한 차이를 고려하여 기본적이고 보편적인 한국어 사용 양상을 추출할 수 있는 텍스트와 자료들이 중심이 되어야 할 것이다. 말뭉치란 연구 대상 언어의 총체적인 모습을 보여 줄 수 있는 자료의 조합체를 의미하므로 한국어 교육용 말뭉치란 한국어를 교육하는 모든 장면에 사용되는 언어 자료의 집합체를 의미한다. 즉, 기초적이고 보편적인 한국어 사용 양상을 추출할 수 있는 말뭉치와 교육 환경에서 사용되는 교과서, 보조 교재, 교안, 시청각 자료 등에 쓰인 언어 자료에 대한 말뭉치, 그리고 외국인 학습자의 언어 행동의 말뭉치5)가 모두 포함되어야 한다.6) 예를 들면 ‘숙제’나 ‘자기 소개’, ‘예습’, ‘복습’ 등과 같은 말들은 일반 말뭉치에서는 낮은 빈도로 출현하지만 한국어 학습 현장에서는 아주 자주 쓰이는 어휘가 될 수 있다.
또 다른 교육용 말뭉치로 학습자 말뭉치를 구축해야 한다. 1990년대 초반에 들어 EFL전문가들이 컴퓨터 학습자 코퍼스의 이론적이고 실제적인 중요성을 인식하기 시작했다. 학습자 말뭉치는 언어 습득 과정 중 학습자의 여러 유형의 오류들의7) 분석과, 언어습득 과정의 원리를 학습자의 수행 데이타를 통해서 분석할 수 있게 한다는 점에서 의미를 가진다. 학습자 말뭉치의 대표적인 예로는 LLC(Longman Learner’s Corpus)(1987)와 이를 바탕으로 천만 단어를 다룬 Longman Essential Activator(1997)를 들 수 있는데, 이러한 학습자 말뭉치는 많이 사용하는 연어에 대한 모국어 화자와 학습자 패턴을 비교하는 데에도 도움을 줄 수 있다. Sinclair(1991)도 학습자 코퍼스가 다양한 학습자의 유형과 교육 상황에 따라 알맞게 구축되어야 한다고 주장하면서, 우선 언어 면에서는 매체(구어체, 문어체), 쟝르(논설, 설명, 즉흥 대화, 인터뷰…) 주제(어휘 선택), 기능(어휘, 문법, 수동의 빈도, 명사구의 합성성…) 등의 변수가 있으며, 학습자의 측면에서는 학습자의 나이, 성별, 모국어, 지역, 다른 외국어 학습여부, 등급, 학습 맥락(제2언어냐, 외국어냐), 실제 경험(교육 기간, 해당 언어에의 노출 정도..) 등에 따라 말뭉치를 구분하여 교육의 목적과 연관지을 수 있다고 밝혔다. 따라서 한국어사전에 틀리기 쉬운 어휘나 문법 정보를 제공하기 위해서는 오류말뭉치의 구축도 필수적이라 하겠다.
3) 교재의 구축, 교실에서의 자료, 문화의 교육에서의 효용성
Graeme(1998)에 의하면 언어 교육은 구어체를 통한 상호 행동을 기반으로 한 언어 학습과 문어체를 통한 지식 및 문화의 경험이 동시에 이루어져야 한다고 한다. 즉, 구어의 말뭉치와 문어의 말뭉치 둘다가 언어 교육에 있어 필수적임을 시사하는 것이다.8) 실제로 학습자들은 기존의 문법 위주의 언어 교육에 대한 불만족하게 느끼며 실제 생활에서의 담화의 중요성을 느끼고 있다. 따라서 사용 빈도와 신뢰할 수 있는 정확한 용례를 바탕으로 한 교재를 작성함으로써 실제 언어 사용과 교수되고 있는 언어간의 괴리를 해결할 수 있다. 즉, 교육 과정 디자인, 교재 저술 등에 말뭉치를 활용할 수 있는 것이다. 예를 들어 급별 교재에 쓰일 어휘를 말뭉치의 빈도를 바탕으로 하여 말뭉치에 입력된 기존 교재간의 중복도를 고려하여 초급부터 한정할 수 있을 것이다. 아울러 교실에서의 수업에서도 말뭉치 자료를 활용할 수 있는데, 말뭉치를 직접 교육의 자료로 삼아 작문 교육이나 용법의 설명 등에 활용하거나, 수업 자료 개발, 언어 testing 등에도 활용할 수 있다.
4) 말뭉치를 담은 컴퓨터를 통한 교육
최근 컴퓨터의 이용이 보편화되고 있는 추세에 맞추어 언어교육도 컴퓨터를 이용한 교육이 시급하다. 그러나 아직까지의 한국어 교육은 교과서나 보조 교재의 활용에 있어 프린트물에 익숙한 것이 현실이다. 앞으로의 교육은 CALL(Computer-assisted language learning)과 말뭉치 언어학(Corpus Linguistics)과의 연계가 필수적이라 하겠다. Leech(1997: 12)는 말뭉치를 담은 컴퓨터를 통한 교육의 이점으로 학생들이 더 높은 정확도를 얻을 수 있는 점, 많은 데이터를 바탕으로 더 많은 통해 분석의 양을 취할 수 있는 점, 학생간의 변이를 최소화할 수 있는 점 등을 들고 있는데, 이외에도 컴퓨터 사용의 이점으로 자동 찾기, 분류하기, 점수 매기기, 학습자 중심의 교육 증진(장소 시간의 제약이 없이 학습자의 요구와 동기에 따라 시행할 수 있다는 점에서), 언어 자료의 무한한 공급, 학습자의 요구와 바람에 따라 학습 과정을 조절할 수 있다는 점 등을 들 수 있다. 아울러 학습자의 모국어의 지원을 통한 학습 가능성, 심리적인 부담의 최소화(교사와는 달리 학생들이 자신의 문법적 지식의 부족에 대해 평가받는다고 느껴지지 않는다는 장점이 있다), 반복적인 학습, 자기 진단 테스트를 가능하게 한다. 나아가 빈칸 채우기나 컴퓨터 게임을 통한 문제 풀이 작업 등을 통한 학습자의 흥미 유발, 전문적인 지식을 얻는 텍스트의 탐색 등도 고려할 수 있는 장점이다. 즉, 컴퓨터와 말뭉치가 결합된 언어 교육은 컴퓨터에 익숙한 젊은 학습자들로 하여금 말뭉치에 접속해서 self-taught DDL(data-driven learning)을 가능하게 할 것이다.
2. 말뭉치와 사전
날자료의 말뭉치를 정리하여 이를 분석하고 연구하여, 그 안에서 추출된 문법과 화용적인 지식을 정리한 것, 즉 학습자로 하여금 말뭉치의 이용을 세련되게, 간접적으로 응용한 것이 사전이라 하겠다. Gillard(1998)에 따르면 최근 언어 교육에 있어서 사전에서의 말뭉치의 중요성은 날로 강조된다고 한다. 말뭉치를 기반으로 한 사전이 이는 학습자의 능력별에 등급과 목적에 따른 어휘 크기를 분석할 수 있기 때문이다. 최초의 교육용사전은 Michael West’s(1935)의 「The New Method English Dictionary」를 들 수 있으며, 「Longman Dictionary of Contemporary English 」(1979)를 시작으로 말뭉치를 기반으로 한 사전이 본격화되었다. 1987년에 발간된 「Collins Cobuild English Language Dictionary」는 최초의 컴퓨터 말뭉치 사전이라고 할 수 있다. 말뭉치를 기반으로 한 사전의 시작은 전적으로 교육적인 목적에서 출발한 것은 아니었을지라도 말뭉치가 교육용 사전에 기여한 점은 분명하다. 이후 발간된 사전은 「Oxford Advanced Learner’s Dictionary of Current English」(1989, Hornby, 4th edn)와 「Longman Dictionary of Contemporary English」(1995, edn, 3rd)들을 들 수 있는데, 이들은 최신의 말뭉치의 리스트를 제공함으로써 실제적인 인용의 예들을 제공할 수 있으며, 이를 기반으로 유능한 사전편찬팀에 의해 말뭉치에 입각한 어휘, 문법, 화용적 요소들이 분석?정리되었다. 사전은 우선 인쇄된 사전만을 생각하기 쉽지만 우리는 컴퓨터를 기반으로 한 말뭉치와 언어학적 분석의 연계가 새로운 사전으로 확장됨을 깨달아야 한다.
말뭉치를 기반으로 하는 사전의 효용성 중의 대표적인 것의 하나가 빈도 조사에 의한 자료의 제시라고 할 수 있을 것이다. 말뭉치 언어학자들이 강조하는 빈도에 대해, Owen(1993)은 빈도는 교육 요소를 결정하는 자료 중의 하나일 뿐이지 가장 중요한 것은 아니며, 구어체보다 문어체가 상대적으로 많다는 점을 들어 말뭉치는 빈도 자료의 가장 신뢰할만한 자료가 아니라고 주장한 바 있다. 이에 대해 Kennedy(1992)는 “흔히 언어 교육자나 교육 과정 설계자들은 의도적으로 빈도 증거를 무시하고자 한다. 하지만 ‘가장 빈도 높은 것=가장 중요한 것’이라는 등식에 불만족하더라도 언어사용에 있어서의 빈도의 정보를 부정하기란 어렵다.”고 지적하면서 말뭉치가 언어교육 자료에 경험적으로 가장 중요한 자료라는 사실을 일깨운다.9) 이상으로 언어 교육에 있어서의 말뭉치의 중요성을 정리해 보았다. 그러나 데이터의 수집도 중요하지만 말뭉치를 올바르게 해석하는 능력 또한 중요하다고 하겠다.10)
Ⅲ 한국어 사전과 문법정보
컴퓨터 기술의 발전에 힘입어 말뭉치가 언어 교육에 가치 있는 것으로 평가되기 시작한 것은 90년대에 들어 본격화되었다. 대량의 말뭉치를 저장할 수 있는 용량을 가진 기억장치와 그것을 가공하고 처리할 수 있는 빠른 프로세서를 지닌 시스템을 개인이 소유할 수 있게 되었기 때문에 언어 연구와 교육에 말뭉치를 이용하는 것에 대해 보다 많은 아이디어를 실험할 수 있게 되었다. 사전을 만드는 작업에 말뭉치를 이용하여 살아 있는 말이 들어있는 사전을 만들자는 생각도 그런 생각 중의 하나이다. 이미 말뭉치는 언어의 연구와 교육에 있어서 빼놓을 수 없는 중요한 위치를 차지하고 있다. 하나의 언어를 배운다는 것은 사전을 활용하는 법을 배우는 것이라는 말이 있다. 따라서 살아있는 말을 그대로 반영한 사전이라는 것은 큰 의미를 가질 수밖에 없는 것이다.11)
사전의 의무는 학습요구를 예견해야 하고 이해할 수 있는 설명을 제공하는 것이다. 따라서 문법에 대한 충분한 정보와 레지스터에 대한 신뢰할만한 사회언어학적 정보, 그리고 많은 사전이 무시하는 구어에 대한 정보도 제시할 수 있는 사전만이 의미를 가진다. 그간의 일반 사전은 발음, 의미, 품사 정도만을 제시하는 데에 그쳤으나 말뭉치를 기반으로 한 사전은 문법과 어휘 상호간의 관계, 연쇄 구조를 동시에 취급하게 된다.12) 그러면 말뭉치를 기반으로 한 사전이 한국어 교육의 측면에서 구체적으로 어떻게 기술되어야 할지를 실례를 들어 하나씩 짚어보고자 한다.
1. 표제어의 선정
말뭉치를 이용한 사전은 대규모의 한국어교육용 말뭉치를 대상으로 한 빈도 조사를 통해 어휘별 사용빈도와 범위를 제공해 줄 수 있다. 빈도란 어휘적인 빈도, 문법적인 빈도, 의미 빈도 등 다양한 양식이 있을 수 있는데 교육용 사전에서는 빈도는 교육에 연관되는 여러 출처에서 추출된 자료의 빈도라는 점이 중요하다고 하겠다. 이러한 빈도의 중요도와 더불어 한국어사전에서의 표제어 선정에 있어서는 몇 가지 다른 기준을 고려해야 한다. 우선, 표제어의 범위가 문제가 될 수 있다. 한국어사전은 언어 교육용 사전이라는 점을 감안해 일부 어휘에 대해 백과사전식 기술을 제공할 수 있다. 다시 말해 언어와 문화는 불가분이므로 한국어에 대한 이해를 돕기 위해, 일반 언어사전과는 달리 한국 문화를 이해하는 데에 필수적인 지명, 인명 등을 고려할 수 있다.13)
둘째는 어휘의 출현 빈도를 고려해야 한다. 서상규(1998)를 따르면 말뭉치 분석 결과 빈도 100 이상의 고빈도 구간의 어휘가 단지 3.8%의 17,378개에 불과하나 이들의 빈도 총합은 전체의 무려 95.7%에 달함을 지적한다. 반면에 저빈도 어휘는 이와 반대로, 수에서는 전체의 96.2%에 해당하는 어휘들이 그 빈도의 총합에서는 단지 4.3%에 불과한데, 이러한 사실은 어휘 목록을 추출하는 데에 있어서, 기초 어휘를 추출하는 데에는 빈도의 역할이 크다는 점을 알 수 있다. 사실 일상적인 의사소통을 위한 한국어를 학습하는 데에 있어 쓰여지는 기초 어휘의 수는 현저히 제한될 수 있다.
셋째, 위의 빈도와 더불어 교수 현장에서 사용되는 주요 어휘 역시 표제어를 정하는 데에 고려의 대상이 되어야 할 것이다. 빈도로는 높게 나타나지 않아도 교수 현장에서 필수적으로 쓰이는 어휘라면 반드시 표제어 선정의 고려대상이 되어야 할 것이다.
넷째, 전체적인 빈도 외에 어휘의 의미빈도라는 것 또한 중요한 의미를 가질 수 있다. 어휘 의미빈도란 어휘 사용빈도의 실제적인 양상을 보이는 작업이라고 할 수 있는데, 한 어휘가 뜻하는 여러 가지 의미들이 사용된 현상들을 빈도로 나타내 보임으로 해서 한 어휘 내에 각 의미 항목들이 가지는 중요도를 파악할 수 있다.14) 즉 선택된 표제어에 한해서도 표제어의 모든 용법을 기술하기보다는 기본적이고 빈도가 높은 의미항목을 선정해 설명하는 것이 바람직하다는 것이다. 아래의 표는 ‘있다’라는 어휘를 말뭉치에서의 출현 빈도를 의미 항목별로 산출해 표시한 것인데15), 이 표를 통해 한 단어 내의 각 의미항목들의 자주 쓰이는 비중을 산출할 수 있다. 단일 의미항목으로는 기본 의미인 ‘존재하다’보다 보조 용언으로 쓰이는 빈도가 더 높음을 알 수 있으며 이를 교육에도 반영할 수 있다.
빈도의 문제와 연결하여 어휘빈도나 의미빈도뿐만이 아니라 문법 빈도에 대해서도 생각해 볼 수 있다. 즉 문법의 빈도를 추출할 수 있다면 그 빈도 나 중요도에 따라 급별로 가르칠 문법의 범위를 정하는 데에도 커다란 도움이 될 것이다.
‘있다’ 의미 빈도 | ||||||||
표제어 | 격틀 및 대분류 | 의미 항목 별 소분류 | 예 | 분류기호 | 빈도수 | 비율(%) | ||
있다1
(형용사) |
1이 (2에) 있다 | 존재하다 | 옛날에 한 부부가 있었는데, 오랫동안 손이 없었다. | 111 | 976 | 1274 | 11.08 | 14.46 |
생기거나 발생하다 | 그 일로 크게 다치는 사람이 있을 것이라는 소문도 돌았다. | 112 | 262 | 2.97 | ||||
(어떤 일이) 벌어지거나 진행되다 | 오늘 소방 훈련이 있습니다. | 113 | 36 | 0.41 | ||||
1이 2에 있다 | (무엇이 어떤 곳에) 위치하다 | 정거장은 바로 학교 앞에 있었다. | 121 | 383 | 584 | 4.35 | 6.63 | |
(어떤 직장이나 부서에) 근무하다/일하다/소속되어 있다 | 남편이 제약회사에 있어서 약 걱정은 안 하는 터였다. | 122 | 13 | 0.15 | ||||
포함되다 | 명단에 혹시 우리 형님 이름도 있던가? | 123 | 167 | 1.89 | ||||
(어떤 상태에) 놓이거나 처하다 | 원자재들의 가격이 오르는 추세에 있다. | 124 | 21 | 0.24 | ||||
1에게 2가 있다 | 소유하다 | 그만한 돈은 내게도 있네. | 131 | 113 | 730 | 1.28 | 8.29 | |
(일정한 관계에 있는 사람이) 딸리어 존재하거나 생존하다 | 내가 아들만 있었어도 이런 설움을 당하지 않았을 텐데. | 132 | 38 | 0.43 | ||||
(무엇을) 자체에 지니거나 가지다 | 이 소설에는 주목할 만한 독창성이 있다. | 133 | 454 | 5.16 | ||||
(무엇이) 생기다 | 며느리가 태기가 있어 친정으로 보냈다. | 134 | 125 | 1.42 | ||||
1이 2로 있다 | 어떤 직위나 자격, 신분의 상태로 존재하다 | 집안에 분란이 생겼을 때도 오빠는 늘 방관자로 있었다. | 14 | 20 | 0.23 | |||
1이 2에 있다 | [동사적으로 쓰이어] (어떤 장소에) 머무르다 | 그 곳에서 나는 6개월 있었을 뿐이다. | 15 | 85 | 0.97 | |||
1이 있다 | [동사적으로 쓰이어] (시간이)경과하다/지나가다 | 몇 년만 있으면 21세기다. | 16 | 16 | 0.18 | |||
1이 있다 | [‘있는’의 꼴로 쓰이어] (재물이) 넉넉한 | 한 눈에 있는 집 자식임을 알 수 있었다. | 17 | 4 | 0.04 | |||
숙어 | ‘~에게/에 있어서’ | 나에게 있어서 그 일은 삶의 이유와도 같다. | 0 | 1938 | 22.01 | |||
‘~을 수 있다’ | 그 문제는 어린아이도 풀 수 있는 문제였다. | |||||||
있다2(보
동) |
‘-고’ 뒤에 쓰임 | (동작이나 상황이) 계속 진행되다 | 아이들은 서울에서 학교에 다니고 있습니다. | 21 | 1558 | 2661 | 17.69 | 30.22 |
(어떤 일의 결과의 상태가) 계속 지속되다 | 아이를 안고 있으니 가슴이 뭉클해졌다. | 22 | 1103 | 12.53 | ||||
있다3(보
형) |
‘-아
’ 뒤에 쓰임 |
(어떤 상태나 어떤 일의 결과의 상태가) 계속되다/지속되다. | 모든 식품은 비닐로 포장되어 있다. | 3 | 1493 | 16.97 | ||
누계 | 8805 | 100(98.81) | ||||||
오류 | 106 | (1.19) | ||||||
합계 | 8911 | (100) |
2. 사전에서의 문법 정보의 기술
1) 발음, 어휘 학습면
우선 발음의 기술에 대해 생각해 볼 필요가 있다. 보통 우리말 사전은 발음 정보를 따로 달고 있지 않다. 하지만 국어의 표기가 형태음소적 표기이고 보면 표기와 일치하지 않는 발음도 많다. 특히 외국인에게는 겹받침(‘흙, 밟다’..’) 이나 연음 시 일어나는 발음(‘읽고, 굳이’…), 장단음의 구별(내리는 ‘눈’과 신체의 ‘눈’…), 심리적인 장음 등을 그 표기만으로 알기 어렵다. 아울러 수의적으로 일어나는 음운 현상(‘신문/심문’…)이나 구어적인 습관(‘그리구, 먹구’…) 에 의한 발음 등도 함께 고려해야 한다. 발음의 정확한 기술을 위해서는 구어체 말뭉치의 구축이 선행되고, 그 데이터를 기반으로 하여 각 어휘의 실제 발음을 조사함으로써 표준 발음과 구어체적 발음의 차이를 확인해야 한다. 언어 교육이 효율적인 의사소통을 목표로 한다는 점에서 데이터를 바탕으로 한 현실적인 발음의 분석은 중요하며 이를 바탕으로 한 발음 정보가 제공되어야 한다.
사전에서 빼 놓을 수 없는 것이 개별 어휘의 설명인데, 우선 기존 사전의 ‘순환론적 뜻풀이’나 ‘표제어보다도 더 어려운 뜻풀이’ 등을 지양해야 한다. 쉬운 단어를 사용하여 단어의 이해를 돕기 위한 뜻풀이를 해야 할 것이다. 또한 어휘의 의미를 어휘의 용법을 통해 제시하므로 학습자의 이해를 도울 수 있으며 가능하면 삽화를 많아 활용해서 그림을 보고 단어를 직접 이해하게 하는 방법도 좋을 것이다. 기존의 사전에서의 의미 풀이만으로는 유의어간의 의미 구별이 어렵다. 따라서 화용적인 정보와 용례를 통한 어휘 의미의 획득은 중요하다. 또한 말뭉치의 분석을 통해 유의어, 반대어, 관련어 등의 정보도 분석해 제공해야 한다. 아울러 유사어(near-synonyms), 동의어, 관련어 간의 비교를 단순 비교가 아닌 항목별 비교를 통해 사용 오류를 막을 수 있다. 필요하다면 해당 어휘 아래에 오용되는 예를 직접 보임으로써 오류를 피하게 하는 것도 좋은 방법일 것이다.
비로소 비로서(×) 개구쟁이 개구장이(×)
예를 들면 명사를 설명하는 데에 있어서도 전후 관련 정보를 주는 것이 바람직하다. 명사의 특성은 조사와 결합하여 행위의 주체나 대상이 되는 것인데, 명사 중에는 다른 조사와는 어울리지 못하고 일부 조사와만 어울리는 것들이 있다. 예를 들면 ‘개성적’과 같이 ‘-적’으로 이루어진 말은 흔히 ‘개성적으로, 개성적이다’와만 어울릴 수 있으나, ‘가급적, 비교적’은 ‘으로’와만 어울린다. 또한 일반 명사와는 달리 홀로는 쓰이지 못하고 후행 명사를 수식하거나 명사구를 이루는 데에만 쓰이는 명사도 있다. 예를 들면 ‘통속’과 같은 말은 품사정보로는 명사로 주어지겠지만 실제로는 ‘통속극, 통속물, 통속 소설…’ 등과 같이 접미사나 후행 명사와만 어울려 낱말을 만드는 데에 쓰인다.16) 말뭉치의 용례 색인은 이러한 명사의 특수한 쓰임을 분석하고 이를 교육에 이용할 수 있게 한다는 점에서 도움이 된다.
아울러 합성어로 분류하기는 어려워도 ‘명사와 명사로 이루어진 구가 마치 한 단어처럼 쓰이는 예’들을 보어야 한다. 예를 들어 ‘가격 파괴’, ‘경제 교류’, ‘경제 협력’, ‘사회 봉사’, ‘사회 정의’, ‘정치 단체’, ‘정치 자금’ 등의 구는 한 단어는 보기 어려워도 일상 생활에서는 높은 빈도로 쓰이는 예들이므로 한국어 학습에 필수적인 예들이다. 이러한 예들은 선행 단어의 부표제어로 삼아 사전에 올려 기술함으로써 학습자의 이해를 도와야 한다.
이형태를 가진 형태소가 표제어가 될 때 어떤 것을 표제어로 삼느냐 하는 것도 고려해야 할 부분이다. 우선 이형태의 빈도를 조사함으로써 많이 쓰이는 것을 대표형으로 삼을 수 있다. 예를 들어 주격 조사로 쓰이는 ‘이/가’나, 목적격 조사인 ‘을/를’의 경우, 실제 빈도 데이터를 바탕으로 하여 대표형을 정할 수 있으며, 다른 통사적인 이유로 인해 빈도가 높지 않은 이형태를 대표형으로 설정한 경우에도, 이형태별 빈도 조사를 바탕으로 대표형이 되지 못한 높은 빈도의 이형태를 가표제어의 형식으로 사전에 기술하여 설명한다면 외국인 학습자에게 큰 도움을 줄 것이다. 또한 외국인 학습자의 편이를 위해 모든 이형태를 가표제어로 세우고 대표형태를 찾아가게 하는 방식을 취하는 것도 생각해볼 만하다.
2) 문법적인 설명 제시면
(1) 피사동의 구별
사전은 문법서는 아니다. 하지만 학습자가 사전을 통해 작문에 필요한 문법 정보를 얻을 수 있다면, 또 학습과정에서 일어나는 오류를 확인할 수 있는 자료로 삼는다면 사전의 기능이 더욱 확대될 수 있을 것이다.
우선 우리 말에서 능동과 피동, 주동과 사동은 서구의 언어들과는 달리 규칙적이지 않으며 어휘 개별적으로 나타나는 것이 보통이다. 한 동사도 의미 항목 따라 피동과 사동의 관계를 가지는 것과 그렇지 못한 것이 있다. 예를 들어 ‘나누다’는 ‘본래 하나였던 것을 둘 이상의 부분이나 조각이 되게 하다’의 의미로 쓰인 경우는 그 피동형이 ‘나뉘다’이지만 ‘이야기를 주고받다’의 의미로 쓰인 경우에는 피동형을 가질 수 없다. 실제로 말뭉치를 검색해 보면 대부분의 동사는 의미 항목별로 피?사동 관계를 보일 뿐 한 동사 전체에 대한 피동형이나 사동형을 규정하기는 어려움이 확인된다. 따라서 해당 동사의 각 의미 항목별 피?사동 관계에 대한 기술이 이루어져야 하며 이것이 사전에 기술되어야 한다.
(2) 동사의 품사정보, 논항정보, 의미정보
동사의 품사정보에 대한 문제도 재고해야 한다. 기존의 사전들은 ?이라는 품사표시 약물 뒤에 자동사니 타동사니 하는 것들을 구분하고 있다. 그러나 이러한 구분은 기계적인 구분일 뿐 실제로 이동을 나타내는 많은 동사들은 자동사로 분류되면서도 ‘-를’이라는 논항을 이끄는 것은 주지의 사실이다. 따라서 외국인에게 굳이 자동사니 타동사니 하는 정보를 주는 것보다는 각 해당 동사에 이끌리는 논항을(격틀) 동사 옆의 참고란에 표시하고 이러한 용례를 보임으로 해서 각 해당 동사의 용법과 의미를 정확히 파악하는 데에 도움을 주어야 한다. 예를 들면 높은 빈도로 사용되는 ‘가다’의 경우, 그 의미에 따라 ‘1이 2에/로 가다’, ‘1이 2를 가다’, ‘1이 가다’, ‘1에 2가 가다’ 등의 다양한 격틀을 가지는데, 이를 자동사로만 기술해 주는 것은 문제가 있다.
이러한 이유로 용어의 경우에는 말뭉치에 의한 분석을 통해 한 동사가 요구하는 논항과 그 논항의 특성(어떤 조사와 함께 분포되는지, 연어적인 구성을 보이는지..)을 파악해 이를 기술해 주어야 한다. 또한 해당 논항에 나타나는 명사 공통 자질을 추출함으로 해서, 명사 부류를 구분(구체명사, 추상명사, 사람명사, 장소명사…) 해 줌으로써 이를 작문에 활용하게 해야 한다. 만약 명사의 부류가 더 세분되어 일부 명사만을 허용하는 경우라면 구체적인 명사의 예를 몇 개 들어주는 것도 좋은 방법이다. 예를 들어 ‘강렬하다’라는 용언은 ‘1이 강렬하다’의 격틀을 가지는데, 이 때 1에는 ‘햇빛, 조면, 눈빛’과 같은 빛과 관련된 명사만이 올 수 있으므로 이를 표시해 줄 수있다.
아울러 말뭉치 용례의 검색을 통해 기존의 사전에 기술되지 못한 모든 용법의 의미 기술이 가능해지며 특정한 격틀과 용언 의미의 상관 관계를 보일 수 있게 된다. 다만 의미의 기술에 있어 가능한 모든 의미 항목을 기술해야 하는 가는 생각해 보아야 할 것이다. 특히 외국인을 대상으로 삼는 교육용 사전이니 만큼 기본적인 의미와 빈도가 높은 의미항목만을 중심으로 삼는 것이 좋으리라 본다.
우리말 동사는 활용을 하는데 불규칙 활용을 하는 용언도 있다. 따라서 사전에서는 불규칙 활용을 하는 동사들을 그 꼴을 해당 동사의 참고정보로 보여 줄 필요가 있다. 불규칙 동사의 활용형 중 많은 빈도로 출현하는 것들을 사전에서 가표제어로 세우고 해당 표제어로 안내함으로써 초보 외국인의 학습을 도울 수 있다. 외국인 학습자가 교재에 나타난 동사의 활용 꼴을 보고 동사 원형을 짐작하기 어려운 것들도 많기 때문이다. 또한 용언 중 활용에 제약을 보이는 것들이 있는데, 예를 들어 ‘관하다, 대하다, 불구하다’ 등의 동사가 그것이다. 이들은 대부분 ‘-에 관해, -에 대해, -에도 불구하고’ 꼴로만 나타나는데 이러한 정보도 사전을 통해 제공해야 한다.
(3) 공기관계, 연어관계, 고정표현
통사적으로 체언은 모든 용언과 어울릴 수 있지만, 실제로 많은 체언들은 일부 용언과만 어울려 쓰인다. 말뭉치의 용례의 큰 장점은 문장에 나타나는 단어 상호간의 연관 관계를 보일 수 있다는 것이다. 의미의 특성으로 인해 일부 용언과만 어울리거나, 체언의 속성에 따라 아주 제한된 몇 용언과만 어울리는 예들이 있다. 예를 들면 아래의 명사들은 어떤 특정한 용언과만 주로 어울려 쓰인다.(괄호 안은 전체 출현빈도 중의 구 출현빈도)
(가) 결원이 생기다(45%), 대미를 장식하다(82%), 녹이 슬다(69%), 만사를 제치다(32%),
(나) 불평을 늘어놓다/토로하다, 살기가 등등하다, 미련을 남기다, 책임을 지다/묻다, 확답을 받다/얻다..
(나)의 예들은 (가)에 비해서는 다양한 용언과 어울리지만 비교적 어울림의 빈도가 높은 것들이다. 이러한 예들은 통사적인 구성으로 따로 분류될 필요가 없는 구들이지만 한국어 작문에 있어서는 알아야 할 주요 정보들이다. 따라서 이들도 예문을 통해서라도 사전에 표시해 주는 것이 옳다.
이밖에도 의미원소가 같은 용언이 체언에 따라 달리 어울리는 연어 구성17)도 사전에 표시해 주어야 할 것이다. 예를 들면 ‘입을 다물다’, ‘눈을 감다’, ‘귀를 막다’와 같은 예들은 외국인 화자에게는 자국어에서 한 단어로 대응되는 일도 있으므로 반드시 이를 기술해 주어야 한다. 통사적인 이유로 항상 공기하는 것들도 표시해 주어야 한다. 예를 들어 ‘아이가 여간 똑똑하지 않다’라는 문장에서 ‘여간’이라는 부사는 부정표현과만 어울려 쓰인다는 정보가 제공되어야 할 것이다.
한편 ‘-하는 바람에, 뾰족한 수…’와 같이 고정된 꼴의 구로만 주로 쓰이는 예나 ‘코가 삐뚤어지도록 술을 마시다…’와 같은 상투적인 표현, ‘시험에서 미역국을 먹다’ 등의 관용표현도 해당 표제어 아래 부표제어로 삼아 이들 구의 뜻과 용례를 통해 제시함으로 해서 학습자의 이해를 도울 수 있다.18)
3. 사전에서의 화용적인 정보의 기술
(1) 구어정보의 제공
우리말은 문맥과 깊게 연관된 언어로 무엇이 다루어지는지 문맥을 통해 알 수 있으면 진술의 내용에 꼭 일치되지 않는 성분은 대부분 생략된다. 즉, 주어나 목적어 등이 생략 빈도를 말뭉치를 통해 조사할 수 있으며 이를 사전에 표시해서 구어에 가까운 표현을 하는 데에 도움을 줄 수 있다. 또한 말뭉치의 용례 검색을 통해 표제어가 어떤 상황에서 주로 쓰이는 어휘인지에 대한 정보를 제공할 수 있다. 예를 들어 ‘걔’는 주로 입말에서만 쓴다거나, 어미 ‘-나니라’는 성서와 글말에서만 쓰인다는 등의 정보를 제공함으로써 보다 자연스러운 구어를 구사할 수 있는 정보를 제공할 수 있다. 또한 용언의 어미의 경우 화자의 연령별 쓰임 빈도를 조사하여 화계에 맞는 언어 구사에 도움을 줄 수 있다.
구어 말뭉치를 바탕으로 하여 표준어 규정에 어긋나거나 잘못 쓰이는 말이지만 일상 생활에서의 사용 빈도가 높은 것들을 정리하고 나아가 속어적 쓰임이나 구어체/문어체적인 쓰임을 분석함으로써 교육을 돕는다. 예를 들어, ‘내’와 ‘네’의 경우는 발음상으로 혼동될 수 있어서 입말에서는 주로 ‘니’로 발음된다는 정보나 글말에서는 주로 본디말의 정보를 쓰나 입말에서는 주로 준말을 쓰는 ‘디디다/ 딛다’와 같은 정보도 제공할 수 있다. 또한 시대별 쓰임 빈도를 바탕으로 하여 옛말투나 유행어에 대한 정보 또한 제공하면 좋을 것이다.
(2) 오류 데이터의 제공
한국어 사전에서 반드시 고려하여야 할 사항이 학습자 말뭉치의 구축이다. 과제물이나 수업 현장에서 이루어지는 여러 자료들을 종합하여 학습자 말뭉치를 구축하고 이를 분석해야 할 것이다. 학습자가 보이는 오류 중 높은 빈도로 나타나는 것들을 분석하여, 잘못 쓰이는 예를 가표제어로 보인 뒤 맞춤법에 맞는 낱말로 찾아가게 하는 정보를 주거나, 해당 어휘가 잘못 쓰이는 용례를 Help박스(아래참고란)를 통해 이들의 잘못된 용례를 지적함으로써 오류 방지에 도움을 줄 수 있다. 예를 들면 ‘일찌기’가 아니라 ‘일찍이’로 써야 한다든지, 희망을 나타내는 ‘바람’이 ‘바램’으로 잘못 쓰이는 것등을 지적해 참고 박스를 통해 설명해 줄 수 있다. 아울러 학습자의 국적 배경별로 습관적으로 잘못 쓰이는 예들을 정리하여 이것을 설명해 주는 방법도 생각해볼 수 있다. 예들 들면 미국에서 온 초급 학습자들은 흔히 ‘축구를 차다, 축구를 놀다, 야구를 놀다…’와 같은 표현을 하거나 조사를 생략한 채 말하는 경향이 많은데, 이를 분석한 여러 연구들을 바탕으로 잘못 쓰일 수 있는 단어에 대한 자료를 사전에 기술해 줄 수 있다.
4. 독학, 개별 학습과 사전
최근 교수법이 의사소통중심으로 이루어져 상대적으로 교육에서의 문법의 비중이 적어지는 추세다. 따라서 학습자가 수업의 보충에 사전을 활용하거나 일정한 교재를 통해서 독학을 하는 경우, 교재에서 설명되지 않은 어휘, 문법에 관한 지식을 얻을 수 있다. 또한 풍부한 예문을 바탕으로 한 사전을 통해 작문 연습을 할 수 있어야 한다.
올바른 사전의 활용은 학습에 있어서의 개별화에 도움을 줄 수 있다. 학습자에 따라 공부하는 방식이 다를 수 있는데, 이러한 학습자의 개별적인 특성이 수업 현장에서 모두 고려되기는 어렵다. 따라서 학습자의 흥미와 개인적인 욕구에 따른 학습이 사전을 통해 이루어질 수 있다는 점이다. 학습자들은 개별 단어의 습득보다는 그것들의 연결 관계를 알고 싶어하는데, 이는 사전을 통해 학습할 수 있고, 같은 어휘 항목이 다른 환경에서 어떤 다른 기능을 수행하는가를 보일 수 있고 각 어휘 항목의 특성이나 화용상의 변이를 사전을 통해 보충함으로써 어휘의 확장을 가능케 한다. 이를 위해서는 많은 용례를 보이는 일이 중요한데, 인쇄된 사전은 지면의 제한성을 가지므로 앞으로 개발될 전자사전에 기대볼 수 있을 것이다. 검색어에 대한 반의어, 관련어 정보나 말뭉치 탐색 기능을 갖춘 사전이 나온다면 분량에 제한을 받지 않고 용례를 살필 수 있게 될 것이다.
5. 오류 분석을 통한 교육19)
한국어 학습자가 흔히 보이는 오류20)의 예를 들자면 연어적 오류(조사와 동사와의 연결), 문법적, 통사적 오류(수사, 시제, 동사활용), 어휘적 오류(철자법, 표준말), 유사어 혼동, 어순 등을 들 수 있을 것이다. 또한 문장 연결의 오류나 조사의 누락 또는 오용, 보어 등의 필수성분의 누락, 경어법의 오용, 시제의 혼란 등도 생각해 볼 수 있다.
먼저 어휘적인 오류로 의미는 비슷하나 사용 환경이 조금씩 다른 일련의 쌍, 예를 들어 ‘어리다와 젊다’, ‘늙다와 늦다’ 등을 혼동해서 쓰거나, ‘쓰다, 좋다, 받다’와 같은 기본 동사들을 지나치게 일반화시키고 확대해서 쓰는 일이 있다. 이러한 예들은 사전을 통해 해당 용언의 논항의 자질을 명확히 파악하고 용례를 익힘으로써 혼동을 피할 수 있다.
한국어 학습자들에게 나타나는 조사의 오류는 동사와의 관련성을 함께 생각해야 한다. 조사 오류의 한 원인으로 자국어의 간섭에 의한 오류를 들 수 있는데, 일본어 학습자가 감기에/*가 걸리다, 자전거를/*에 타다, 내가 영수를/*가 좋아한다, 나는 테니스를/*가 할 수 있다. 등과 같이 표현하는 예가 그것이다. 미국인 학습자들은 ‘농구를 놀다, 질문을 묻다, 식사를 먹다’와 같은 오류를 보이기도 한다.21) 이런 오류를 방지하기 위해서는 해당 동사가 가지는 격틀에 대한 정보를 제시함으로써 조사와 동사와의 관련성을 익히게 할 수 있다.
이수경(1996: 99)에 따르면 외국인 학습자가 ‘고’와 ‘어서’의 혼동을 자주 일으키는데, 이를 한국어 자체의 내재적 복합성으로 인한 것으로 보고, 학습자들은 예문을 통한 귀납적인 이해를 해야 한다고 지적하는데 실제적인 예문의 제시는 말뭉치 사전의 장점이다.
또한 비 경험적 교육의 오류, 교실에서 이루어지는 교사의 잘못된 문법 교육을 사전을 통해 바로 잡아 줄 수 있다. Selinker(1972: 80)는 중간언어가 만들어낼 수 있는 화석화 요인 중 학습적인 훈련 내용에 기인되어 잘못 학습되는 훈련전이(transfer-of-training)가 있는데, 이를 교정할 수 있는 수단이 사전이라고 보았다. 따라서 이러한 오류 분석을 바탕으로 한 사전의 기술은 학습자의 학습에 큰 도움을 줄 것임에 틀림이 없다.
Ⅳ. 결론
언어를 배우기 위한 방법은 더 이상 공간적인 제약을 받지 않게 되는 것이 현재의 추세다. 즉, 앞으로는 해당 언어를 배우기 위해 반드시 해당 지역을 가야 하는 것은 아니며, 이러한 역할들을 다른 네트워크들이 대신하게 될 것이다. 따라서 언어학습은 점점 네트웍을 이용한 독학이나 소집단의 형태가 많아질 것이다. 이러한 교육 형태에 필수적인 보조 자료는 올바르고 자세한 정보를 제공할 수 있는 된 사전이며, 이러한 사전을 위해서는 말뭉치의 활용이 필수적으로 고려되어야 한다고 본다. 본문에서 살펴본 바와 같이 말뭉치를 활용한 사전이 외국인을 위한 한국어사전의 편찬에 어떠한 도움을 줄 수 있을 것인가를 정리하면 아래와 같다.
첫째, 기초 자료의 제공이다. 국어학습자와는 구별되는 외국어로서 한국어를 학습하는 학습자를 위한 사전은 해당 학습기관에서 쓰이는 기본 어휘 및 교재를 바탕으로 한 말뭉치의 구축을 통해 표제어를 선정할 수 있다.
둘째, 표제어 선정에 근거를 마련할 수 있다. 즉, 편찬자의 주관에 좌우되지 않고 구축된 한국어교육용 말뭉치를 바탕으로 한 빈도에 근거한 표제어의 선정이 이루어질 수 있다. 아울러 자주 출현하는 문형 빈도나, 한 단어의 의미항목별 빈도 등도 제시될 수 있다.
셋째, 말뭉치의 분석을 통하여 문법적인 정보를 제시할 수 있다. 즉, 말뭉치의 분석을 통해 유의어, 반대어, 관련어 등의 정보를 제공할 수 있으며, 해당 표제어가 문장의 다른 성분과 어떠한 제약과 호응을 보이면서 사용되는지에 대한 정보를 제공할 수 있다. 예를 들어 명사의 연어(collocation) 정보나 부사의 호응 정보, 능동과 피동, 주동과 사동의 짝을 이루는 용언들의 해당 의미항목별 피동, 사동형 가능여부 비교, 용언의 활용형의 제약에 관한 정보, 용언의 격틀 정보, 일부 한자어 명사들의 제약에 정보 등을 제공할 수 있다.
넷째, 화용적인 정보 등도 말뭉치의 분석을 통해 가능하다. 즉, 구어말뭉치(spoken corpus)를 바탕으로 한 구어적 발음 정보나 단어의 구어적 쓰임에 관한 정보, 화자의 연령별 쓰임에 대한 정보 등을 제공할 수 있다.
다섯째, 말뭉치를 활용한 사전은 학습자의 오류말뭉치(LC)를 바탕으로 한 오류 분석을 통해 학습자가 자주 야기하는 오류들을 분석해 이를 사전에 기술함으로써 학습자들의 오류 해소에 도움을 줄 수 있다. 즉, 연어적 오류(조사와 동사와의 연결), 문법적, 통사적 오류(수사, 시제, 동사활용), 어휘적 오류(철자법, 표준말), 유사어 혼동, 어순 혼란, 문장 연결의 오류나 조사의 누락 또는 오용, 보어 등의 필수성분의 누락, 경어법의 오용, 시제의 혼란 등의 오류에 대한 많은 정보들을 제공할 수 있다.
이밖에도 말뭉치를 바탕으로 하는 사전은 컴퓨터를 기반으로 작성되므로 전자사전의 꼴로 만들기에 유리하다. 따라서 인쇄사전이 아닌 전자사전이 줄 수 있는 여러 가지 유용성을 제공할 수 있다. 인쇄사전은 지면의 제약상 한 단어에 대한 제한된 용례를 제공할 수밖에 없음에 반하여, 전자사전의 꼴로 컴퓨터에서 활용할 수 있다면 수많은 용례와 연결(link) 기능을 통해 학습자의 독학이나 개별 학습, 수업의 보조자료 등으로 이용할 수 있을 것이다.
다시 말해, 균형 말뭉치의 구축과 이의 올바른 해석이 바탕이 된 한국어 사전이 기술된다면 외국인의 한국어 학습에 크게 도움을 주게 될 것이며 이러한 한국어사전의 편찬은 시급한 당면 과제라 하겠다.