한문 사전, 번역어 사전

국학 연구용 상용한자 제정안, 허성도 선생님, 한자사용 빈도

일이삼선생 2023. 5. 7. 21:37
반응형

국학 연구용 상용한자 제정안

 

허성도 / 서울대학교 중어중문학과 교수

 

1. 한자 사용 빈도 조사의 목적

한문의 이해는 국학 연구의 중요한 기반이 된다. 그러므로 효과적인 국학 연구 인력의 배양을 위해서는 국학 연구에 필요한 상용한자를 선정하고 이를 중심으로 하는 한문 교육 방법론의 재구성이 필요하다. 이 글은 국학 연구용 상용한자를 선정하기 위하여 한자의 사용 빈도를 조사하였다. 그러나 지면 관계상 상세한 조사 결과를 소개할 수 없으므로 조사의 대상과 조사 방법을 간단히 소개하고, 국학 연구용 제1, 2, 3 수준 한자를 제시하고자 한다.

 

2. 한자 사용 빈도 조사의 대상

이 조사에서는 다음과 같은 자료를 선정 입력하였다. 이러한 자료에 나와 있는 한자의 총 자수는 9,428,388자이다.

 

四書類 : 論語, 孟子, 大學, 中庸

敎材類 : 千字文, 小學, 明心寶鑑, 擊蒙要訣, 古文眞寶前後集, 古文觀止散文編

中國文學類 : 詩經, 楚辭, 陶淵明詩集, 杜甫詩集, 唐詩三百首, 宋詩選, 蘇軾詩集

十三經 : (詩經), 書經, 周易, 爾雅, 春秋穀梁傳, 春秋公羊傳, 左傳, 禮記, 儀禮, 周禮, 孝經, (論語, 孟子)

諸子集成 : 晏子春秋, 法言, 管子, 韓非子, 淮南子, 莊子, 墨子, 老子, 吳子, 抱朴子, 商君書, 世說新語, 新語, 申鑑, 愼子, 孫子, 荀子, 呂氏春秋, 列子, 鹽鐵論, 尹文子, 潛夫論, 論衡, 顔氏家訓, (論語, 孟子)

中國史書類 : 國語, 戰國策, 史記, 漢書列傳

韓國史書類 : 三國史記, 三國遺事, 高麗史, 太祖實錄, 定宗實錄, 太宗實錄, 文宗實錄, 端宗實錄, 世祖實錄

韓國文學類 : 72인의 시문 296, 20편의 소설, 冲庵集

 

3. 한자 사용 빈도 조사 방법

한자 사용 빈도 조사는 다음과 같은 과정을 거쳐 진행되었다.

 

(1) 국학 자료의 필자들에게 가장 영향을 많이 주었으리라고 판단되는 중국의 문학 철학 사학 계통의 저작을 선택하여 컴퓨터에 입력하였다.

(2) 위의 자료에 나오는 모든 한자를 한국사사료연구소에서 개발한 한사연 한자 부호계(HSY Hanja Code-System)를 통하여 입력하였다. 따라서 이 부호계에 수록되어 있지 않은 한자는 사용 빈도 조사에서 제외되었다. 이 한자 부호계에는 15,500자의 한자가 수록되어 있으므로 이들에 대한 조사만으로도 거의 완전한 사용 빈도 조사가 이루어질 수 있다. 특히 이 조사는 1, 2, 3 수준의 상용한자를 추출하는 것이므로 이 부호계의 사용에 문제가 없다고 판단하였다.

(3) 입력은 가능한 한 원본에 있는 한자의 자형대로 입력하였다.

(4) 입력된 자료는 가능한 한 상세한 교정을 거치고자 하였으나, 입력 자료의 방대함과 시간의 문제, 그리고 경비의 문제로 인하여 완벽한 교정을 보기는 어려웠다. 그러나 이 자료의 오차 범위는 0.5% 이내가 될 것이라고 믿고 있다.

(5) 교정은 입력본과 동일한 판본으로 진행하는 것을 목표로 하였으나, 입력본이 신뢰성이 있는 판본이 아닌 경우에는 교정할 때 신뢰성이 있는 판본으로 바꾸어 대조하였다.

(6) 한자에는 同字, 古字, 俗字, 部分同字와 같이, 사실상 동일한 의미로 사용되지만 字形은 각각 다른 관계에 있는 異體字가 적지 않게 존재한다. 그러나 이번의 조사는 상용한자의 추출을 목표로 하므로 이러한 한자를 모두 하나의 한자로 취급하였다. 이를 위하여 이들 同字, 古字, 俗字, 部分同字를 하나의 한자로 취급하는 세서러스를 구축하였다. 그 세서러스 목록은 다음과 같다. 다음의 묶음 가운데 앞에 있는 한자가 그 묶음의 대표하는 한자이다.

段叚 刊刋 趕赶 減减 崗岡 疆畺 强彊 盖蓋 槪槩 劍劒

劫刦 輕耕畊 鷄雞 届屆 皐臯 槁槀 穀穀 崑崐 館舘

廐廏 懼毆敺 局跼 掬匊 群羣 叫呌 糾紏 隙郄 巹

棄弃 覊羈 奈柰 寧寍 賚賚 嬭妳 鍛煅 答荅 德悳 瑯琅

略畧 糧粮 痕岺嶺 稑穋 裏裡 莅蒞 脈脉 綿緜 麵麪

明眀 貌皃 蒙冡 鍪杯盃 裵裴 栢柏 昺昞 寶珤 攵攴

襆幞 峰峯 毘毗 秘祕 氷冰 算筭 揷挿 商啇 床牀 婿壻

晳晰 燮爕 曬晒 讐讎 手扌 水氵 徇狥 筍笋 蝨虱 繩縄

廝厮 枾柹 審宷 沈沉 雙双 峨峩 雁鴈 戛戞 昻昂 野埜

孼孽 與与 煙烟 鹽塩 映暎 濴濚 汚汙 宂冗 踊踴 勖勗

遊游 人亻 胤淫滛 誼竩 彝彛 妊姙 衽袵 姊姉 眥眦

腸膓 梓榟 災灾 弔吊 點点 旌旍 第苐 晉晋 簒簒 參叅

僭僣 慚慙 體軆 總緫 怱悤 芻蒭 沖冲 厠廁 癡痴 恥耻

漆柒 寑寢 稱偁 橐槖 塔搭撘 兎 霸覇 稟禀 豊豐

廈厦 銜啣 鹹醎 皞皥 畫畵 譁嘩 火灬 鰥鱞 闊濶 晃晄

況况 效効 携攜 恟忷 憙憘 熹熺 犧犠 回迴 于亏 巖岩

嵒嵓 竝並幷 敍叙敘 旌旍旂疏疎踈

(7) 현행의 국가 표준 한자 코드에서는 多音字를 각각 독립된 한자로 취급하고 있다. 이러한 이유로 예를 들면 ''', , , '의 네 가지 코드에 각각 배정되어 있다. 그러나 한자의 사용 빈도 조사에서는 이러한 한자를 네 종류의 독립적인 한자로 취급할 필요가 없으므로 이들을 하나의 字種으로 취급하였다.

4. 조사 결과의 해석

이 조사를 통하여 다음과 같은 사실을 알 수 있다.

 

(1) 敎材類90%를 이해하기 위한 한자의 수는 1,284자이다.

(2) 敎材類95%를 이해하기 위한 한자의 수는 2,038자이다.

 

(1) 四書90%를 이해하기 위한 한자의 수는 841자이다.

(2) 四書95%를 이해하기 위한 한자의 수는 1,080자이다.

 

(1) 諸子集成90%를 이해하기 위한 한자의 수는 1,097자이다.

(2) 諸子集成95%를 이해하기 위한 한자의 수는 1,809자이다.

 

(1) 十三經90%를 이해하기 위한 한자의 수는 1,057자이다.

(2) 十三經95%를 이해하기 위한 한자의 수는 1,791자이다.

 

(1) 中國文學類90%를 이해하기 위한 한자의 수는 1,781자이다.

(2) 中國文學類95%를 이해하기 위한 한자의 수는 2,878자이다.

 

(1) 中國歷史類90%를 이해하기 위한 한자의 수는 991자이다.

(2) 中國歷史類95%를 이해하기 위한 한자의 수는 1,583자이다.

 

(1) 韓國文學類90%를 이해하기 위한 한자의 수는 1,824자이다.

(2) 韓國文學類95%를 이해하기 위한 한자의 수는 2,451자이다.

 

(1) 韓國歷史類90%를 이해하기 위한 한자의 수는 1,174자이다.

(2) 韓國歷史類95%를 이해하기 위한 한자의 수는 1,797자이다.

 

(1) 中國總合資料類90%를 이해하기 위한 한자의 수는 1,298자이다.

(2) 中國總合資料類95%를 이해하기 위한 한자의 수는 2,133자이다.

 

(1) 韓國總合資料類90%를 이해하기 위한 한자의 수는 1,224자이다.

(2) 韓國總合資料類95%를 이해하기 위한 한자의 수는 1,882자이다.

 

(1) 韓中總合資料類90%를 이해하기 위한 한자의 수는 1,328자이다.

(2) 韓中總合資料類95%를 이해하기 위한 한자의 수는 2,105자이다.

이 조사를 통하여 다음과 같은 사실도 알 수 있었다.

 

(1) 500자의 한자를 알면 韓中總合資料72.59%의 한자를 이해한다.

(2) 1,000자의 한자를 알면 韓中總合資料88.53%의 한자를 이해한다.

(3) 2,000자의 한자를 알면 韓中總合資料95.59%의 한자를 이해한다.

(4) 3,000자의 한자를 알면 韓中總合資料98.24%의 한자를 이해한다.

(5) 4,000자의 한자를 알면 韓中總合資料99.22%의 한자를 이해한다.

(6) 5,000자의 한자를 알면 韓中總合資料99.84%의 한자를 이해한다.

 

이 결과에 근거하여 이 글은 상위 빈도 3,000자 가운데 최상위 빈도 1,000자를 국학 연구용 제1 수준 한자, 차상위 빈도 1,000자를 국학 연구용 제2 수준 한자, 차차상위 빈도 1,000자를 국학 연구용 제3 수준 한자로 제정하기를 제안한다.

 

 

 

 

 

 

5. 국학 연구용 제1 수준 한자

다음은 국학 연구용 제1 수준 한자이다. 순서는 사용 빈도순이다.

 

1-100

, , , , , , , , , , , , , , , , , , , ,

, , 使, , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

101-200

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , 殿, , ,

, , , , , , , , , 西, , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

201-300

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

301-400

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

401-500

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

501-600

, , 退, , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , 便, , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

601-700

, , , , , , , , , , 祿, , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , 滿, , , , , ,

, , , , , , , , , , , , , , , , , , ,

701-800

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

801-900

, , , , , , , , , , , , , , , , 宿, , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

901-1000

, , , , , , , , , , , 調, , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

 

이상에 제시한 국학 연구용 제1 수준 한자의 총 사용 누적 빈도는 86.523496%이다. 이는 위의 국학 연구용 제1 수준 한자로서 총 입력 자료의 86.523496%의 한자를 이해할 수 있다는 것을 뜻한다.

 

6. 국학 연구용 제2 수준 한자

 

1001-1100

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1101-1200

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , 簿, , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , 輿, , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1201-1300

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1301-1400

, , , , , , , , , , , , , , , , , , , ,

, , 鹿, , , , , , , , 綿, , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1401-1500

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1501-1600

, , , , , , , , , , , 婿, , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1601-1700

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1701-1800

, 沿, , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1801-1900

, , , , , , , , , , , , , , , , , , 穿, ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

1901-2000

, , , , , , 巿, , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

이상에 제시한 국학 연구용 제2 수준 한자의 총 사용 누적 빈도는 95.56617%이다. 이는 위의 국학 연구용 제1, 2 수준 한자로써 총 입력 자료의 95.56617%의 한자를 이해할 수 있다는 것을 뜻한다.

 

7. 국학 연구용 제3 수준 한자

 

2001-2100

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2101-2200

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2201-2300

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , 忿, , , , , , , , , , , 貿, , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2301-2400

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , 姿, , , , , , , , , , , , , , , , ,

, , , , , , , , 耀, , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2401-2500

, , , , , , , , , , , , , 駿, , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , 歿, , , , , , , , , , , , , ,

, , , , , 禿, , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2501-2600

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2601-2700

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2701-2800

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2801-2900

, , , , , , , , , , , , , , , , , , , ,

, 谿, , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , ,

2901-3000

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , 竿, , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , , , , , ,

, , , , , , , , , , , , , , , 漿, , , ,

이상에 제시한 국학 연구용 제1, 2, 3 수준 한자의 총 사용 누적 빈도는 98.24033%이다. 이는 위의 국학 연구용 제1, 2, 3 수준 한자로써 총 입력 자료의 98.24033%의 한자를 이해할 수 있다는 것을 뜻한다.

728x90
반응형