因为汉字特有的结构,理论上可以堆砌造出无数个汉字。但在实际使用中,毕竟还是有数量限制的。
按《国际中文教育中文水平等级标准》(GF 0025—2021)中的语言量化指标总表,对外汉语的学习者应掌握以下数量的汉字:
级别 | 一级 | 二级 | 三级 | 四级 | 五级 | 六级 | 七—九级 |
汉字 | 300 | 600 | 900 | 1200 | 1500 | 1800 | 3000 |
各等级都有各自的描述。但是,除了汉字外,还有章节、词汇和语法方面的要求,因此在此省略。
对于中国国内教育,根据《义务教育语文课程标准》2022年版,义务教育阶段的学生需要掌握的汉字数量如下:
年级 | 1~2年级 | 3~4年级 | 5~6年级 | 7~9年级 |
认识汉字 | 1600 | 2500 | 3000 | 3500 |
会写汉字 | 800 | 1600 | 2500 | 3500 |
事实上,3500个正是文化普及的基本用字需要。2013年的《通用规范汉字表》中就收入了8105个字,分为三级:日常使用的3500个,仅供出版印刷需要的3000个,以及专门领域的1605个:
等级 | 一级字表 | 二级字表 | 三级字表 |
字数 | 3500 | 3000 | 1605 |
总共 | 3500 | 6500 | 8105 |
这个表是中国最官方最权威的字表,它由当时多方面语库、数亿的字符总结而来。
除了官方文件,兼具文化性和商业性的辞书也可以一览常用汉字的数量。中国使用最多的两本辞书是《新华字典》和《现代汉语词典》,不过这两本书都没有说明自己收录的汉字数量。一般认为《新华字典》中汉字数量为1.1万~1.4万字。
最后是信息领域。字符需要在编码后才能被计算机处理,所以程序员专门为简体中文设计了相应的编码:
编码 | GB2312 | GBK | GB18030 |
汉字数量 | 6763 | 21003 | 27484 |
需要注意的是这些编码在拓展中逐渐包含了生僻字、繁体字、异体字和日本汉字。
不过,有没有专门用来记录全的字典呢?有的,不过这类一般是将自古到今的异体字和自造字都统计在内,所以对于学习者来说并没有太大用处:
来源 | 《康熙字典》 | 《中华字海》 | 《异体字字典》 |
字数 | 47035 | 85568 | 106330 |
除了出版的字典外,也有很多汉字研究的网站,通过开放式收集,包含的汉字形状更多。