国家语委现代汉语语料库
 
国家语言资源监测与研究中心
 
 
 
语料库检索系统介绍 | 语料分类体系 | 语料来源 |
 
 “国家现代汉语语料库”是由中华人民共和国国家语言文字应用委员会主持建立的一个现代汉语书面语通用平衡样本语料库,它于1993年开始建设。该语料库的第一批语料数据是1919年至1992年的语料,共7000万字,以后每年递增1000万字,是目前最大的现代汉语平衡语料库。

 “国家现代汉语语料库”建设的目标是能客观地反映现代汉语在字、词、句法、语义、语用等方面的全貌。它的应用领域主要有语言文字规范与标准的制定、语言文字的学术研究、语文教育、语言文字信息处理、语言文字的社会应用等。该语料库的结构设计遵循通用性、描述性、实用性、随机性等原则,从而保证该语料库的平衡性和代表性。

  本系统处理的是国家语委语料库中的2000万字精加工语料,拥有强大的查询功能,能为汉语言的调查、统计与分析提供便捷的服务。

在整个查询系统中,用户可自由选择语料的领域(政治、经济、体育等),并且可以自由限定返回结果的词语数量,同时还能对查询条件进行词性的限定。该系统主要功能特色:
1、支持自定语料库范围
在国家语委现代汉语语料库的分类体系基础上选择所需类别,缩小检索范围。

2、提供普通查询功能
对用户输入进行精确匹配,可设置多条件检索。

3、支持重叠词查询
本系统提供模式检索,输入重叠词模式(用任意字母表示),并可进一步限定其中包含的关键字词,系统将返回语料库中所有满足这些模式的结果。

4、支持高级查询表达式
根据我们定义的语法,用户可进行词性查询、组合查询、短语查询、句式查询、指定距离查询等。

5、支持查询结果进阶处理
包括内容过滤(取或排除)、统计(关键字统计、互信息统计、词频统计)、组合排序等。

6、多种结果显示方式
支持原始语料与已标注语料的显示方式,并提供结果显示窗口的大小设定功能。

7、提供单条查询结果与原始语料出处的快速跳转。

8、支持查询结果的图表导出方式:为用户保存为excel。

国家语委现代汉语语料库检索系统 版权所有 @2005
国家语言资源监测与研究中心(网络媒体分中心)
电 话:027-67868318 电子邮件: baozhen_520@hotmail.com