国家语言资源监测与研究中心
华中师范大学承办

平面媒体分中心 | 网络媒体分中心 | 海外华语研究分中心 | 教育教材分中心 | 有声媒体分中心

科研成果

  国家语委现代汉语语料库检索系统(网络媒体分中心)

“国家现代汉语语料库”是由中华人民共和国国家语言文字应用委员会主持建立的一个现代汉语书面语通用平衡样本语料库,它于1993年开始建设。该语料库的第一批语料数据是1919年至1992年的语料,共7000万字,以后每年递增1000万字,是目前最大的现代汉语平衡语料库。

本系统处理的是国家语委语料库中的2000万字精加工语料,拥有强大的查询功能,能为汉语言的调查、统计与分析提供便捷的服务。在整个查询系统中,用户可自由选择语料的领域(政治、经济、体育等),并且可以自由限定返回结果的词语数量,同时还能对查询条件进行词性的限定。该系统具有三种查询功能:
1.普通查询:用户输入字或词进行全文检索,用户可以自由选择检索方式(精确、模糊等)。

2.模式查询:用户提交所需要的语言模式,例如“高高兴兴”,“迷迷糊糊”等重叠词可表示为“aabb”的模式(其中字母可任意指定), 系统将返回语料库中所有满足这些模式的结果。

3.高级查询:该功能提供更加灵活的查询方式。我们首先制定了一套简明的语法规则(可参看说明),用户根据该语法来自由表达
查询意愿,从而得到更加灵活的查询结果。

此外,该检索系统还提供进阶处理功能,能在首次查询出的结果中再次查询,从而进一步返回更加符合用户需求的结果。

  2005年中国主流报纸十大流行语(平面媒体分中心)

2005年中国主流报纸十大流行语在北京语言大学发布,保持共产党员先进性教育、“十一五”规划、神舟六号(神六)、节约型社会、和平发展、一篮子货币、油价上涨、同一个世界同一个梦想、连宋大陆行、取消农业税入选综合类十大流行语。

国内时政类、国际时政类、经济类、科技类、教育类、体育类、文化娱乐类七个类别的十大流行语以及港澳台专题和廉政专题十大流行语也同时发布。

十大流行语是对2005年人民日报等15家报纸流行语动态跟踪研究的结果,选取了15家报纸2005年1月1日—12月31日的全部约5亿字语料。依据发行量、媒体价值、阅读率、发行地域、发行周期、涵盖领域等因素选取的15家报纸是(按音序排列):北京青年报、北京日报、北京晚报、法制日报、光明日报、广州日报、华西都市报、环球时报、今晚报、南方周末、人民日报、深圳特区报、羊城晚报、扬子晚报、中国青年报。