# # #

语言资源

Language resources

语言学家

Linguist

资源上传

Upload Resources

站内检索

Search

动态新闻

了解更多>>

16

Jul

16

Jul

征稿通知 | 第十一届海峡两岸现代汉语问题学术研讨会

阅读量(135) /   查看详情

16

Jul

16

Jul

第四届中国语用学专题论坛 三号通知

阅读量(910)   /   查看详情

专题∣语言文字中青年学者出国研修项目实施情况汇报

阅读量(591)  /   查看详情

2018中青年语言学者沙龙在商务印书馆召开

阅读量(490)  /   查看详情

第十一届中国社会语言学国际学术研讨会征稿通知

阅读量(1401)  /   查看详情

第三届语言文字应用研究中青年学者协同 创新联盟学术研讨会

阅读量(788)  /   查看详情

语言资源

了解更多>>

国家语委现代汉语平衡语料库

该语料库全库约为1亿字符,其中1997年以前的语料约7000万字符,均为手工录入印刷版语料;1997之后的语料约为3000万字符,手工录入和取自电子文本各半。

了解更多 >

现代汉语语料库

“现代汉语语料库”含报纸、博客、网站新闻、文学作品、杂志、口语材料、教材语料等内容,规模近2亿字。提供在线按字符串和分词单位检索的检索功能,支持“正则表达式”。 “现代汉语语料库”在国家社科基金项目“基于国家语委‘通用语料库’之上的汉语义频词库的开发”及厦门大学国家语言资源监测与研究教育教材中心其他课题中得到应用并不断完善。

了解更多 >

媒体语言语料库(MLC)

媒体语言语料库(MLC)2003年开始建设,2005年上线,其后不断扩大语料规模,一直为研究者提供免费服务。为方便广大研究者使用,2016年语料库进行了第三次改版。这次改版主要加进了与原来语料规模相等、内容相同的熟语料,可以进行以词为单位或以词性及词性串为单位的词串检索。本语料库包括2008至2013六年的3.4万个广播、电视节目的转写文本,总字符数为2.4亿,总汉字数为2亿字次。所有文本都进行了分词和词性标注,共计1.36亿词次。为保证语料的典型性和代表性,每年都尽可能选择那些流通度大、年度间又有一定连续性的节目文本;为便于研究者做6年间的历时语言调查,各年度的语料规模尽可能平衡。

了解更多 >

全球华语语料库

1、东南亚主要华文媒体语料库 语料库的来源以新加坡、马来西亚和泰国等主流媒体为主,语料时间跨度为2005年到2008年,总共文本数为343978个,约3亿字。已经分词和标注词性。 2、东南亚小学华文教材语料库 以新加坡、马来西亚、菲律宾、印尼、越南的小学华文教材为主。选取了20套、约240本小学华文教材,已经输入电脑,总共约300万字。已经进行自动分词,并标注了词性。 3、东南亚华裔留学生作文语料库 语料库收集了2001年到2010年的留学生作文,大约400万字。 4、东南亚华裔留学生口语语料库 语料库收集了2001年到2010年的留学生口语,大约20万字。

了解更多 >

LDC

LDC是一个开放的大学、图书馆、公司和政府研究实验室。它成立于1992年,最初,LDC的主要作用是作为存储库和语言资源的分配点,从那时起,在其他成员的帮助下,LDC成长为一个创建和分发各种语言资源的网站,LDC还通过提供资源和促进组织知识支持基于科研的项目和语言技术评估。

了解更多 >

语言资源检索

输入关键词检索全站语言资源


语言学家

了解更多>>

邢福义: 1935年5月生,海南省乐东县人。华中师范大学文科资深教授,博士生导师。

了解更多

邢福义: 邢福义: 1935年5月生,海南省乐东县人。华中师范大学文科资深教授,博士生导师。

陆俭明,男,1935年11月生于江苏省吴县。现任北京大学中文系教授,博士生导师。

了解更多

陆俭明,男,1935年11月生于江苏省吴县。现任北京大学中文系教授,博士生导师。

许嘉璐:中国著名语言学家,汉语文化学院院长,汉语史、应用语言学两个研究方向的博士生导师。

了解更多

许嘉璐: 中国著名语言学家,汉语文化学院院长,汉语史、应用语言学两个研究方向的博士生导师。