字母词语自动提取的几点分析
字母词语大多是术语和专名,也是汉语自动分词中的未登录词,其正确识别与否不仅关系到大规模中文文本自动分词和标注,也关系到信息检索、搜索引擎、机器翻译等应用软件的质量.本文对大规模真实文本中的字母词语的使用情况进行了考察,对其自动提取进行研究,并就汉语文本字母词语自动提取的难点进行了分析,给出了一些建议.
作 者: 郑泽之 张普 Zheng Zezhi Zhang Pu 作者单位: 郑泽之,Zheng Zezhi(太原师范学院计算机系,太原,030012)张普,Zhang Pu(北京语言大学应用语言学研究所,北京,100083)
刊 名: 语言文字应用 PKU CSSCI 英文刊名: APPLIED LINGUISTICS 年,卷(期): 2005 ""(1) 分类号: H08 关键词: 字母词语 自动提取 词汇