达吾勒·阿布都哈依尔, 海拉提·克孜尔别克. 基于规则的哈萨克语词干提取算法的研究[J]. Journal of Xinjiang University (Natural Science Edition in Chinese and English), 2011, 28(2): 238-241.DOI:
基于规则的哈萨克语词干提取算法的研究
摘要
本文提出了一个基于规则的哈萨克语词干提取的一种解决方法.该方法首先找到待切分词的所有可能的词干
然后以带变形词的词典和分类的附加成分表为基础
对找到的若干个词干进行词法分析
最后确定正确的词干.
Abstract
In this paper
we propose a method of Kazakh word lemmatization by using rule-based analysis.By using our method
first we find all possible stems of the word.Then we apply morphological analysis to the stems by using the table of affix and a list of word variants.At last we get the correct word stem.
关键词
Keywords
references
新疆维吾尔自治区语委会.现代哈萨克语[C].乌鲁木齐:新疆人民出版社,2002.
徐青,张辉,陆汝占.汉语语料的切分标注加工系统[J].计算机工程,2003,(6):58-64.
钱辑丽,郑家恒.文本切分知识获取及其应用[J].计算机工程与应用,2003,(2):23-27.
SERER H,BITIRIM L.Analysis and Evaluation of a Turkish Stemming Algorithm[A].10th International Sympo-sium,SPIRE 2003.