1.一种基于商品评论的新情感词提取方法,其特征在于:首先采用相邻词词性及位置、主题词和表情符号位置等特征来粗粒度提取新情感词;然后根据同位关系匹配方法来发现其他情感词,即利用语法树来发现具有同位关系的其他新情感词。
2.根据权利要求1所述的粗粒度提取方法,其特征在于:结合相邻词词性及位置、主题词和表情符号位置等特征统计旧情感词出现频率,再设置k=4的滑动窗口获取不同词性词语、主题词以及表情符号周围4个字符以内的词语。
根据不同特征为候选词设置概率值,再进行概率综合计算,选择排序前30%的词作为候选新情感词。
3.根据权利要求1所述的同位关系匹配方法,其特征在于:对评论语句构建语法树,以语法树为特征,利用SVM(支持向量机)来训练,从而自动获取评论文本对应语法树的结构化信息。再通过计算两棵语法树T1和T2中相同子树的数目来衡量匹配度。若该新词所在的评论语句与某情感词的语句之间的匹配度达到阈值,则证明该词与情感词具有相同“地位”,即将该新词加入新情感词候选集合。