分类器 liblinear liblinear liblinear liblinear liblinear liblinear liblinear 方法 PCA降维至4020 PCA降维至4020 PCA降维至4020 PCA降维至4020 PCA降维至4020 PCA降维至4020 PCA降维至4020 +10维 +20维 +30维 +50维 +80维 +100维 准确率 0.7953 0.8356 0.8382 0.8357 0.8389 0.8389 0.8399
传统特征按位置三份加权 TF/IDF>1.0 权值3,2,1 TF/IDF>1.0 权值1.5,1.2,1 TF/IDF>1.0 权值1.2,1.1,1 TF/IDF>1.0 权值1.1,1.05,1 TF/IDF>1.0 权值1.1,1,1 TF/IDF>1.0 权值1.19,1.04,1 TF/IDF>1.0 权值1,1,1 TF/IDF>1.0 权值0.9,0.95,1 TF/IDF>1.0 权值0.84,0.96,1 TF/IDF>1.0 权值0.8,0.9,1
思路:传统方法置信度低时用时间序列的结果
置信阈值 0.1-0.2 0.2-0.3 0.3-0.4 0.4-0.5 TF/IDF>0.5 0.5-0.6
传统方法正确率
个数 0
比例 0.00% 0.18% 1.76% 2.58% 6.49%
时间序列正确率
40.00% 32.65% 44.44% 55.25%
思考五
时间序列特征有什么含义?
代表不同位置词的重要性曲线
1.7 1.6 1.5 1.4 1.3 1.2 1.1 三段 五段 八段