关键词:
烟叶
组合分类
判别分析
机器学习
感官评吸
配方模块
摘要:
为深入研究卷烟品牌烟叶配方分组方法和原则,基于457个烟叶样品的12种感官评吸指标,比较了4种判别分析和4种机器学习方法对4种烟叶分类的建模集正确率(R)、验证集正确率(r)和平均正确率(m)的影响,并基于分类方法选择和权重分配构建了一种高精度的组合分类方法。结果表明:(1)与判别分析相比,机器学习的R显著提高,而r显著下降,且LS-SVM的R最高(92.8%),FDA和F-BDA的r最高(80.2%),但m无显著性差异;(2)优化选择M-BDA、FDA、ANN和KNN四种方法,按精度赋权建立的组合分类方法同时提高了R(95.3%)和r(89.0%),且m由低于84%提高到92.2%,并通过理论计算和实际结果验证了组合分类方法的普遍有效性;(3)组合分类方法Kappa系数均大于0.8,方法可靠,一致性程度高,验证集m-F1度量显著提升21.2%,模型泛化能力大为增强;(4)优雅感、杂气、余味、润感和清晰度5项指标对分类起主要作用,符合利群品牌的风格特征;(5)误判样品(6.5%)指标评分与其模块真实类别的不匹配归因于对库存、成本和质量的平衡,基本符合烟叶配方的调整空间。