随着人们生活水平不断的提高,红酒越来越受到人们的喜爱。红酒的产量越来越大,然而红酒品质鉴定的手段还是仅靠品酒师的人工品尝打分来判定红酒质量的好坏,显然这种鉴定方式难以满足当今市场的需求。现在有不少学者运用一些机器学习的算法来对红酒质量进行预测研究,使得红酒品质鉴定的速度得到大幅提升并且有着较高的准确率。
对于红酒品质的分类,可以基于红酒的理化指标(例如:酒精的浓度、pH值、糖的含量、非挥发性酸含量、 挥发性酸含量、柠檬酸含量等)作为特征,建立分类模型,然后对红酒品质进行预测。本案例中,我们将使用UCI数据库中的 Wine Quality Data Set 数据集,利用随机森林分类算法来进行红酒品质的分类。