本案例提供一份有关青少年爱好与生活习惯的数据集,主要收集年轻人的爱好和生活习惯方面的信息。问卷调查数据集的总体情况如下:
+ 该问卷调查的数据集共涉及1010份的150项问题的调查
+ columns.csv文件中记录了这150项问题的详细描述
+ 数据集中包含缺失值,即被调查者未填写的项目
+ 数据集中既有数值型数据又有字符型数据
+ 数值型数据代表认同程度从1到5程度逐渐增加
对于150项的调查内容,可以分为若干类别:音乐喜好、电影喜好、爱好和兴趣、厌恶、卫生习惯、个性特点、人生观、消费习惯和个人基本信息。
本案例结合调查问卷数据集,从零开始,实现关联规则领域的经典算法FPGrowth,找出数据集中隐藏的关联规则。