本案例提供一份有关青少年爱好与生活习惯的数据集 主要收集年轻人的爱好和生活习惯 方面的信息. 问卷调查数据集的总体情况如下:
+ 该问卷调查的数据集共涉及1010份的150项问题的调查
+ columns.csv 文件中记录了这 150 项问题的详细描述
+ 数据集中包含缺失值,即被调查者未填写的项目
+ 数据集中既有数值型数据又有字符型数据
+ 数值型数据代表认同程度从 1 到 5 程度逐渐增加
对于150 项的调查内容, 可以分为若干类别: 音乐喜好、电影喜好、爱好和兴趣、厌恶、卫生习惯、个性特点, 人生观、消费习惯和个人基本信息。
本案例结合调查问卷数据集, 从零开始,实现关联规则领域的经典算法FPGrowth,找出数据集中隐藏的关联规则。