本案例为《机器学习实践》课程第四章分类模型配套案例。数据来自手机APP"Kalboard 360"的学习管理系统(LMS)。Kalboard 360旨在利用尖端技术来提升学校K-12教育的教育水平。数据集由480个学生记录和16个特征组成。这些特征分为三大类:
(1)性别和国籍等人口统计特征。
(2)学历背景特征,如教育阶段,年级和隶属教室。
(3)行为特征,如上课举手,访问资源,家长回答问卷调查,学校满意度等。
该数据集的收集来自两个学期:第一学期收集了245个学生记录,第二学期收集了235个学生记录。最后学生依据其总成绩被分为三类:
低:0-69、中:70-89、高:90-100。我们的任务是根据收集的数据预测学生的成绩等级。