心血管疾病(cardiovascular disease,简称CVD)是指心脏和血管疾病的总称,常见的心血管疾病包括:高血压(血压升高)、冠心病(心脏病发作)、脑血管疾病(中风)、周围血管疾病、心力衰竭、风湿性心脏病、先天性心脏病和心肌病等。据世界卫生组织报道,在2012年约有1750万人死于心血管疾病,占全球死亡总数的31%。这些死者中,估计740万人死于冠心病,670万人死于中风;由于心血管疾病患者不断增加,心血管疾病的诊断与治疗成为医疗行业的一大重要问题。<br>
本案例基于Kaggle公开的心血管患者诊断数据,从患者生理指标、医疗检测指标和患者提供的主观信息出发,使用机器学习中的集成方法对患者是否患心血管疾病进行预测。首先我们对数据进行预处理和探索性分析;然后借助sklearn中的分类模型进行预测;最后比较不同分类器下的预测效果。