最近接触到了一个数据分析竞赛平台**Kaggle**,通过分析上面的案例,从中学到了很多知识,推荐给对数据分析感兴趣的朋友~ ### 关于Kaggle 简单地介绍一下Kaggle,Kaggle主要是为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。 ![](http://cookdata.cn/media/bbs/images/1_1608469477410_5d14.jpg =900x*) 在这个平台中有很多数据集,这些数据集有一些是真实的数据集,是由一些公司提供的,致力于解决一个真实的问题,这就是我认为一个非常棒的地方,这些数据让并不是架空的,而是基于实际的。 ![](http://cookdata.cn/media/bbs/images/2_1608470092730_5d14.jpg =200x*) 进入Kaggle的网站可以看到如下的几个板块:竞赛、数据集、代码和讨论区,还提供了一个课程板块,里面有很多不错的课程,不过都是英文版的,大家也可以尝试一下~ ![](http://cookdata.cn/media/bbs/images/3_1608470826900_5d14.jpg =300x*) 找一个案例来看一下: ![](http://cookdata.cn/media/bbs/images/4_1608471097480_5d14.jpg =600x*) 这是一个关于2020年美国大选的案例,可以看到Kaggle的数据集更新是非常快的,有很多像这样的很新的数据。点击Data可以看到数据的相关描述: ![](http://cookdata.cn/media/bbs/images/5_1608471400356_5d14.jpg =600x*) 里面对数据集的描述是非常详尽的,很方便去挑选感兴趣的数据。 此外最重要的是,Kaggle平台的案例有很多公开分享的分析过程和代码,我们也可以自己做一个案例分析传上去~ ### 利用Kaggle来做什么 1.Kaggle里的数据集是非常丰富的,不管对什么方面的数据感兴趣,都可以在Kaggle找到相关的数据集。 2.不论是竞赛模块还是数据集模块,都有一些很优秀的公开案例,这些案例也是非常值得我们学习的,即使没法自己写一个案例,也可以通过优秀的案例学到很多东西的~ 3.如果更感兴趣的话,也可以找几个队友尝试一下参加Kaggle的竞赛,也是一种非常好的经历。 其他更详细的介绍可以参考如下链接: [https://www.jianshu.com/p/ce5cbf592711](https://www.jianshu.com/p/ce5cbf592711) [https://zhuanlan.zhihu.com/p/25686876](https://zhuanlan.zhihu.com/p/25686876) 希望大家都能有所收获哦~