物理学(师范)专业开设数据科学
与大数据技术类通识课初探
——以“数据酷客”课程为例
蒋茂华,胡 锋,杨 芳,牟 琳,文 林
(重庆师范大学物理与电子工程学院,重庆 401331)
蒋茂华,博士,副教授,研究方向为激光技术、大数据应用;
胡锋,博士,副教授,研究方向为动物群体决策行为;
杨芳,博士,讲师,研究方向为天体物理计算;
牟琳,硕士,实验师,研究方向为自动控制;
文林,博士,副教授,研究方向为量子物理。
**摘要:**本文阐述了大数据与物理学的紧密关系,分析目前物理学(师范)专业毕业生所面临的挑战,提出了在物理学(师范)专业中开展数据科学与大数据技术类通识课的重要性。以北京博雅大数据研究院的“数据酷客”课程为例,设计了具体的课程设置方案。
**关键词**:数据科学与大数据技术;通识课;物理学(师范)专业
**中图分类号**:G642
**文献标识码**:A
**文章编号**:2095-5065(2019)02-0089-06
## 引言
近40年来,信息技术社会经历了IT信息时代、互联网时代、移动互联网时代、大数据(BigData)时代等形态,并逐步进入人工智能(AI)时代。随着物联网、云计算等技术不断涌现,大数据引领了一场信息技术新革命,其蓬勃发展的同时,也作为一种新兴思维方式全方位地影响着人们的生活。
基于大数据技术的重要性,本文论述了在物理学(师范)专业中,开设数据科学和大数据技术类通识课的必要性和紧迫性。
## 1、物理学与大数据的关系
1.1复杂性科学与大数据紧密相连
20世纪80年代,复杂性科学成为物理学研究的新热点。复杂性科学的研究路径是学科互涉和思维融贯,它的产生标志着一种新的科学范式的形成。大数据技术与复杂性科学属于同种科学范式[1],两者具有极大的关联性,均属于系统思想的范畴,分别是系统思想的科学表述与技术实现。从复杂性科学的兴起发展到大数据时代是历史的必然选择,一方面,复杂性科学为大数据技术的诞生奠定了坚实的科学基础;另一方面,大数据技术是复杂性科学理念的延续与技术实现[2]。
1.2大数据技术促进物理学科发展
现阶段,通过科学研究获取的数据量急剧增长。这些数据来自科学实验装置、探测设备、传感器及计算机。若干学科的发展依赖于对这些海量数据的分析(见表1)。

从表1看出,高能物理、光学遥感、计算生物学、天文学领域已进入大数据时代,而这些领域都有众多的物理工作者参与。大数据与物理学有着极为密切的关系,属于广义物理学的范畴。
## 2、物理学(师范)专业教学现状
从历史角度,师范类高校物理学专业的开设,是应对师资严重缺乏时期的一种集高等教育、职业教育为一体的教育模式。因此,师范类高校的物理学专业在开展专业课的同时,还要对学生进行教育学、心理学、教育实践等职业素养训练。因此,师范类高校物理学专业课程设置比综合性高校物理学专业课程设置少,同时科研水平要略低于综合性高校物理学专业。因此,物理学(师范)专业毕业生的师范职业教育训练超于物理学(非师范)专业毕业生,但在专业知识、科学素养上稍逊一筹。
物理学(非师范)专业毕业生在科研、企事业单位发挥重要作用,物理学(师范)专业毕业生多在学校里从事教学工作,这两类毕业生少有交集。
随着社会的发展,人们的就业形势、择业观念也发生改变,综合性高校的毕业生也开始进军教育行业。他们通过教育学、心理学等方面的职业培训,获得在学校(如中小学)从事教学工作的资格。因此,综合性高校毕业生到学校工作的比例日益增大,给师范类高校毕业生就业带来冲击。
虽然综合性高校毕业生在从事中、小学教育工作时,存在职业教育不够系统的问题,但是可以通过工作后的培训、教学经验积累得到补充和完善,而他们在专业知识和科学素养的优势则是师范类高校毕业生很难超越的。原因是中、小学教师的教学任务繁重,很难有时间从事科研工作,同时也缺乏科研条件。日积月累,综合性高校毕业生的业务能力有可能超越师范类高校毕业生。
目前没有研究成果和实际情况表明师范类高校毕业生日后会被综合性高校毕业生取代,但作为从事物理学(师范)教育的工作者,应该深刻了解这种危机的潜在性,积极把准时代脉搏,使教育实践和课程设置具备一定前瞻性。
大数据和数据科学是当前最具代表性的技术发展方向。开设相关通识课可以提升学生跨学科视野和科学思维方式,尤其是对本来就在科学素养方面落后的物理学(师范)专业,开设此类课程显得尤为重要。
## 3、数据科学与大数据技术类课程的重要性
物理学(师范)专业的学生毕业后的主要就业方向是成为中小学教师,本文从物理学教师这一职业来论述大数据技术的重要性。
**(1)树立教师的知识权威。**
大数据时代给很多职业带来冲击,如律师、会计、翻译等。而教师受到的影响也将愈发明显。
随着大数据技术的广泛应用,学生获取知识的渠道不再局限于课堂,而课堂的形式也丰富为线上线下等多种形式。在这种情况下,学生可能在信息获取方式上超越教师。教育形式必将从以课堂和教师为中心,向以学生为中心转移。如果教学不及时应用大数据技术,必然会被时代所淘汰。对于跟不上时代潮流的人,大数据时代的来临削弱了传统意义上的教师是知识权威的形象;大数据应成为给教师教育教学提供帮助的利器。
因此,在大数据时代,掌握大数据技术成为教师的基本素养。
**(2)教育工作更有成效。**
大数据已经在教育工作中得到应用,通过采集学生信息,得出学生的学习情况,并预测其心理、生理健康,有针对性地对问题进行预防并开展提前教育。例如,通过校园一卡通和手机定位,获得学生的活动轨迹、消费行为、考试成绩、在网络平台上的逗留时间、与教师互动的时间、学生与学生互动的时间等信息,从而分析评估出学生的学习、生活、健康情况。
某些高校已经在这些信息的采集和分析上进行很好的尝试,在预防学生心理问题、提高学习成绩等方面取得较好效果[7]。
可见,了解、掌握大数据技术,能帮助教师更好地掌握学生的情况,进而更好地实施个性化教育。
**(3)增加学生就业信心。**
当下物理学(师范)专业毕业生就业面临着与以往不同的环境,与各类学校、不同专业的毕业生包括一些有着明显就业优势的工科专业毕业生竞争。一些工科专业毕业生通过相关职业培训,获得物理专业的教师资格,同时具备物理知识结构和物理学(师范)专业的优势,在专业竞争中更胜一筹。物理学(师范)专业毕业生仅靠职业素养、专业知识、科学素养很难赢得用人单位的青睐。数据科学与大数据技术类通识课,无疑是提升师范类学生就业竞争力的选项之一。笔者就以上情况申请试用北京博雅大数据研究院的“数据酷客”课程,对107位参与学习的学生进行了问卷调查。大数据学习重要性调查结果如图1所示。
通过对大数据的学习,学生普遍认识到掌握大数据知识对未来就业的重要,同时经过学习,学生的就业信心和专业信心显著增加。

## 4 、开设数据科学与大数据技术类课程初探
数据科学与大数据技术类课程包含一个庞大的技术体系,其领域学科包括:计算机科学、数学、知识产权、伦理学和所应用领域的专业知识等;其科目包括:概率论和统计数学、线性代数、机器学习、数据结构、数据库挖掘、数据可视化等;软件框架概念包括:Hadoop、MapReduce、SparkYARN、SQL、TensorFlow、Deep Learning、HDFS、HBase、Graph Analysis等;编程语言包括:Python、R、MATLAB、Scala等。
如何在一门课时有限的通识课程中,使学生最大程度地了解数据科学与大数据技术类课程内容框架,同时掌握与物理学研究、教学相关的基本技能?这需要教师对课程精心设计安排。
经充分调研、分析,本文提出物理学(师范)专业数据科学与大数据技术类通识课程设置框架,如图2所示。

本课程建议在大二下学期、大三上学期开设。此时,学生掌握了数学基础、计算机基础知识、编程语言。
课程以Python为基本编程语言,第一部分是基础知识。主要是数据科学与大数据技术类课程框架概述(如基础知识、基本应用),介绍数据科学与大数据技术类的基本概念和技术架构、Python语言的基本语法,同时介绍最基本的机器学习理论。通过这一阶段的学习,学生应该对整个大数据和数据科学有轮廓性的了解。
第二部分是数据科学基础。主要从数据获取到数据分析,介绍如何用数据科学来处理问题,让学生对数据科学的全流程进行全貌性的了解。
第三部分大数据基础及应用。是介绍Hadoop 这种目前大数据技术领域最常用的生态系统,随后进行数据可视化介绍,让学生认识到可视化的重要性,最后运用所学的知识在物理学问题中进行实践。
笔者参照这个安排申请试用了北京大数据研究院博雅大数据学院“数据酷客”课程,同样对107位参与学习的学生进行问卷调查。大数据学习效果调查结果如图3所示。

从图3看出,通过酷客数据的试用,大部分学生学习大数据的兴趣提高,对大数据的认识加深,学习大数据的信心增强,而且有接近一半的学生愿意在研究生阶段选择大数据专业。课程设计达到预期的效果,提升了学生的大数据意识和思维。
## 5、结语
我国高等教育已经进入新的发展阶段。未来几十年,新一轮科技革命和产业变革将与我国加快转变经济发展方式形成历史性交汇,这对高等教育提出了新要求。
从整体发展趋势看,无论是信息技术的发展,还是国家政策指引,开设数据科学与大数据技术类通识课都是非常必要的。其将成为人人都需要具备的基本素养和技能,对于物理学(师范)专业来说,更是胜任未来工作的基础。因此,进行相关课程的培养就显得尤为紧迫和重要。
【参考文献】
[1] 武杰,孙雅琪.复杂性科学的学科特征及其哲学境界[J].自然辩证法研究,2017,33(7):112-117.
[2] 黄欣荣.从复杂性科学到大数据技术[J].长沙理工大学学报(社会科学版),2014,29(2):5-9.
[3] 陈刚.高能物理粒子实验中的大数据技术[J].技术,2016,7(1):3-9.
[4] 李学龙,龚海刚.大数据系统综述[J].中国科学: 信息科学,2015,45(1):1-44.
[5] 赵晓娟,朱子清,李奇奇,等.大数据思维及其在生物医学领域的应用[J].基因组学与应用生物学,2018,37(5):2139-2143.
[6] 安涛,武向平,洪晓瑜,等.SKA大数据的科学应用和挑战[J].学科与领域,2018,33(8):871-876.
[7] 吕红胤,连德富,聂敏,等.大数据引领教育未来:从成绩预测谈起[J].大数据,2015(4):118-121.
> 本文刊发于《工业和信息化教育》2019年2月刊。