------------ 听完郭平教授的天文大数据与计算智能的讲座后,我对大数据技术和实际应用场景有了更深的理解。随着互联网,移动智能终端等通信技术的迅猛发展以及计算机储存和计算能力的不断提升,全世界的数据量越来越大,大数据时代悄然而至,其中我想重点谈谈天文大数据与计算智能这两方面。 ## 一,天文大数据 哈佛教授维克托·迈尔-舍恩伯格曾在《大数据时代》一书里写到:“天文学,信息爆炸的起源”。在天文学领域,海量数据处理向来是迫切需要解决的问题,许多大型巡天项目会持续产生并积累大量图像,光谱,星表以及模拟数据,这对传统天文研究提出了挑战,需要大数据技术的帮助。然而我们发现,天文学本身就是一个良好的可以用来发展大数据技术的平台。天文领域的大数据不仅具备了数据大量,多样,速度,精度,复杂这些特点;还拥有其不可替代的优势——面向基础自然科学研究,不以挖掘商业价值为目的。因此其发展不用考虑侵犯个人隐私,危害国家发展的问题,能实现全球范围内的数据资源公开和共享,且有很重大的科学意义。下面来介绍一下天文大数据的实例。2015年9月14日,激光干涉引力波天文台(LIGO)探测到引力波信号。作为人类首次直接探测到引力波信号,尽管事先已经做了充足的准备,但仍然遇到了大数据的挑战,如下图所示。![](http://cookdata.cn/media/bbs/images/IMG_20201214_142011_1608719003969_5d14.jpg) ![](http://cookdata.cn/media/bbs/images/IMG_20201214_141637_1608719115129_5d14.jpg) 此外还有LSST项目拍摄的预计达到70PB的图像文件等。在天文学领域,各种观测都会收集到海量数据,甚至还要包括环境温度、气压、风力、电场等,这些数据的处理即需要基于实时的粗略分析,通知专业天文台关注某一事件;也需要大量的数据存储和调用,以便做更深入的分析研究。天文领域作为信息爆炸的起源,相对其他大数据应用场景有不可替代的优势,是一个发展大数据技术的良好平台。同时我还认识到,天文大数据与我们之前学过的大数据平台、数据治理等都是息息相关的,这些是解决大数据实际问题的基本工具和方法。 ## 二,计算智能 计算智能的起源可以追溯到19世纪布尔和摩尔根提出的“思维定律”,计算智能的目的是了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。随着大数据技术的进步,计算机可以通过模拟生物的一些组织结构,并结合大数据本身具有的多视角和高冗余的特点,成功实现了遗传算法,浅层学习和深度学习等多个巨大的成就。当然大数据分析在计算智能中的应用是需要先验知识的,要建立精确的计算模型,且常常会遇到环境变化问题、不断演化问题、不确定性问题以及NP难问题。针对这些问题的策略便是要设计大数据的快速算法、优化传统算法效率、降低算法的计算复杂度,使得随着数据规模的膨胀,计算时间可以保持在在可接受的范围内。在物理学中的光纤光谱图像校正难题方面,科学家基于计算智能中的第一性原理思维,提出并实现了无监督学习方案,成功发展了基于机器学习技术的光纤光谱图像校正框架。在大数据技术的推动下,计算智能将会带来许多好处,会深刻地改变我们的生活。我逐渐认识到,计算智能的讲解与我之前听欧高炎教授关于人工智能与深度学习的讲座有诸多联系之处,计算智能可以挖掘数据的许多潜在价值,推动科学技术的进步,其中数据分析和数据治理很关键。 ## 三,展望 2018年10月31日中央政治局第九次集体学习关于人工智能发展现状和趋势,可见国家对大数据技术越来越重视。作为一门多学科交叉的综合性前沿学科,理论上仍不成熟,技术上还需突破,基于各种生物原理的设想是其继续前进的源泉,人类社会面临的各种科学问题是其不断发展的动力。相信在不远的未来,当天文大数据分析与计算智能可以有机结合应用起来,我们就既能洞察宇宙全貌,也能深刻地理解一些特定天文现象的原理,并推动科学进步。