**杜克大学跨学科数据科学硕士(Master in Interdisciplinary Data Science)**是一个为期两年的项目。该项目主要教授学生专业领域知识,锻炼学生进行数据分析的能力。并希望学生具有成功所需的能力——沟通能力、批判性思维、创造力等。
网站链接为:https://datascience.duke.edu/
**专业要求:**
学生需要完成42学分的课业,其中包括必修课程、实践项目、实习,以及4个学期、共12选修学分的选修课程。
##### 核心课程:
|课程代码 |课程名称|学分|课程介绍|
|:---:|:---:|:---:|:---:|
|IDS 791| Data Science Dialogues 数据科学讨论|0.5(每学期)|提供从业人员和研究人员关于数据科学的理解|
| IDS 898 | MIDS Workshops MIDS研讨会|0.5(每学期)|通过研讨会增强软技能,如面试、谈判和人际交往|
|IDS 701 | Unifying Data Science 数据科学实践|3|如何使用数据回答不同类型的问题:描述性问题、因果推断、预测问题|
| IDS 707| Data Logic, Visualization, and Storytelling 数据逻辑、可视化和描述|1.5|学习数据可视化的原理,使用Tableau实现数据可视化|
|IDS 706 | Data Engineering Systems 数据工程系统|3|如何建立和管理数据库|
| IDS 705| Practicing Machine Learning 机器学习技法|3|有监督、无监督和强化学习技术|
|IDS 703 | Introduction to Natural Language Processing 自然语言处理概论|3|处理网络平台上的文本数据|
| IDS 702| Modeling and Representation of Data 数据建模及表示|3|广义线性模型、时间序列模型等统计模型|
|IDS 798| Capstone Project 实践项目|4|学生在第二年加入团队实践项目,处理问题并展示结果|
##### 实践训练:
实践训练为期一年,每学期4学分,目标是让学生参与跨学科研究项目。项目目的在于解决现实生活中的问题,学生在参与过程中,能够锻炼运用数据科学的能力。教授和学术指导会监督并指导项目的进行。
跨学科数据科学硕士项目中(MIDS)的每个学生必须为外部团体(如公司、政府机构或非营利组织)解决某些问题,并完成一份展示报告。最终评分将由MIDS教师和外部团体人员从多个维度进行评估,包括沟通能力、数据分析能力和创造力。
##### 暑期实习:
MIDS的学生需要完成暑期实习,以锻炼实践能力。杜克大学的工作人员可以帮助学生修改简历、模拟面试,并联系杜克大学校友和合作伙伴,以寻找暑期实习。
##### 暑期预学课程:
暑期中,MIDS学生将获得在线学习材料,以复习概率、分布、统计检验和线性代数。确保学生在秋季上课前,对Python、R、统计知识有必要的理解。
##### 选修课程:
项目提供多门选修课程。官网中展示了其中部分选修课程,以供学生参考。
|课程代码 |课程名称|课程介绍|
|:---:|:---:|:---:|
|IDS 721| Data Analysis at Scale in Cloud 大规模云数据分析|介绍云计算,包括大数据和机器学习知识|
|IDS 720|Practicing Data Science 数据科学实践|使用数据科学工具(git、Python等),处理复杂的真实数据|
###### 定量方面:
|课程代码 |课程名称|学分|
|:---:|:---:|:---:|
|COMPSCI 516 | Database Systems 数据库系统|3 |
|COMPSCI 531 | Algorithm, Paradigms 算法,范式|3|
|COMPSCI 532 | Design and Analysis of Algorithms 算法设计与分析 |3 |
|ECON 612 | Time Series Econometrics 时间序列计量经济学|3 |
|ECON 613 | Applied Econometrics in Microeconomics 微观经济学中的应用计量经济学 |3 |
|MATH 541 | Applied Stochastic Processes 应用随机过程|3 |
|MATH 561 | Numerical Linear Algebra, Optimization and Monte Carlo Simulation 数值线性代数,优化和蒙特卡洛模拟 |3 |
|MATH 563 | Applied Computational Analysis 应用计算分析 |3 |
|POLSCI 733 | Advanced Regression 高级回归分析|3 |
|POLSCI 748 | Advanced Quantitative Research Methods in Political Science 政治科学中的高级定量研究方法 |3 |
|PSY 767 | Applied Correlation and Regression Analysis 应用相关分析与回归分析 |3 |
|PSY 768 | Applied Structural Equation Modeling 应用结构方程建模|3 |
|PSY 770 | Applied Multilevel Modeling 应用多层次建模|3 |
|SOCIOL 720 | Survey Research Methods 调查研究方法|3 |
|SOCIOL 728 | Advanced Methods: Introduction to Social Networks 高级方法:社交网络简介|3 |
|STA 444 | Statistical Modeling of Spatial and Time Series Data 统计空间建模与时间序列数据|1|
|STA 561D | Probabilistic Machine Learning 概率机器学习|3 |
|STA 601 | Bayesian and Modern Statistical Data Analysis 贝叶斯和现代统计数据分析|3 |
|BIOSTAT 902 | Missing Data Analysis: Theory and Application 缺失值分析:理论与应用 |3 |
|BIOSTAT 904 | Causal Inference 因果推断|3 |
###### 特定领域方面:
|课程代码 |课程名称|学分|
|:---:|:---:|:---:|
|ARTHIST 508S | Art and Markets 艺术和市场|3 |
|CLST 544L | Introduction to Digital Archaeology 数字考古导论 |3 |
|BME 574 | Modeling and Engineering Gene Circuits 基因电路建模与工程|3 |
|CBB 540 | Statistical Methods for Computational Biology 计算生物学中的统计方法|3 |
|ECON 620 | Game Theory with Applications of Economics and other Social Sciences 博弈论与经济学和其他社会科学的应用|3 |
|PJMS 361S | Algorithms, Journalism and the Public Interest 算法、新闻和公众利益|1 |
|PSY 716 | Behavioral Decision Theory 行为决策理论|3 |
|PSY 762 | Functional Magnetic Resonance Imaging 功能性磁共振成像|3 |
|SOCIOL 534 | Topics in Population, Health, and Policy 人口、卫生和政策方面的话题|3 |
|SOCIOL 367S | Computational Social Science: Tools to Collect & Analyze Human Behavior Using Data from the Internet 计算社会科学:利用互联网数据收集和分析人类行为的工具|1 |
|NEUROBIO 735 | Quantitative Approaches in Neurobiology 神经生物学的定量方法|3 |
|PUBPOL 574 | Economic Evaluation of Sustainable Development 可持续发展的经济评估|3 |
|VMS 550S | Digital Humanities: Theory and Practice 数字人文:理论与实践|3 |
**课程选择建议:**
+ 项目要求学生有定量分析背景,证明申请者有优秀的沟通、解决问题能力
+ 学生可以根据自己的兴趣和背景来规划课程学习。技术背景较差的学生可以在第一年选修偏向技能学习的课程。技术能力较好的学生可以在第一年参加选修课,在第二年可以更专心于实践项目
+ 该项目重视培养学生的实践能力,希望应用数据分析解决实际问题的同学可以考虑申请