**密歇根大学安娜堡分校数据科学硕士(M.S. in Data Science)**
该项目由计算机科学与工程、统计系、信息学院和生物统计学系联合开办。项目教授学生统计和编程的知识,培养学生在生物学、计算机科学等领域应用数据分析的能力。
网站链接为:
https://lsa.umich.edu/stats/masters_students/mastersprograms/data-science-masters-program.html
### **专业要求:**
学生必须至少完成25个学分,包括18学分的高级课程(LSA/UMSI/CoE方向,课程代码在500上,SPH方向课程代码在600上)。
具体课程为:
### **必修课程:**
|课程代码 |课程名称|
|:---:|:---:|
| MATH 403 | Introduction to Discrete Mathematics 离散数学导论|
| EECS 402| Programming for Scientists and Engineers 数学和工程编程|
| EECS 403| Data Structures for Scientists and Engineers 数据结构|
| EECS 409| Data Science Colloquium 数据科学研讨|
下列三门中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| BIOSTATS 601 | Probability and Distribution 概率分布|
| STATS 425| Introduction to Probability 概率导论|
| STATS 510 | Probability and Distribution 概率分布|
下列三门中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| BIOSTATS 602| Biostatistical Inference 生物统计学推论|
| STATS 426| Introduction to Theoretical Statistics 理论统计学导论|
| STATS 511| Statistical Inference 统计推断|
**数据管理和操作:**
下列两门中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| EECS 484 | Database Management Systems 数据库管理系统|
| EECS 584| Advanced Database Systems 高级数据库系统|
下列五门中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| EECS 485 | Web Systems 网络系统 |
| EECS 486 | Information Retrieval and Web Search 信息检索与网页搜索|
| EECS 549/SI 650 |Information Retrieval 信息检索 |
| SI 618 | Data Manipulation Analysis 数据分析|
| STATS 507 | Data Science Analytics using Python 数据科学分析(Python)|
**数据科学技术:**
下列三门中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| BIOSTAT 650| Applied Statistics I: Linear Regression 应用统计学I:线性回归|
| STATS 500 | Statistical Learning I: Linear Regression 统计学习I:线性回归|
| STATS 513| Regression and Data Analysis 回归与数据分析|
下列课程中选择一门:
|课程代码 |课程名称|
|:---:|:---:|
| STATS 415| Data Mining and Statistical Learning 数据挖掘和统计学习|
| STATS 503| Statistical Learning II: Multivariate Analysis 统计学习II:多元分析|
| EECS 545| Machine Learning 机器学习|
| EECS 576| Advanced Data Mining 高级数据挖掘|
| SI 670| Applied Machine Learning 应用机器学习|
| SI 671| Data Mining: Methods and Applications 数据挖掘:方法和应用|
| BIOSTAT 626| Machine Learning for Health Sciences 健康领域的机器学习|
**实践课程:**
|课程代码 |课程名称|
|:---:|:---:|
| STATS 504| Principles and Practices in Effective Statistical Consulting 统计咨询的原理和实践|
| STATS 750| Directed Reading 定向阅读|
| EECS 599| Directed Study 定向研究|
| SI 599-00X| Computational Social Science 计算社会科学|
| SI 691| Independent Study 独立研究|
|SI 699-004| Big Data Analytics 大数据分析|
| BIOSTAT 610| Reading in Biostatistics 生物统计阅读|
| BIOSTAT 629| Case Studies for Health Big Data 健康领域大数据案例研究|
| BIOSTAT 698| Modern Statistical Methods in Epidemiologic Studies 流行病学研究中的现代统计方法|
| BIOSTAT 699| Analysis of Biostatistical Investigations 生物统计调查研究|
### **选修课程**:
**数据科学原理方向:**
概率分布理论、随机过程、贝叶斯分析、计算数据科学和机器学习、数据压缩的理论与实践、信号处理、数据分析和机器学习的矩阵方法等
**数据分析方向:**
时间序列、广义线性模型、空间数据、非参数统计、多元分析等
**计算方向:**
软件工程、信息检索、统计计算、大数据计算、算法设计与分析等
### **课程选择建议:**
+ 该项目要求先修2门代数课程、1门线性或高等代数课程、1门计算机编程入门课程
+ 课程设置涵盖了很多方向的内容,可以选择不同学院下的课程,选课十分灵活
+ 重视算法和编程的学生,可以选择机器学习、统计计算等课程;重视生物统计方向的学生,可以选择生物统计学推论、生物统计调查等课程