**密歇根大学安娜堡分校数据科学硕士(M.S. in Data Science)** 该项目由计算机科学与工程、统计系、信息学院和生物统计学系联合开办。项目教授学生统计和编程的知识,培养学生在生物学、计算机科学等领域应用数据分析的能力。 网站链接为: https://lsa.umich.edu/stats/masters_students/mastersprograms/data-science-masters-program.html ### **专业要求:** 学生必须至少完成25个学分,包括18学分的高级课程(LSA/UMSI/CoE方向,课程代码在500上,SPH方向课程代码在600上)。 具体课程为: ### **必修课程:** |课程代码 |课程名称| |:---:|:---:| | MATH 403 | Introduction to Discrete Mathematics 离散数学导论| | EECS 402| Programming for Scientists and Engineers 数学和工程编程| | EECS 403| Data Structures for Scientists and Engineers 数据结构| | EECS 409| Data Science Colloquium 数据科学研讨| 下列三门中选择一门: |课程代码 |课程名称| |:---:|:---:| | BIOSTATS 601 | Probability and Distribution 概率分布| | STATS 425| Introduction to Probability 概率导论| | STATS 510 | Probability and Distribution 概率分布| 下列三门中选择一门: |课程代码 |课程名称| |:---:|:---:| | BIOSTATS 602| Biostatistical Inference 生物统计学推论| | STATS 426| Introduction to Theoretical Statistics 理论统计学导论| | STATS 511| Statistical Inference 统计推断| **数据管理和操作:** 下列两门中选择一门: |课程代码 |课程名称| |:---:|:---:| | EECS 484 | Database Management Systems 数据库管理系统| | EECS 584| Advanced Database Systems 高级数据库系统| 下列五门中选择一门: |课程代码 |课程名称| |:---:|:---:| | EECS 485 | Web Systems 网络系统 | | EECS 486 | Information Retrieval and Web Search 信息检索与网页搜索| | EECS 549/SI 650 |Information Retrieval 信息检索 | | SI 618 | Data Manipulation Analysis 数据分析| | STATS 507 | Data Science Analytics using Python 数据科学分析(Python)| **数据科学技术:** 下列三门中选择一门: |课程代码 |课程名称| |:---:|:---:| | BIOSTAT 650| Applied Statistics I: Linear Regression 应用统计学I:线性回归| | STATS 500 | Statistical Learning I: Linear Regression 统计学习I:线性回归| | STATS 513| Regression and Data Analysis 回归与数据分析| 下列课程中选择一门: |课程代码 |课程名称| |:---:|:---:| | STATS 415| Data Mining and Statistical Learning 数据挖掘和统计学习| | STATS 503| Statistical Learning II: Multivariate Analysis 统计学习II:多元分析| | EECS 545| Machine Learning 机器学习| | EECS 576| Advanced Data Mining 高级数据挖掘| | SI 670| Applied Machine Learning 应用机器学习| | SI 671| Data Mining: Methods and Applications 数据挖掘:方法和应用| | BIOSTAT 626| Machine Learning for Health Sciences 健康领域的机器学习| **实践课程:** |课程代码 |课程名称| |:---:|:---:| | STATS 504| Principles and Practices in Effective Statistical Consulting 统计咨询的原理和实践| | STATS 750| Directed Reading 定向阅读| | EECS 599| Directed Study 定向研究| | SI 599-00X| Computational Social Science 计算社会科学| | SI 691| Independent Study 独立研究| |SI 699-004| Big Data Analytics 大数据分析| | BIOSTAT 610| Reading in Biostatistics 生物统计阅读| | BIOSTAT 629| Case Studies for Health Big Data 健康领域大数据案例研究| | BIOSTAT 698| Modern Statistical Methods in Epidemiologic Studies 流行病学研究中的现代统计方法| | BIOSTAT 699| Analysis of Biostatistical Investigations 生物统计调查研究| ### **选修课程**: **数据科学原理方向:** 概率分布理论、随机过程、贝叶斯分析、计算数据科学和机器学习、数据压缩的理论与实践、信号处理、数据分析和机器学习的矩阵方法等 **数据分析方向:** 时间序列、广义线性模型、空间数据、非参数统计、多元分析等 **计算方向:** 软件工程、信息检索、统计计算、大数据计算、算法设计与分析等 ### **课程选择建议:** + 该项目要求先修2门代数课程、1门线性或高等代数课程、1门计算机编程入门课程 + 课程设置涵盖了很多方向的内容,可以选择不同学院下的课程,选课十分灵活 + 重视算法和编程的学生,可以选择机器学习、统计计算等课程;重视生物统计方向的学生,可以选择生物统计学推论、生物统计调查等课程