本文将由新祥旭考研慧慧老师对2024年华东师范大学数据科学与工程专业考研进行解析。主要有以下板块:专业简介、招生人数、考试科目、参考书目、分数线、备考经验等几大方面。
一、专业简介
数据科学与工程专业致力于培养“数据科学家”与“系统架构师”,即掌握数据处理和管理的基础理论,具备深度数据分析和数据挖掘技能、以及对大数据处理和管理系统和工具的使用、设计和开发能力,深刻理解数据的获取、建模、管理、利用的全生命周期,熟知相关技术、系统和应用的前沿动态和计算机、统计等相关学科的知识,具有从事科学研究、教学或应用开发,以及独立主持本专业技术工作的能力,具备进行创造性研究所需要的基础理论与动手实践能力。具体而言:在“应用驱动创新”理念指导下,掌握数据科学与工程学科所需的数理统计、数值计算与优化等基础理论;掌握数据分析和数据挖掘的基本技术与方法;深刻理解数据的全生命周期管理;掌握大数据处理和管理工具与系统的使用,具备其设计与开发能力;了解大数据应用中需求分析、数据和应用建模、系统选型、应用设计、开发和实施的过程,具备合作进行系统和应用研发能力;了解典型大数据应用(特别是各类“互联网+”应用)的技术问题和解决方法。 学院承担了包括国家重点研发计划、国家重大专项、国家863、国家973、国家自然科学基金等一批重要科研项目。学院与金融、物流、教育、互联网营销等行业领域积极对接,成立了8个校企联合实验室。过去6年,学院分别与金融、通信、云计算企业合作,研发了两套系统,成果获得了2019年度国家科技进步二等奖、2020年度上海市科技进步一等奖、2017年度上海市和教育部两个科技进步一等奖。系统在交通银行、中国移动,以及优刻得得到成功应用,为打破支撑关键核心业务的数据系统的垄断,实施“替代工程”做出了贡献。全职成员中,“长江学者奖励计划”特聘教授3人,国家杰出青年基金获得者1人,教育部新(跨)世纪人才3人,国家海外优秀青年基金获得者1人,霍英东“青年教师基金”和“青年教师奖”获得者各1人,上海市优秀学科带头人1位,上海市青年科技启明星2人,上海市青年科技英才扬帆计划获得者2人。
主要研究方向:
01 (全日制)数据管理系统
02 (全日制)系统优化
03 (全日制)区块链数据管理
04 (全日制)数据中台与隐私计算
05 (全日制)教育科技
06 (全日制)物流科技与位置服务
07 (全日制)金融科技
专业课程:
学位基础课: 1)数据科学与工程理论基础; 学位专业课(必修): 1)大规模数据处理系统、2)机器学习; 学位专业课(选修): 1)数据库系统实现、2)数据存储系统与技术、3)高性能计算与并行计算、4)区块链系统与分享型数据库、5)数据科学与工程研究方法、6)深度学习和强化学习、7)开源软件开发与社区治理、8)计算教育学、9)数据中台、10)统计推断、11)计算机视觉、12)系统优化。
研究生毕业后主要去向:
研究生就业率达到100%,按照行业划分,接近50%的毕业生会进入互联网或科技行业,从事数据科学与工程学科相关的工作;30%的毕业生会进入国有企业和事业单位,成为金融、电信等领域的数据分析师或系统架构师;20%的毕业生选择攻读博士。整体上,数据学院研究生的薪资水平保持在一个高的水准。
二、专业目录
招生年份:2023年
拟招生人数:
全日制:32
推免上限:22
考试科目:
①101思想政治理论
②201英语(一)
③302数学(二)
④824数据科学与工程综合
初试范围:
824数据科学与工程综合:(1)数据结构与程序设计。数据结构的概念;算法及其时间和空间复杂度分析;常用线性结构:栈、队列,循环队列, 数组, 字符串等;线性结构的链式存储,链表、链式队列、链式栈;递归概念、递归程序设计、回溯法、广度优先搜索、深度优先搜索;列表:查找的概念,顺序查找与二分查找;哈希表:利用哈希表进行查找,哈希冲突的解决;排序的概念:排序算法(插入排序、冒泡排序、快速排序、堆排序、基数排序等);树:基本性质、常用存储结构、遍历算法、二叉树、二叉查找树、堆、二叉平衡树、多路树(B树);图:基本概念、存储结构、遍历算法、生成树、拓扑排序、最短路径;C++语言程序设计:数据类型、操作符和表达式、控制流程、函数、程序结构、数组、指针、结构、基本输入输出。 参考教材:克鲁斯(Robert L. Kruse)等著. 数据结构与程序设计——C++语言描述. 高等教育出版社,2001 (第1-12章) (2)数据管理系统及应用。数据库的基本概念:数据库、数据库管理系统、DBA;数据模型的基本概念:层次模型、网状模型、关系模型;关系模型:关系代数、关系演算;查询语言:SQL(DDL、DML);数据库设计:数据库模式、范式、ER图、逻辑设计、物理设计、约束的使用;事务处理:ACID属性、事务在程序中的使用方法、并发控制、日志、恢复;数据库的基本工作原理:数据的存储方式、索引、查询的执行方式、查询优化。参考教材:王珊、萨师煊,《数据库系统概论》第五版,高等教育出版社,2014年(第1-11章) (3)操作系统。系统调用概念与机制、常用文件与进程相关的系统调用(POSIX)、操作系统结构、微内核、虚拟机、单道程序、多道程序、运行态、就绪态、阻塞态、新建态、僵死态、进程、进程模型、线程、线程模型、进程控制块 (PCB)、陷入、抢占、FCFS进程调度、时间片轮转调度、优先级调度、多重队列调度、最短进程优先调度、两级调度、同步、互斥竞争条件、临界区、忙等算法、锁变量、原子操作、信号量、管程、消息、饿死、经典IPC问题、两阶段加锁、I/O 的各种控制方式、设备驱动程序、SPOOLing、死锁、死锁预防、死锁检测、死锁避免、银行家算法、RAM盘、磁盘、磁盘调度算法、时钟、终端设备、虚拟存储器、地址重定位、地址映射、逻辑地址、物理地址、固定分区、可变分区(动态分区)、交换、内碎片、外碎片、首次适配法、下次适配法、最佳适配法、最差适配法、分页、分段、页表、页表项、虚页、页框、多级页表、TLBs,翻译后援存储器(快表)、逆向页表、最近未使用页面替换算法(NRU)、先进先出页面替换算法(FIFO)、第二次机会页面替换算法、时钟页面替换算法、最久未使用页面替换算法(LRU)、软件模拟LRU算法 (NFU)、老化算法、Belady异常、系统抖动、工作集模型、工作集、文件系统、文件、目录文件、字符设备文件、块设备文件、硬链接、符号链接、目录项、i-node、超级块、打开文件表、文件系统安装、块高速缓存、文件系统的性能、一致性检查、文件系统安全性与保护机制。 参考教材:[荷] Andrew S. Tanenbaum / [荷] Herbert Bos著,陈向群 / 马洪兵等译, 现代操作系统(原书第4版)机械工业出版社,2017 (4)概率论与数理统计初步。样本空间与概率的基本概念:概率模型、条件概率基本概念、全概率定理和贝叶斯准则及它们的应用、独立性;离散随机变量,概率质量函数(分布列)的基本概念、常用离散概率分布(如伯努利分布、二项分布、几何分布、泊松分布等)、随机变量的函数、期望、均值与方差、常用离散概率分布的期望与方差计算和结论、多个随机变量的联合分布、事件条件下的随机变量与随机变量取特定值条件下的随机变量、条件期望、随机变量与事件的独立性、随机变量之间的独立性、多个随机变量的相互独立性;连续随机变量:连续随机变量、概率密度函数、累积分布函数、正态分布、多个随机变量的联合概率密度、连续随机变量的条件和独立性、连续贝叶斯准则及其应用;随机变量函数:随机变量函数的概念和其PDF计算方法、卷积的概念和计算方法、协方差和相关系数、条件期望和条件方差及其在估计中的应用;极限定理:马尔可夫和切比雪夫不等式、弱大数定理和依概率收敛、中心极限定理及其应用、强大数定理和以概率1收敛;随机过程初步:伯努利过程、泊松过程、离散时间的马尔可夫链;统计推断初步:贝叶斯统计推断的概念、点估计、贝叶斯最小均方估计、经典参数估计、线性回归、假设检验、显著性检验。
复试范围:
1. 上机考试:主要考查学生运用计算机编程解决问题的能力,上机语言为C、C++、Java或Python。
2. 运用专业基础知识的综合能力(口试),相关基础知识包括高等数学、离散数学、数据结构、操作系统、数据库系统、分布式系统、概率论与数理统计、机器学习与数据挖掘等。
3. 外语听力、口语测试。
三、推荐参考书目
Dimitri P. Bertsekas, John N. Tsitsiklis著,郑忠国,童行伟译.《概率导论(第2版,修订版)》. 人民邮电出版社. 2016(第1-9章)
参考书目仅供建议,考生还需根据考试范围自行进行拓展阅读
四、2023年复试分数线
300(不接受调剂)
统考计划14
五、2022年拟录取名单
学科 |
研究方向 |
第一单元 |
第二单元 |
第三单元 |
第四单元 |
初试总分 |
复试总分 |
初复试总分 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
73 |
69 |
131 |
121 |
394 |
440.4 |
407.9 |
0835Z1数据科学与工程 |
01当代数据管理系统 |
68 |
75 |
112 |
127 |
382 |
440.4 |
399.5 |
0835Z1数据科学与工程 |
09分布式计算系统 |
67 |
83 |
104 |
111 |
365 |
431.6 |
385 |
0835Z1数据科学与工程 |
06教育科技 |
65 |
70 |
130 |
91 |
356 |
417.4 |
374.4 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
80 |
73 |
111 |
93 |
357 |
412.6 |
373.7 |
0835Z1数据科学与工程 |
01当代数据管理系统 |
75 |
71 |
134 |
92 |
372 |
376.2 |
373.3 |
0835Z1数据科学与工程 |
01当代数据管理系统 |
66 |
81 |
96 |
114 |
357 |
409.4 |
372.7 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
72 |
77 |
127 |
90 |
366 |
370.8 |
367.4 |
0835Z1数据科学与工程 |
09分布式计算系统 |
69 |
76 |
95 |
112 |
352 |
395 |
364.9 |
0835Z1数据科学与工程 |
01当代数据管理系统 |
67 |
75 |
81 |
121 |
344 |
413.4 |
364.8 |
0835Z1数据科学与工程 |
06教育科技 |
68 |
65 |
121 |
100 |
354 |
383 |
362.7 |
0835Z1数据科学与工程 |
05金融科技 |
60 |
69 |
126 |
92 |
347 |
394 |
361.1 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
55 |
58 |
90 |
123 |
326 |
428.6 |
356.8 |
0835Z1数据科学与工程 |
05金融科技 |
71 |
68 |
98 |
107 |
344 |
384.2 |
356.1 |
0835Z1数据科学与工程 |
01当代数据管理系统 |
67 |
59 |
127 |
83 |
336 |
402.8 |
356 |
0835Z1数据科学与工程 |
05金融科技 |
65 |
75 |
98 |
94 |
332 |
410.4 |
355.5 |
0835Z1数据科学与工程 |
05金融科技 |
64 |
70 |
98 |
93 |
325 |
404.2 |
348.8 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
52 |
53 |
78 |
124 |
307 |
445.2 |
348.5 |
0835Z1数据科学与工程 |
02当代人工智能与应用 |
67 |
62 |
106 |
82 |
317 |
390 |
338.9 |
六、2022年报考录取数据
报考数:85
录取数:19
七、复试备考建议
华东师范大学实行差额复试,差额比例一般不低于120%,复试还是需要引起大家的注意,在往年也有考研初试成绩很靠前但是复试被刷的案例,这个值得大家注意。新祥旭考研专注一对一辅导,发展至今建立了庞大的师资库,不管是普通专业还是稀缺专业,新祥旭都能为考生提供对口学长学姐的针对性指导,辅导内容包括但不限于:
1、对口专业的导师介绍(院系特点、导师性格、发邮件细节)等;
2、对口专业的专业课笔试辅导(知识体系梳理、重难点讲解);
3、复试当中的口语辅导;
4、复试当中简历的优化指导;
5、往年复试重点、难点精讲等;
6、提供复试资料、面试技巧(面试问题、注意事项、复试信息)等;
7、个性化指导(特殊专业、情况个性化指导)
保障同学们从笔试、面试等各个环节上得到充分的准备,全程跟进学习进度,学起来效率会很明显的提高。为初试成绩不占优势的考生在复试考核中逆袭,打赢最后一场攻坚战!
【来源新祥旭考研慧慧老师,未经允许,禁止转载与抄袭】