数据科学与大数据技术专业人才培养方案 |
、 数据科学与大数据技术专业人才培养方案
一、培养目标 本专业培养德、智、体、美、劳全面发展,熟练掌握大数据采集、处理、存储、分析与挖掘、可视化、应用与开发技术的基本理论和基本知识;能够承担企业、事业、政府和社会组织等部门的大数据设计、开发、分析和应用等方面工作,具有较强的创新意识、创业精神、创新创业能力和社会责任感的高素质应用型专门人才。 本专业学生毕业后5年左右能达成下列目标: 目标1. 掌握数学、自然科学、工程基础和数据科学与大数据技术专业知识; 目标2. 能在复杂大数据工程项目的设计、开发、应用及大数据运维部署等方面应用与本专业相关的科学、技术及工程基础知识,并具有分析问题与解决问题的能力; 目标3. 具有良好的团队合作、沟通交流和项目管理能力,能够作为团队成员或领导团队完成项目的实施,具备创新精神和创业能力; 目标4. 能跟踪学习数据科学领域的新技术,具有较强的终身学习和可持续发展能力; 目标5. 能适应环境变化和社会发展的需要,具有国际视野,把握时代特征与社会需求,具备良好的个人素质、职业道德、人文素养、专业素养和社会责任感。 二、培养规格 本专业毕业生应全面地理解工科公共基础知识,系统掌握数据科学与大数据技术基础理论和专业知识,具备综合运用基础理论和技术手段分析并解决复杂问题的能力;具备运用现代信息技术获取相关信息的能力;具备较好人文素养、社会责任感、良好的语言表达沟通能力和终身学习能力;具备团队精神和协作管理能力;具备一定的国际视野和外语水平。 具体而言,本专业学生毕业时应用达到的毕业要求如下: 1.工程知识:能够将数学、自然科学、计算机科学、工程基础和数据科学与大数据技术专业知识应用于解决复杂工程问题。 2.问题分析:能够应用数学、自然科学、计算机科学和数据科学的基本原理,对复杂工程问题进行识别、表达,以获得有效结论。 3.设计/开发解决方案:能够针对数据科学领域的复杂工程问题,综合考虑社会、安全、健康、法律、文化及环境等因素,设计与开发满足客户需求的产品,并体现创新意识。 4.研究:能够利用数据科学的相关原理和方法,进行复杂工程问题的研究,并通过数据收集、设计模型、信息挖掘和综合分析获得合理有效的结论。 5.使用现代工具:在大数据工程项目的生命周期中,能够开发、选择与使用恰当的技术、资源、现代工程工具和信息技术工具,包括对复杂工程问题的预测与模拟,并能够理解其局限性。 6.工程与社会:能够基于工程相关领域背景知识进行合理分析,评价专业实践和现实问题解决方案对社会、健康、安全、法律以及文化的影响,并了解技术人员应承担的相应责任。 7.环境和可持续发展:环境和可持续发展:能够基于人文社会科学以及环境工程等领域的相关背景知识,能够理解和评价大数据技术对环境、社会可持续发展的影响。 8.职业规范:具有人文社会科学素养、社会责任感,重视生命和健康,具备正确的世界观、人生观和价值观,具有责任心和社会责任感,能够理解并遵守工程职业道德和规范,履行责任。 9.个人和团队:能够在多学科背景下的项目团队中,理解团队合作的意义,及在系统的构思、设计、实现、运行的工程实践中,承担个体、团队成员以及负责人的角色,并开展有效的工作。 10.沟通:能够在大数据工程实践中,就复杂工程问题进行有效沟通和交流,包括撰写报告和设计文稿、陈述发言、表达清晰,并具备一定的国际视野,具备在跨文化背景下进行沟通和交流的能力。 11.项目管理:理解并掌握工程管理原理与经济决策方法,并能在多学科环境中应用。 12.终身学习:具有自主学习和终身学习的意识,有不断学习和适应发展的能力 培养规格与指标点分解:
三、学制与学分 1.学制:基本学制为4年,修业年限为4-6年。 2.学分:毕业最低要求总学分为180学分,其中通识教育选修课不少于8学分,专业任选课不少于6学分,创新创业实践不少于4学分,社会责任教育实践不少于5学分,劳动教育理论与实践不少于2学分。 四、毕业与授予学位 学生在规定的修业年限内,完成专业培养方案规定的课程和学分要求,考核合格,准予毕业,颁发普通高等学校全日制本科毕业证书。符合蚌埠学院学士学位授予条件规定的,授予工学学士学位。 五、主干学科、核心课程、特色课程与主要实践性教学环节 1.主干学科:数据科学与大数据技术、计算机科学与技术 2.核心课程及简介: 离散数学、数据结构、数据库系统原理、操作系统、Java程序设计、分布式存储与计算原理、Python程序设计、数据挖掘、统计分析 (1)离散数学 授课总学时:48;学分:3;课程性质:专业基础课 课程内容概要:通过本课程的学习,可以为学生学习后期的专业课及将来从事大数据开发和分析研究打下坚实的基础,也可以培养学生的抽象思维和严格推理的能力,并使学生掌握信息技术领域中的一些基本数学工具和方法。推荐教材或参考书目: [1] 屈婉玲,耿素云,张立昂.《离散数学(第2版)》.出版地:高等教育出版社,2019 [2] 方世昌.《离散数学(第3版)》.出版地:西安电子科技大学出版社,2019 [3] [美]Kenneth H. Rosen.《离散数学及其应用(第8版)》.出版地:机械工业出版社,2019 [4] [美] Richard,Johnsonbaugh 著,张文博 等 译.《离散数学(第8版)》.出版地:电子工业出版社,2020 [5] 张小峰、赵永升、杨洪勇、李秀芳编著.《离散数学》. 出版地:清华大学出版社,2016 (2)数据结构 授课总学时:48 ;学分:3;课程性质:专业基础课 课程内容概要:“数据结构”是计算机程序设计的重要理论技术基础,以抽象数据类型的观点组织和讲解线性表、树、二叉树、图等各种主要的数学模型并定义为相应的抽象数据型,给出各种物理表示法和有关算法,主要研究分析计算机存储、组织数据的方式。 推荐教材或参考书目: [1] 王红梅.《数据结构-从概念到C实现》.出版地:清华大学出版社,2017 [2] 严蔚敏.《数据结构 C语言版第2版》.出版地:人民邮电出版社,2018 [3] 秦锋,汤亚玲,程泽凯,储岳中,袁志祥.《数据结构 C语言版(第2版·微课版)》. 出版地:清华大学出版社,2022 [4] [美] MarkAllenWeiss.《数据结构与算法分析:C语言描述(第2版)》. 出版地:机械工业出版社,2019 [5] 王丽杰 等,《数据结构》,https://www.icourse163.org/course/UESTC-1002268006?from= searchPage (3)数据库系统原理 授课总学时:40;学分:2.5;课程性质:专业基础课 课程内容概要:介绍数据库系统的基本概念,数据库管理的规则和方法及数据库系统分析的常用工具和方法,包括数据模型、范式及范式分解、数据恢复及并发控制、关系数据库查询语言、E-R图的使用及数据库设计的一般方法。 推荐教材或参考书目: [1] 万常选.《数据库系统原理与设计(第3版)》.出版地:清华大学出版社,2017 [2] 刘亚军.《数据库原理与应用》.出版地:清华大学出版社,2015 [3] 萨师煊,王珊.《数据库系统概论(第5版)》.出版地: 高等教育出版社,2014 [4] 陆鑫.《数据库系统——原理、设计与编程(MOOC版)》.出版地:人民邮电出版社,2019 [5] 陈岭,《数据库系统原理》,https://mooc.study.163.com/course/1000031000#/info (4)操作系统 授课总学时:40;学分:2.5;课程性质:专业基础课 课程内容概要:本课程主要介绍操作系统的设计方法和实现技术,讲授众多操作系统的设计精髓及操作系统最新技术。包括操作系统各组成部分的概述,互斥性和同步性,处理器实现,调度算法,存储管理,设备管理和文件系统。 推荐教材或参考书目: [1]汤小丹.《计算机操作系统(第4版)》.出版地:西安电子科技大学出版社,2018 [2] [荷]Andrew S. Tanenbaum,Herbert Bos.《现代操作系统》.出版地:机械工业出版社,2017 [3] [美] William,Stallings.《操作系统――精髓与设计原理(第八版)》.出版地:电子工业出版社,2017 [4] 斯托林斯,布朗,庞丽萍.《操作系统——精髓与设计原理(第8版)》. 出版地:人民邮电出版社,2019 [5] 骆斌,《计算机操作系统》,https://www.icourse163.org/course/nju-1001571004 (5)Java程序设计 授课总学时:48;学分:3;课程性质:专业必修课 课程内容概要:本课程讲授Java EE平台的技术规范及相应的开发工具和API。涵盖JSP/Servlet、JDBC、RMI、事务、安全等。在此基础上,掌握几种流行的开源技术框架:Struts+Spring+Hibernate。通过学习本课程,应使学生掌握Java Web应用的开发过程和技术,能独立基于SSH框架设计并开发大中型的企业应用软件。 推荐教材或参考书目: [1] 龚炳江,文志诚.《Java程序设计(慕课版)》.出版地:人民邮电工业出版社,2016 [2] [美]梁勇.《Java语言程序设计(基础篇第10版)》.出版地: 机械工业出版社,2015 [3] [美] 凯 S.霍斯特曼.《Java核心技术 基础卷》.出版地:机械工业出版社,2016 [4] 戴远泉 , 李超.《Java高级程序设计实战教程》.出版地:人民邮电出版社,2018 [5] 卞璐等,《JAVA程序设计》,https://www.icourse163.org/course/SJU-1002087013 (6)分布式存储与计算原理 授课总学时:56;学分:3.5;课程性质:专业限选课 课程内容概要:本课程讲授大数据生态体系的各个模块的功能和开发技术。包括Hadoop体系中的HDFS,Hbase进行数据操作,MapReduce进行数据开发,YARN进行资源配置,Hive完成数据仓库,Pig进行数据分析,理解其基本原理,并通过实验掌握其操作和编程开发。 推荐教材或参考书目: [1] [美] 汤姆,怀特(Tom White) 著,王海,华东,刘喻,吕粤海 译《Hadoop权威指南:大数据的存储与分析》.出版地:清华大学出版社,2017 [2] 朱洁,罗华霖《大数据架构详解:从数据获取到深度学习》.出版地:电子工业出版社,2016 [3] [美]汤姆,怀特《Hadoop权威指南:大数据的存储与分析(第4版)》.出版地:清华大学出版社,2017 [4] Mahmoud Parsian,《数据算法:Hadoop/Spark大数据处理技巧》.出版地:中国电力出版社,2016 [5] 林子雨,《大数据技术原理与应用》. https://www.icourse163.org/course/XMU-1002335004 (7)Python程序设计 授课总学时:56;学分:3.5;课程性质:专业必修课 课程内容概要:通过本课程的学习,使得学生能够理解Python的编程模式,熟练运用Python基本数据类型和相关列表推导式、切片等特性来解决实际问题,熟练掌握Python分支结构、循环结构、函数设计以及类的设计与使用,熟练使用字符串方法,适当了解正则表达式,熟练使用Python读写文本文件,适当了解二进制文件操作,了解Python程序的调试方法,了解Python面向对象程序设计模式,掌握使用Python操作SQLite数据库的方法,掌握Python+pandas进行数据处理的基本用法,掌握使用Python+matplotlib进行数据可视化的用法,同时还应培养学生的代码优化与安全编程意识。 推荐教材或参考书目: [1] 王学军《Python程序设计》.出版地:人民邮电出版社,2017 [2] 黄红梅,张良均《Python数据分析与应用》.出版地:人民邮电出版社,2017 [3] [美] Wes McKinney等《利用Python进行数据分析》.出版地:机械工业出版社,2014 [4] [美]埃里克·马瑟斯《Python编程 从入门到实践》.出版社:人民邮电出版社,2016 [5] 嵩天等,《Python语言程序设计》, https://www.icourse163.org/course/BIT-268001 (8)数据挖掘 授课总学时:48;学分:3;课程性质:专业必修课 课程内容概要:通过本课程的学习,使得学生能够较为全面地了解机器学习这门学科的各类问题和方法论,主要包括监督学习、无监督学习和数据降维的主要学习算法。此外,本课程强调学生的动手能力,要求学生通过编程练习和典型应用实例加深理解,同时对机器学习的一般理论,如计算学习理论、采样理论等有所了解。 推荐教材或参考书目: [1] 吴建生等《数据挖掘与机器学习》.出版地:人民邮电出版社.2019 [2] 周志华《机器学习》.出版地:清华大学出版社,2016 [3] [美] Peter Harrington《机器学习实战》.出版地:人民邮电出版社,2013 [4] 雷明《机器学习:原理、算法与应用》.出版地:清华大学出版社,2019 [5] 礼欣等 《Python机器学习应用》, https://www.icourse163.org/course/BIT-1001872001 (9)统计分析 授课总学时:32;学分:2;课程性质:专业基础课 课程内容概要:通过本课程的学习,使学生能够熟练应用Python或R语言进行统计数据的收集、整理、分析、表述和解释,理解应用统计学的一些基本原理,掌握应用统计学的基本方法和技巧,能够揭示不确定性的随机现象所反映的内在规律性,为解决现实生活中出现的各种统计分析问题提供有力的分析工具。推荐教材或参考书目: [1] 朱雪宁等《统计分析》.出版地:北京大学出版社,2021 [2] 吴喜之等《多元统计分析——R与Python的实现》.出版地:中国人民大学出版社,2019 [3] 汪海波《R语言统计分析与应用》.出版地:人民邮电出版社,2018 3.特色课程及简介: C++面向对象程序设计、JavaEE技术、数据结构、算法设计与分析、Spark开发技术综合实训、大数据开发综合设计、网络安全、多媒体创作基础、 (1)C++面向对象程序设计(C013110) 授课总学时:56 ;学分:3.5;课程性质:专业必修课 特色类型:省级精品课程、大规模在线开放课程 课程特色:课程方案符合教育部计算机科学与技术教学指导委员会“高等学校计算机基础核心课程教学实施方案”精神,课程人才培养目标明确,教学理念先进,教学内容体系完整,教学方法及教学过程体现了先进性,具有创新性。教学视频知识点选择恰当,通俗易懂,制作精细;自编教材质量高,被40多所高校使用或馆藏;教师队伍结构合理;教学管理严格,教学特色鲜明。课程以“重实践、强能力、求创新”为目标,教学活动设计强调学生中心,突出学生学习兴趣和实际编程应用能力的培养。课程教学资源建设到位,网络教学资源丰富,能够促进学生和教师互动,满足学生个性化、自主性和研究性学习,有利于创新能力的培养。 课程网址:https://www.xueyinonline.com/detail/2430417(学银在线) (2)JavaEE技术(C015540) 授课总学时:32;学分:2;课程性质:专业任选课 特色类型:省级教学示范课 课程特色:通过本课程学习可以使学生能够掌握JAVA软件开发的基本理论、方法,能够掌握JAVAEE中的各种框架思想与技术,同时能够掌握进行软件系统开发的基本方法和运用,并能够进行正确的测试。学生将能够深入理解MVC、面向切面编程的思想以及单元测试技术,并能够掌握和理解常见的软件设计模式,能够运用先进的框架技术开发出完整的软件系统。 (3)数据结构(C062101) 授课总学时:64 ;学分:4;课程性质:专业基础课 特色类型:省级一流课程 课程特色:通过本课程的学习,可以从数据结构的逻辑结构、存储结构和数据的运算三个方面去掌握线性表、栈、队列、字符串、数组、广义表、树、二叉树、图和文件等常用的数据结构。掌握在各种常用的数据结构上实现的查找和排序运算。并对算法的时间复杂度和空间复杂性有一定的分析能力。最后能够针对简单的应用问题,选择合适的数据结构及设计有效的算法。 (4)算法设计与分析(C013563) 授课总学时:32 ;学分:2;课程性质:专业必修课 特色类型:赛学融合课程(程序设计类竞赛、大数据与人工智能类竞赛) 课程特色:本课程主要介绍不同算法的设计思想及其应用,通过对各种算法的介绍让学生掌握对不同的问题要思考不同的解决方法,并同时考虑算法的时间和空间效率问题。该课程对学生继续深入学习计算机前沿课程奠定良好的基础,也适合对参加程序设计类竞赛和大数据与人工智能类的同学加强算法设计能力,对学生的创新能力培养具有很好的促进作用。 (5)Spark开发技术综合实训(C017502) 授课总学时:1周;学分:1;课程性质:集中实践课程 特色类型:校企合作共建课程(安徽兰智大数据科技有限公司) 课程特色:通过本课程的学习,使学生熟练掌握Spark的各种工具的使用技巧及特效,并将其熟练运用于编程开发、数据分析等领域。结合实际的综合实训项目培养学生分析和解决问题的能力。 (6)大数据开发综合设计(C017504) 授课总学时:2周;学分:2;课程性质:集中实践课程 特色类型:校企合作共建课程(安徽兰智大数据科技有限公司) 课程特色:本课程将通过一个具体的案例让学生掌握大数据开发的完整过程,是对本专业前期学习成果的综合验证性课程。课程以校企合作方式开展,引入企业真实案例开展教学,使学生在一个特定的大数据场景下完成某一功能的开发,完成该课程将使学生具备初步的大数据开发能力。 (7)网络安全(C013333) 授课总学时:32 ;学分:2;课程性质:专业任选课 特色类型:省级思政示范课程 课程特色:本课程以网络安全相关法规及网络道德为主线,对学生进行思政教育,主要介绍网络统安全概述,防御策略,信息系统安全要素,保护等级划分准则;信息系统安全体系,主要包括:网络安全技术,包括:对称密码技术、非对称密码体系、访问控制技术、机密性保护技术、完整性保护技术、鉴别技术、数字签名技术、抗抵赖技术、安全审计和报警机制、公证技术等;网络安全实用技术,包括:防火墙技术、入侵检测及预警技术、漏洞检测技术、网络隔离技术、计算机病毒防范;公开密钥基础设施PKI,CA。 (8)多媒体创作基础及应用(C086301) 授课总学时:32;学分:2;课程性质:专业任选课 特色类型:国家级一流本科课程、专业教育与创新创业教育融合课程 课程特色:本课程是国家级一流线上线下混合教学课程。通过本课程的学习,学生能够掌握多媒体创作的基本过程、多媒体工具的使用并完成初步的多媒体作品开发。学习本课程后,学生可以使用相关知识技能参加计算机设计大赛、多媒体竞赛等相关赛事,有利于提高学生的创新创业能力。 4.主要实践性教学环节:包括军事训练、入学教育与安全教育、社会责任教育实践、毕业实习、毕业设计(论文)、创新创业实践、劳动教育理论与实践、Python程序设计课程设计、数据结构课程设计、分布式存储与计算原理综合实训、数据挖掘课程设计、Spark开发技术综合实训、大数据开发综合设计等。 六、课程结构及学时(学分)比例 本专业课程(集中安排的实践教学活动除外)分为通识教育必修课、学科专业基础课、专业必修课、专业限选课、专业任选课和通识教育选修课六大类。课堂教学总学时数(不含集中安排的实践教学活动学时数)为2354学时,其中通识教育必修课为666学时,占28.29%;学科专业基础课为816学时,占34.66%;专业必修课为408学时,占17.33%;专业限选课240学时,占10.20%;专业任选课96学时,占4.08%;通识教育选修课128学时,占5.44%。 本专业规定最低毕业总学分为180学分(含集中安排的实践教学活动学分)。其中通识教育必修课为38学分,占21.11%;学科专业基础课为48.5学分,占26.94%;专业必修课为24.5学分,占13.61%;专业限选课15学分,占8.33%;专业任选课6学分,占3.33%;通识教育选修课8学分,占4.44%;集中安排的实践教学活动(不含课内实验教学)40学分,占22.22%。 七、必要说明 1.人才培养方案根据《普通高等学校本科专业类教学质量国家标准》、《普通高等学校本科专业目录和专业介绍》、《工程教育专业认证》、《蚌埠学院关于制(修)订2021版本科人才培养方案的指导意见》及补充意见的要求制定。 2.数据科学与大数据技术专业具有新工科专业的引领性前沿、交融性学科、创新性属性、跨界性产业和发展性动态特征,专业建设坚持“学生中心、产出导向、持续改进”的办学理念。紧跟产业发展动态,注重实践解决复杂工程问题能力,培养熟悉智能算法,掌握数据分析与处理技术,具备跨界学习能力,面向未来产业发展的应用型人才。 3.创新创业教育 (1)通过强化工程训练、课程设计和毕业设计等实践性教学环节,培养学生的实践创新能力,把创新教育贯穿在理论教学的全过程。 (2)通过大学生成长与发展导师指导工作,使学生尽早加入教师科研团队,参与生产实践和科学研究,撰写学术论文,申报国家专利等。 (3)教师通过大数据与人工智能类、程序设计类等系列比赛,指导学生开展课外科技实践创新活动,申报开展大学生创新创业训练计划项目,扩大学生参与面,强化学生创新创业能力培养。 4.加强学科交叉与融合 (1)加强与计算机科学与技术等学科交叉融合,设置《软件工程》、《分布式机器学习》等专业任选课,拓宽学生专业知识面,加强复合型人才培养。 (2)依托校外实习基地合作企业(安徽兰智大数据科技有限公司),开设《Spark开发技术综合实训》、《大数据开发综合设计》企业课程共建,实现校企合作。 |