本课程为大学计算机通识教育课程,主要讲解数据科学的基础理论、思维方式、分析方法。本课程学习内容覆盖数据分析基本步骤、数据组织形式、数据存储格式、数据清洗、转换与合并、可视化展示、数据汇总和统计方法、机器学习方法及在文本、图像、语音等人工智能前沿领域的应用。学习内容有6个部分:
1.掌握Numpy、Pandas常用数据分析库的使用;
2.学会利用Matplotlib进行数据可视化分析;
3.学会机器学习建模分析方法;
4.了解文本数据分析;
5.了解图像数据处理,学习用深度学习的方法进行图像识别;
6.完成一份数据分析报告。
掌握数据分析的工作流程,学会用数据分析库实现数据预处理和建模分析,能够撰写数据分析报告。
1)完成所有课程的学习;
2)完成课后作业;(20分)
3)完成单元测试;(20分)
4)完成课堂交流讨论5次及以上;(10分)
5)完成课程大作业,撰写数据分析报告;(50分)
先修:大学计算机应用基础;任何一门程序设计语言。
[1]宋晖,刘晓强.数据科学技术与应用[M].电子工业出版社,北京:2018.
[2]余本国.基于Python的大数据基础及实战[M].中国水利水电出版社,北京:2018.
[3] WesMcKinney.利用Python进行数据分析[M].机械工业出版社,北京:2014.
Q : 我是非计算机专业的大一学生,能学这门课吗?
A : 这是一门通识教育课程,欢迎不同专业背景、不同年级的同学选学。跨专业融合,解决各专业领域的数据分析问题正是我们的课程目标。
Q : 这个课程讲很多理论和算法吗?
A : 本课程不讲深奥的理论,也不讲算法分析,课程致力于解决实际问题和专业领域的应用。
Q : 我没有学过Python能选修这门课吗?
A : 没有关系,只要有任何一门程序设计语言基础就可。当然,学过Python会有更多先发优势。
Q : 这门课对电脑及开发环境的要求怎样?
A : 普通配置的笔记本电脑、安装Anaconda(Python3.6)就可以。