· 我为什么要学习这门课?
随着网络技术的飞速发展,网络的应用已经渗透到社会生活的方方面面,每天在网络上都会产生大量的数据,我们正在创造着大数据时代。
但数据不等同于信息,我们只有学会了使用数据分析工具,才能从杂乱无章的数据中得到有价值的信息,形成有效结论,提高工作效率。
· 这门课的主题是关于什么?
大数据的出现,彻底改变了数据分析技术,传统的数据处理工具(类似于关系数据库管理系统),已经无法处理以容量大(Volume)、多样性(Variety)、价值高(Value)、速度快(Velocity)为主要特征的大数据。
本课程以python编程语言作为数据分析工具,通过Python第三方库的应用,结合真实案例,完整地讲解了数据表示、清洗、统计、分析、可视化等数据处理周期的主要技术内容,培养数据思维、计算思维及采用程序设计方法解决实际问题的技术能力。
· 学习这门课可以获得什么?
大家从这门课中可以学到以下内容:
1.Python第三方库NumPy,科学计算基础包,通过案例讲解N维数据的表达及科学计算的基本概念,以及基本的统计分析方法;
2.Python第三方库Pandas,数据分析和处理的核心库,通过案例介绍并讲解Series和DataFrame数据类型的表示、以及数据处理和分析的主要方法;
3.Python第三方库Matplotlib,2D数据图表的绘制库,通过案例讲解绘制柱形图、饼状图、散点图等直观展示数据趋势和特点的方法。
· 这门课有什么特色和亮点?
1.课程侧重于方法的应用和问题的解决,不过度强调通过复杂编程逻辑解决问题,避免纠缠于Python程序的细节;
2.案例丰富,课程教学结合具体的案例讲数据分析的实用操作,不做单纯的语法讲解和理论说明;
3.采用文学编程方式,在JupyterNotebook中进行交互式教学与实践,按照学习者的思维逻辑而不是计算机的逻辑顺序来编写代码;
4.便于开展移动学习和碎片化学习,满足个性化学习要求。
1.知识目标
了解数据分析的相关概念和一般流程,以及使用Python语言进行数据分析的优势;
掌握NumPy库、Pandas库、Matplotlib库的使用,学会利用这些库进行数据的存储、处理、分析及展示的技术。
2.能力目标
培养学生数据抽取、处理、分析、应用的能力,以及使用Python语言解决实际问题的能力;
积累数据分析与处理的经验,提高知识的综合应用能力。
3.素质目标
通过编程培养学生认真负责的学习态度和严谨细致的学习习惯;
通过数据分析价值的体现,培养学生的自主学习意识和创新意识。
4.思政目标
在国家实施大数据战略的背景下,激发学生的专业认同感及责任担当的使命感;
在数据采集、处理的过程中,培养学生的法制意识和规范意识;
在数据分析的过程中正确了解数据价值,不断提升数字素养。
成绩分为3个档次:小于60分为不合格,60分及以上、但小于85分为良好,大于等于85分为优秀。
课程考核重点关注学习过程,最终成绩评定包括三个方面:视频学习完成度(占比60%)、课堂讨论(占比20%)和单元测试(占比20%),具体标准可参看评分方式。
因为慕课平台现已经停止证书发放,本课程无证书。
本课程需要学生对数组、矩阵、数据库相关知识有一定的了解,具备Python语言编程的基本知识和初步技能。
1.教材
《Python数据分析与应用》,北京邮电大学出版社,李国辉主编,2018年11月出版
2.参考资料
《Python程序设计教程》,清华大学出版社,杨年华、柳青、郑戟明主编,2017年10月出版
《Python学习从入门到实践》,清华大学出版社,王学颖、刘立群、刘冰主编,2017年12月出版