spContent=数据分析是在大数据背景下,对数据进行搜集、整理,辅以科学、合理的分析,并依据数据做出行业研究、评估和预测。数据分析是大数据技术专业学生必须掌握的应用技能,本课程是大数据技术专业的专业核心课。
数据分析是一项有序开展的工作,本课程以Python语言作为工具软件,以数据分析的工作流程必须具备的知识和技术作为学习内容,培养学生对数据资料的收集整理和处理分析能力,立足于学生职业能力培养和职业素养养成,突出课程的应用性和操作性。
在本课程的建设和发展过程中,形成了一支教学水平高、技术能力强、实践经验丰富的专家团队,在这里你将领略到不同教师的风采。
数据分析是在大数据背景下,对数据进行搜集、整理,辅以科学、合理的分析,并依据数据做出行业研究、评估和预测。数据分析是大数据技术专业学生必须掌握的应用技能,本课程是大数据技术专业的专业核心课。
数据分析是一项有序开展的工作,本课程以Python语言作为工具软件,以数据分析的工作流程必须具备的知识和技术作为学习内容,培养学生对数据资料的收集整理和处理分析能力,立足于学生职业能力培养和职业素养养成,突出课程的应用性和操作性。
在本课程的建设和发展过程中,形成了一支教学水平高、技术能力强、实践经验丰富的专家团队,在这里你将领略到不同教师的风采。
—— 课程团队
课程概述
· 我为什么要学习这门课?
随着网络技术的飞速发展,网络的应用已经渗透到社会生活的方方面面,每天在网络上都会产生大量的数据,我们正在创造着大数据时代。
但数据不等同于信息,我们只有学会了使用数据分析工具,才能从杂乱无章的数据中得到有价值的信息,形成有效结论,提高工作效率。
· 这门课的主题是关于什么?
大数据的出现,彻底改变了数据分析技术,传统的数据处理工具(类似于关系数据库管理系统),已经无法处理以容量大(Volume)、多样性(Variety)、价值高(Value)、速度快(Velocity)为主要特征的大数据。
本课程以python编程语言作为数据分析工具,通过Python第三方库的应用,结合真实案例,完整地讲解了数据表示、清洗、统计、分析、可视化等数据处理周期的主要技术内容,培养数据思维、计算思维及采用程序设计方法解决实际问题的技术能力。
· 学习这门课可以获得什么?
大家从这门课中可以学到以下内容:
1.Python第三方库NumPy,科学计算基础包,通过案例讲解N维数据的表达及科学计算的基本概念,以及基本的统计分析方法;
2.Python第三方库Pandas,数据分析和处理的核心库,通过案例介绍并讲解Series和DataFrame数据类型的表示、以及数据处理和分析的主要方法;
3.Python第三方库Matplotlib,2D数据图表的绘制库,通过案例讲解绘制柱形图、饼状图、散点图等直观展示数据趋势和特点的方法。
· 这门课有什么特色和亮点?
1.课程侧重于方法的应用和问题的解决,不过度强调通过复杂编程逻辑解决问题,避免纠缠于Python程序的细节;
2.案例丰富,课程教学结合具体的案例讲数据分析的实用操作,不做单纯的语法讲解和理论说明;
3.采用文学编程方式,在JupyterNotebook中进行交互式教学与实践,按照学习者的思维逻辑而不是计算机的逻辑顺序来编写代码;
4.便于开展移动学习和碎片化学习,满足个性化学习要求。
授课目标
1.知识目标
了解数据分析的相关概念和一般流程,以及使用Python语言进行数据分析的优势;
掌握NumPy库、Pandas库、Matplotlib库的使用,学会利用这些库进行数据的存储、处理、分析及展示的技术。
2.能力目标
培养学生数据抽取、处理、分析、应用的能力,以及使用Python语言解决实际问题的能力;
积累数据分析与处理的经验,提高知识的综合应用能力。
3.素质目标
通过编程培养学生认真负责的学习态度和严谨细致的学习习惯;
通过数据分析价值的体现,培养学生的自主学习意识和创新意识。
4.思政目标
在国家实施大数据战略的背景下,激发学生的专业认同感及责任担当的使命感;
在数据采集、处理的过程中,培养学生的法制意识和规范意识;
在数据分析的过程中正确了解数据价值,不断提升数字素养。
课程大纲
Python数据分析概述
课时目标:了解数据分析的概念、流程以及使用Python进行数据分析的优势;掌握Python数据分析集成开发环境的部署;初步学会Jupyter notebook的使用。
1.1数据分析的概念及流程简介
1.2用Python进行数据分析
numpy计算基础
课时目标:了解Numpy库的作用;掌握Numpy库中Ndarray对象的创建及常见数组操作;学会Numpy基本统计分析方法。
2.1 numpy数组的创建和运算
2.2 numpy数组的索引和切片
2.3 numpy矢量化编程和统计函数
pandas数据处理
课时目标:了解Pandas库的作用;掌握Series对象的创建及基本操作;掌握DataFrame对象的创建及基本操作;掌握数据处理的基本方法。
3.1 Pandas简介
3.2 Series的创建与常用属性
3.3 Series的基本操作
3.4 DataFrame的创建及常用属性
3.5 Pandas的基础操作(一)
3.6 Pandas的基础操作(二)
3.7 数据的排序
3.8 数据的连接与查询
Pandas数据分析
课时目标:掌握常见数据统计分析方法;学会对时间类型的数据进行分析。
4.1基本统计
4.2分组分析
4.3分布分析
4.4交叉分析
4.5结构分析
4.6时间数据分析(一)
4.7时间数据分析(二)
4.8实例:个人贷款数据分析
matplotlib实现数据可视化
课时目标:掌握Matplotlib库中pyplot模块绘制图形和设置图形属性的方法;学会将数据分析的结果通过常见的条形图、折线图、饼图等可视化呈现。
5.1matplotlib基础
5.2条形图的绘制
5.3折线图的绘制
5.4饼图的绘制
展开全部
预备知识
本课程需要学生对数组、矩阵、数据库相关知识有一定的了解,具备Python语言编程的基本知识和初步技能。
证书要求
成绩分为3个档次:小于60分为不合格,60分及以上、但小于85分为良好,大于等于85分为优秀。
课程考核重点关注学习过程,最终成绩评定包括三个方面:视频学习完成度(占比60%)、课堂讨论(占比20%)和单元测试(占比20%),具体标准可参看评分方式。
因为慕课平台现已经停止证书发放,本课程无证书。
参考资料
1.教材
《Python数据分析与应用》,北京邮电大学出版社,李国辉主编,2018年11月出版
2.参考资料
《Python程序设计教程》,清华大学出版社,杨年华、柳青、郑戟明主编,2017年10月出版
《Python学习从入门到实践》,清华大学出版社,王学颖、刘立群、刘冰主编,2017年12月出版