课程

中国大学MOOC,为你提供一流的大学教育

hi,小mooc
期末考试会员
SPOC学校专有课程
昆明-2021春-用Python玩转数据
第1次开课
开课时间: 2021年03月01日 ~ 2021年06月18日
学时安排: 2-5小时每周
当前开课已结束 已有 101 人参加
老师已关闭该学期,无法查看
spContent=欢迎来到《用Python玩转数据》,这是第10次开课,大壮老师会尽量用非计算机专业(需要有一些编程基础,最好学过一门程序设计语言,但不一定是Python)小伙伴们能听懂的方式讲述如何利用简单易学优雅的Python便捷地获取、表示、分析和展示数据,让大家愉快地学习用Python玩转数据。本期课程将应同学们的需要增加一些练习题,敬请期待!
欢迎来到《用Python玩转数据》,这是第10次开课,大壮老师会尽量用非计算机专业(需要有一些编程基础,最好学过一门程序设计语言,但不一定是Python)小伙伴们能听懂的方式讲述如何利用简单易学优雅的Python便捷地获取、表示、分析和展示数据,让大家愉快地学习用Python玩转数据。本期课程将应同学们的需要增加一些练习题,敬请期待!
—— 课程团队
课程概述

        本课程以财经数据为基础,通过构建一个个喜闻乐见的案例,让大家可以以更直观的方式领略Python的简洁、优雅和健壮,同时探讨Python除了在商业领域之外在文学、社会学和新闻等人文社科类领域以及在数学和生物等理工类领域同样拥有便捷高效的数据处理能力,并可以触类旁通将其灵活应用于各专业中。整个课程分5个学习模块和1个项目实战模块,从Python基本语法开始,到Python中如何从本地和网络上进行数据获取,如何表示数据,再到如何对数据进行预处理,探索,分析与统计及可视化,到最后如何设计一个简单的GUI界面来表示和处理数据,层层推进。


       主要介绍或项目使用到的Python第三方库有:Requests,BeautifulSoup,re,NumPy,pandas,Matplotlib,sklearn,NLTK,Pillow绘图库,结巴分词,WordCloud词云图,Gensim等。


授课目标

爱上Python,爱上数据分析,爱上用Python进行数据分析!

成绩 要求

MOOC课程测试、项目实践和期末测试(客观题)占总成绩60%,期末考试(主要为编程题,拟在SPOC课程中完成)占40%

课程大纲

MODULE 01: Python基础之第一周 走近Python

1.1  Python简介

1.2 第一个Python程序

1.3 Python语法基础

1.4 Python数据类型

1.5 Python基本运算

1.6 Python的函数、模块和包

补充视频:Python环境搭建

第一周 走近Python单元测验

MODULE 01: Python基础之第二周 Python面面观

2.1 条件

2.2 range函数

2.3 循环

2.4 循环中的break,continue和else

2.5 自定义函数

2.6 递归

2.7 变量作用域

拓展视频1:Python常用标准库函数

拓展视频2:异常

第二周 控制结构和函数编程练习(8题)

第二周 Python面面观单元测试

控制结构和函数编程题

MODULE 02: 数据获取与表示之第三周 数据获取与表示

3.1 本地数据获取

3.2 网络数据获取

3.3 序列

3.4 字符串

3.5 列表

3.6 元组

拓展视频1:正则表达式简介

拓展视频2:输入输出&函数式编程入门

拓展视频3:可变可迭代对象修改问题解释

拓展视频4:动态网页数据爬取小例

进阶:爬虫小项目(3项)

补充资料:序列运算、操作、函数和方法简介

第三周 数据获取与表示基础编程练习(3题)

第三周 数据获取与表示单元测试

数据表示编程题

MODULE 03: 第四周 强大的数据结构和Python扩展库

4.1 为什么需要字典

4.2 字典的使用

4.3 集合

4.4 扩展库SciPy

4.5 ndarray

4.6 变长字典Series

4.7 DataFrame

第4周拓展视频1:字典和集合编程示例介绍

第4周拓展视频2:NumPy常见应用选讲

第四周 强大的数据结构和Python扩展库单元测验

字典相关编程题

MODULE 04: Python数据统计与挖掘之第五周 Python便捷数据获取与预处理

5.1 便捷数据获取

5.2 Python绘图基础

5.3 数据探索与预处理之数据清洗

5.4 数据预处理之数据变换

5.5 数据预处理之数据规约

拓展:财经数据接口TuShare研究和数据处理分析小项目

数据集获取:数据预处理常用数据集titanic数据集获取

第五周 Python基本数据统计单元测验

MODULE 04: Python数据统计与挖掘之第六周 Python数据统计挖掘与应用

6.1 数据探索之基本数据特征分析

6.2 基于pandas的数据统计与分析

6.3 聚类分析

6.4 Python的理工类应用

6.5 Python的人文社科类应用

第6周拓展视频1:基于pandas的男女电影评分差异分析

第6周拓展视频2:基于随机森林模型的红酒品质分析

第六周 Python数据统计挖掘与应用单元测验

MODULE 05: 面向对象和图形用户界面

7.1 GUI与面向对象

7.2 抽象

7.3 继承

7.4 GUI的基本框架

7.5 GUI常用组件

7.6 布局管理

7.7 其他GUI库

7.8 综合应用

财经数据GUI编程项目

面向对象编程小练习

第七周 面向对象和图形用户界面单元测验

第八周 项目实践

项目实践说明

参考项目

第八周项目实践提交


展开全部
参考资料

1. Python环境

Python 平台/IDE下载:

(1)最基础的方式:使用Python IDLE(从Python官网下载)

(2)最省事的方式:使用Anaconda

从官网https://www.anaconda.com/products/individual或清华镜像站下载https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

【说明】安装Anaconda后使用其中的Spyder,也可使用Anaconda中包含的Jupyter Notebook(Anaconda装好后直接启动后可使用,可将所有代码和执行结果存放于一个ipynb文件中,且能编辑和重新执行代码,还支持Markdown等文本编辑标记语言);或安装PyCharm等其他Python IDE,相比较来说,Anaconda平台已安装的第三方库更全,需要额外安装的包非常少,但内核的稳定性不如PyCharm,可根据自身情况选择安装,较优化的做法是使用PyCharm,同时在PyCharm中将解释器设为Anaconda,充分结合两者的优势。若有一定的基础,也可使用如sublime和VSCode等编辑器,具体方式详见第一周文档说明和视频介绍~

2.Python参考书籍和网站

(1)  Python程序设计, 张莉, 金莹等. 高等教育出版社, 2019. 7

(2)  Python编程 从入门到实践, [美]埃里克·马瑟斯 著, 人民邮电出版社.

(3)  SciPy科学计算:https://www.scipy.org/

(4)  Wes McKinney, Python for Data Analysis. 东南大学出版社. (英文影印本,中译版名为《利用Python进行数据分析》)

(5) Python标准手册和其他相关Python库官网文档


源课程

该SPOC课程部分内容来自以上源课程,在源基础上老师进一步增加了新的课程内容

南京大学
1 位授课老师
张莉

张莉

教授

下载
下载

下载App