本课程主要面向非计算机专业学习者,不局限某个专业和学历层次,需要一些程序设计的基本概念如计算机求解问题的框架和一些如素数判断这样的基本算法,缺少上述基础的同学不用担心,在上课过程中可以根据课程自己进度补充一下相关知识就可以了。
整个课程以财经数据为基础,通过构建一个个喜闻乐见的案例,让大家可以以更直观的方式领略Python的简洁、优雅和健壮,同时探讨Python除了在商业领域之外在文学、社会学和新闻等人文社科类领域以及在数学和生物等理工类领域同样拥有便捷高效的数据处理能力,并可以触类旁通将其灵活应用于各专业中。整个课程分5个学习模块和1个项目实战模块,从Python基本语法开始,到Python中如何从本地和网络上进行数据获取,如何表示数据,再到如何对数据进行基础和高级的统计分析及可视化,到最后如何设计一个简单的GUI界面来表示和处理数据,层层推进。
主要介绍或项目使用到的Python第三方库有:Requests,BeautifulSoup,re,NumPy,pandas,Matplotlib,NLTK,Pillow绘图库,结巴分词,WordCloud词云图,Gensim。
单元测试/作业(包含编程,不包含实战项目和期末考试)完成后可获得平时分,“Python程序设计课程”平时分为10分,最终按比例折算
PS:由于本平台编程题较少,为提高编程能力,编程题部分请尽量到本校ftp站点(ftp://172.26.184.2)选择部分进行常规练习
本课程共分为6个模块(实际有新内容的课时为8周):
Module 01: Python基础
本模块主要讨论Python的基本语言结构、数据类型、基本运算、条件和循环、函数和模块等内容,用它们就可以写一些有用的程序了!
MODULE 02: 数据获取与表示
本模块主要讨论Python在本地数据和网络数据获取的方式,会使用Python中基础但功能十分强大的数据结构序列、字符串、列表、元组快速有效地数据表示以及做简单的数据处理。
MODULE 03: 强大的数据结构和Python扩展库
本模块主要讨论Python中高级的数据结构字典和集合以及Python最著名使用最广泛的科学计算包SciPy中ndarray、Series和DataFrame中的简洁高效的数据结构。
MODULE 04: Python数据统计和可视化
本模块可以让学习者从一堆数据中快速有效地挖掘出想要的或者期待的又或者是未知的结果,也可以将这些数据用各类图像来表示。另外将讨论Python中一些第三方包的数据统计功能。
MODULE 05: 面向对象和图形用户界面
本模块主要讨论面向对象,图形用户界面与面向对象的关系,这部分内容只要求理解概念,将来可以在用各种新函数时更自如更简单地上手,不要求写程序。另外图形用户界面的基本框架、常用的组建和布局管理也是重点讨论的问题,着重对GUI感性的认识。
MODULE 06: 实战项目
本模块由老师抛出若干个项目实例,学习者接招,从网络或现有数据集/语料库中爬取/获取数据并进行处理、分析和展示。
1.几个常用的网站
Python IDE下载:
(1) IDLE下载地址
(2) Anaconda下载地址(推荐安装)
清华大学(或其他国内)镜像(推荐,下载Python 3版本):https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
2.Python参考书籍和网站
(1) Python程序设计教程, 张莉, 金莹, 张洁, 陶烨, 高等教育出版社
(2) Python程序设计实践教程, 张莉, 陶烨, 薛景, 吕俊, 高等教育出版社
(3) Python编程 从入门到实践, [美]埃里克·马瑟斯 著, 人民邮电出版社
(4) SciPy科学计算:https://www.scipy.org/
(5) Wes McKinney, Python for Data Analysis. 东南大学出版社. (英文影印本,中译版名为《利用Python进行数据分析》)
Q : 这门课人文社科类专业的同学能听得懂吗?
A : 课程中尽量用简单的案例来让大家了解Python在相关方面的功能,只要认真听,多思考和多实践,特别是Python丰富的模块和库的认真细致的练习和思考,绝大部分内容是能够掌握的。
Q : 本课程是Python 2.x还是Python 3.x?
A : Python 3。