SPOC学校专有课程
Python数据分析与数据可视化
分享
spContent=1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识; 2)掌握扩展库numpy数组运算与矩阵运算; 3)掌握扩展库pandas在数据分析与处理相关领域的相关技术; 4)掌握扩展库sklearn机器学习常用模型的实现与应用; 5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。
—— 课程团队
课程概述

数据分析、数据挖掘与数据可视化是一个古老的话题,并非什么新生事物。近些年来,借助于计算机软硬件的飞速发展,数据分析、挖掘、可视化相关理论和技术在各领域的应用更是有了质的飞跃。饭店选址、公交路线与站牌规划、物流规划、春运加班车次安排、原材料选购、商场进货与货架位置摆放、查找隐性贫困生、房价预测、股票预测、寻找黑客攻击向量、犯罪人员社交关系挖掘、网络布线、潜在客户挖掘、个人还贷能力预测、异常交易分析、网络流量预测、成本控制与优化、客户关系分析、商品推荐、文本分类、笔迹识别与分析、智能交通、智能医疗,这些都要借助于数据分析与挖掘相关的理论和工具才能更好更快地完成,而可视化则一直是用来辅助数据分析、挖掘进而做出正确决策的有力工具与技术。

数据分析、数据挖掘与数据可视化是一门综合性非常强的学科领域,既要掌握线性代数、统计学、人工智能、机器学习等大量理论知识,又要熟悉编程语言或相关软件的使用。

在众多编程语言中,Python应该是最适合做数据分析、数据挖掘和数据可视化的,其简洁的语法、强大的功能、丰富的扩展库以及开源免费、易学易用的低门槛特点,使得Python成为多个领域不可替代的语言。

课程主要内容和目标:

1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识;
2)掌握扩展库numpy数组运算与矩阵运算;
3)掌握扩展库pandas在数据分析与处理相关领域的相关技术;
4)掌握扩展库sklearn机器学习常用模型的实现与应用;
5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。

授课目标

1)掌握数据分析、挖掘、可视化时需要了解的Python基础知识;
2)掌握扩展库numpy数组运算与矩阵运算;
3)掌握扩展库pandas在数据分析与处理相关领域的相关技术;
4)掌握扩展库sklearn机器学习常用模型的实现与应用;
5)掌握扩展库matplotlib在数据可视化与科学计算可视化方面的应用。

成绩 要求

课程最终学习成绩由单元测验(60%)、考试(35%)、课程讨论(5%)这几部分组成。

课程大纲
参考资料
  1. 教材:《Python数据分析、挖掘与可视化》,董付国,人民邮电出版社

  2. 参考书:《Python可以这样学》,董付国,清华大学出版社

  3. 参考书:《Python程序设计开发宝典》,董付国,清华大学出版社

  4. 参考书:《Python程序设计》(第三版),董付国,清华大学出版社

  5. 参考书:《Python程序设计基础》(第二版),董付国,清华大学出版社

  6. 参考书:《Python程序设计基础与应用》,董付国,机械工业出版社