“大数据”这个概念几乎应用到了所有人类智力与发展的领域中。《大数据时代》这本书中有一句话:人类从依靠自身判断做决定到依靠数据做决定的转变,也是大数据作出的最大贡献之一。本课程从大数据解析的基本概念讲起,进而介绍大数据解析中常用的基础算法,包括数据预处理相关算法、判别分析、回归分析、聚类分析、决策树、典型相关分析、神经网络、自编码器和集成学习等,同时结合具体应用,帮助同学们深入学习数据挖掘的模型与方法,掌握大数据解析的钥匙,为各行业特别是工业大数据赋能。希望大家在学习的过程中,能够了解和认识到:本课程是一门实战性很强的基础课程,纸上得来终觉浅,绝知此事要躬行;抓准具体对象本身的特点、特性和问题,以问题驱动,而非以方法为导向,不要哪个方法热,追逐哪个,切忌脱离问题空谈花哨的方法;活用数据,不要迷信数据以及被数据绑架。
本课程的特色主要包括:
(1)本课程讲授大数据分析的基本原理、相关方法和实例分析,让学生能够形成大数据思维意识,加深对课程知识的理解。
(2)课程中介绍了大量的大数据应用案例,这些案例包括但不限于工业领域,为大家提供不同学科方向的思考和启发。
(3)课程之余鼓励学生主动发现和思考生活中的大数据场景,将课程内容与实际紧密结合。
本课程需要学习者具备概率论与数理统计、机器学习、Python语言编程的基本知识和初步技能。
为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。
电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。
完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。
认证证书申请注意事项:
1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。
2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。
本MOOC课程配套教材
从筹备到最后出版历经1年半多,我们的《大数据解析与应用导论》教材终于正式出版,成为浙江大学本科生专业选修课程、中国大学慕课同名课程的配套教材。自2018年本人首次独立申请并开设本课,累计独立完成7次线下授课,5次中国大学慕课线上授课,还在持续不断努力完善中。大家如有购书需求,可以在京东和当当等平台直接搜索书名购书。希望能在大家指导帮助下,不断修改完善我们的课程和教材。大家如有建议和问题可以直接联系本人,期待大家为教材修订提供宝贵意见。
其他参考资料:
[1] 赵春晖,余万科,柴峥,冯良骏. 运行工况监测与故障溯源推理:机器学习方法[M]. 化学工业出版社, 2022.(适合了解工业背景、工业机器学习方法和应用)
[2] 赵春晖,王福利. 工业过程运行状态智能监控:数据驱动方法[M]. 化工出版社, 2019.(适合了解工业背景、工业机器学习方法和应用)
[3] 周志华. 机器学习: Machine learning[M]. 清华大学出版社, 2016. (机器学习的西瓜书)
Q:每周会发布多少时间的内容?我需要多少时间来学习?
A:每节课的视频时长一般控制在25分钟以内,一般在10到20分钟左右。但是除了视频内容,课后还需要花费1:1到1:2的时间进行课后学习,包括预习、讨论、作业和复习的时间,一周花费的总时长大概是一到三小时。