自然语言处理
分享
课程详情
课程评价
spContent=西湖大学张岳教授的自然语言处理课程上线中国大学慕课! 自然语言处理(NLP)是人工智能的一个重要分支,研究算法如何自动的理解和生成人类语言。本课程以机器学习理论和模型算法为核心,介绍自然语言处理技术基础。本课程适合高年级的相关专业本科生,和从事相关方向研究的硕士生和博士生。学习本课程之后,学生可以掌握自然语言处理领域的关键数学基础,轻松阅读前沿科技文献,具备深入模型设计和创新的基本条件。 张岳,西湖大学长聘教授。2003年毕业于清华大学计算机科学专业,获得学士学位;2006年毕业于牛津大学计算机科学专业,获得硕士学位;2009年毕业于牛津大学计算机科学专业,获得博士学位。2010年3月-2012年6月在剑桥大学计算机科学专业从事博士后研究。2012年7月-2018年8月在新加坡科技与设计大学担任助理教授。2017年3月起担任新加坡国立大学商学院荣誉研究员。2018年9月全职加入西湖大学工学院。 目前谷歌学术引用量超过1万次,H因子58。
—— 课程团队
课程概述

自然语言处理(natural language processing, NLP)是人工智能的一个重要分支,研究算法如何自动的理解和生成人类语言。近些年,自然语言处理受到了越来越多的关注,从智能检索到智能翻译、智能音箱、GPT等模型的影响十分广泛。


自然语言处理背后的基本技术是机器学习,自然语言的特性使得自然语言处理领域的机器学习技术具有自身的重要特点,而这些特点,也为整个机器学习领域的发展提供了重要贡献。理解自然语言处理背后的机器学习基础,为深入理解语言处理技术,灵活应用相关模型工具,进行研究和技术创新提供必要条件。


本课程以机器学习理论和模型算法为核心,介绍自然语言处理技术基础。本课程适合高年级的相关专业本科生,和从事相关方向研究的硕士生和博士生。学习本课程之后,学生可以掌握自然语言处理领域的关键数学基础,轻松阅读前沿科技文献,具备深入模型设计和创新的基本条件。


授课目标

掌握基础自然语言处理数学模型,深入理解领域前沿技术,具备阅读自然语言处理领域最新论文的必要知识,具备调整模型和技术创新的基础知识。

课程大纲
预备知识

预备知识:线性代数、微积分、概率论、算法基础。如果了解形式语言和自动机(第10章、第11章)、数值分析(第3章、第13章、第14章)、泛函分析(第4章)、信息论(第5章),会使相关章节部分内容的学习更加轻松。

证书要求

为积极响应国家低碳环保政策, 2021年秋季学期开始,中国大学MOOC平台将取消纸质版的认证证书,仅提供电子版的认证证书服务,证书申请方式和流程不变。

 

电子版认证证书支持查询验证,可通过扫描证书上的二维码进行有效性查询,或者访问 https://www.icourse163.org/verify,通过证书编号进行查询。学生可在“个人中心-证书-查看证书”页面自行下载、打印电子版认证证书。

 

完成课程教学内容学习和考核,成绩达到课程考核标准的学生(每门课程的考核标准不同,详见课程内的评分标准),具备申请认证证书资格,可在证书申请开放期间(以申请页面显示的时间为准),完成在线付费申请。

 

认证证书申请注意事项:

1. 根据国家相关法律法规要求,认证证书申请时要求进行实名认证,请保证所提交的实名认证信息真实完整有效。

2. 完成实名认证并支付后,系统将自动生成并发送电子版认证证书。电子版认证证书生成后不支持退费。


参考资料
  • 张岳,滕志扬,《Natural Language Processing - A Machine Learning Perspective》,剑桥大学出版社,2021年,ISBN-10 1108420214

  • Jurafsky, D., Martin, J. (2020) Speech and Language Processing, 3rd Edition. 


常见问题

Q :  本课程的考试方式是怎样的?

A :  本课程不设期末考试,通过习题和编程两种方式进行积分,以累计分数为最终评价标准。

Q :  我在学习课程的过程中是否需要编程?

A :  本课程以讲授数学建模知识为主,可以通过课后习题或者编程的方式通过考核。因此纯理论学习也可以优秀地通过本课程,但强烈建议有条件的同学进行相应编程。

Q :  我需要怎样的电脑才能完成课程的相应编程练习?

A :  一个具有基本配置的个人电脑即可完成自然语言处理课程的大部分编程练习,推荐:

  • 处理器:推荐具有i5或以上配置;

  • 内存:推荐8GB或以上;

  • 硬盘:推荐有256GB的存储空间;

  • 显卡:若需要使用GPU加速,请选择Nvidia GPU;

  • 操作系统:推荐使用Windows 10或Ubuntu 20.04及以上版本;

  • 开发环境:请安装Anaconda,以及相关的Python库,如NumPy,Pandas,Matplotlib,PyTorch等。

Q :  本课程的内容对我来说比较多,能否选择其中的一部分重点学习?

A :  根据时间和精力,本课程的第9章、第10章、第11章,以及第15章对应第9章、第10章和第11章的内容可以作为选修部分。完成这些部分的同学可以得到额外分数。

Q :  是否必须阅读英文版教材?

A :  不必须。幻灯片讲义里包含了尽可能多的细节。同学们可以根据讲授内容自己做笔记。本书中文版尚未推出。