【课程概述 】
本课程将首先介绍自然语言处理的发展现状与挑战,同时,讲解深度学习和自然语言处理的结合应用。除了基本算法外,本课程还配备实践环节,从一些典型的方向:机器翻译、文本分类、问答等。最后,将和大家讨论NLP的行业展望以及和各行各业的结合,比如医疗行业等。
【讲师介绍】
玖强,新加坡南洋理工大学博士
精通算法,软硬兼修,目前主要研究方向是计算机视觉和自然语言处理结合,例如,图像/视频理解, 图像/视频自动描述生成,人机对话,多模态检索。在算法和神经网络方面,侧重卷积神经网络,递归神经网络,增强学习,对抗学习,无监督学习等。发表多篇人工智能及计算机视觉顶级会议和期刊,包括CVPR、ICCV、AAAI oral、PR等,并为多个会议和期刊审稿人。曾在中科院参与负责基于龙芯的安全芯片项目,后成功转行深度学习领域,讲课风格深入浅出通俗易懂,有独家学习和转行经验。
【课程目录 】
第一模块 NLP发展历史介绍和展望
- NLP发展现状
- 传统NLP方法面临的挑战
- Big Data和Deep Learning给NLP带来的变革和机遇
- NLP的发展趋势,以及和各行各业的结合应用
第二模块 NLP基础技能
一、数学理论基础
- 概率和信息论
- 监督学习、半监督学习和非监督学习
- 分类与回归模型
二、自然语言基础
- Word vector与Word embedding
- 什么是分词、词性标注、依存句法分析等?如何利用开源工具包完成
- 什么是统计自然语言处理?
三、深度学习技术
- 卷积神经网络详解
- 递归神经网络详解
- 深度学习常用工具包解析
第三模块 NLP与深度学习应用
一、文本检索
- 什么是文本检索?
- 语言模型以及文本表示
- 检索模型训练以及测试(文本匹配)
- 如何评价检索到的文本好坏?
- PyTorch实践: 基于RNN的文本检索和图文检索模型搭建,训练以及测试
二、文本生成
- 什么是文本生成?
- 文本生成的基本模型
- 如何评价生成的文本?什么是生成评价指标?
- PyTorch实践: 基于RNN的机器人写古诗
- PyTorch实践:Image captioning/图像描述自动生成最新方法讲解与实践
三、文本分类
- 什么是文本分类?
- 基于CNN的文本分类模型
- 基于RNN的文本分类模型
- PyTorch实践: CNN文本分类模型 VS RNN文本分类模型
四、机器翻译
- 什么是机器翻译?
- 机器翻译的统计学上的数学定义
- 机器翻译(seq2seq)模型
- PyTorch实践: 搭建并训练基于RNN的encoder-decoder中英翻译模型
- PyTorch实践: 拓展练习之--股票预测。
五、问答系统
- 问答系统介绍
- 基于检索式的传统问答系统
- 基于生成模型的问答系统
- 如何评价系统好坏?
- 如何生成更复杂的对话,情感和图片交互等?
- PyTorch实践: 基于RNN实现一个基本的问答模型
- PyTorch实践:Visual question answering结合图像信息的问答模型实践
【学习方式 】
在线听课 + 在线答疑 + 交流互动 + 社区辅导
Q:参加本门课程有什么要求?
A: 本次课程适合具备一定编程基础的开发人员,以及对自然语言处理和深度学习有兴趣的践行者。
Q:会有实际上机演示和动手操作吗?课程是否提供代码和数据集?
A:有,课程进行中涉及实战项目老师都会准备上机演示部分,学员可以学习老师的实践经验。并会提供详细代码和数据;
Q:本课程怎么答疑?
A:本次课程老师会集中直播答疑。