¥
支付方式
请使用微信扫一扫 扫描二维码支付
请使用支付宝扫一扫 扫描二维码支付
开通会员,立省599元 立即开通
文本摘要常用方法:
文本的压缩和融合一般用于生成信息更加紧凑的摘要,获得更好的摘要效果,常用方法包括:
句子融合技术主要是合并两个或多个包含重叠内容的相关句子得到一个句子
文本复述生成技术通过对给定文本进行改写,生成全新的复述文本,一般要求文本的输入和输出在表达上不同,但是表达的意思基本一样。应用领域:
文本复述的方法:
示例模型:
其他方法包括:
Teacher forcing algorithm:一个模型在生成一个摘要时使用参考摘要,并且该模型在每生成一个新单词时会被分配一个逐词误差。
文本标签
人的理解,需要学习过程
对上节问题的改进:
Local Attention
local-m(Monotonic alignment)
local-p(Predictive alignment)
attention模型与encoder-decoder模型的区别在于:attention模型不要求编码器将所有输入信息都编码进一个固定长度的向量之中。相反,此时编码器需要将输入编码成一个向量序列,而解码的时候,每一步都会选择性的从向量序列中挑选一个加权后的向量进行进一步处理。这样,在每产生一个输出的时候,都能够做到充分利用输入序列携带的信息。
近年来,增强学习的加入,是的模型的准确率又得到了进一步的提高。(最大的奖励或者最小的惩罚)
Golbal与Local方法应混合使用,以达到最好效果。
基于Pivot的联合训练可以用于零资源语言翻译。
文本匹配是自然语言理解中的一个核心问题,经常应用于信息检索、自动回答、机器翻译、机器对话等领域。
文本匹配面临的挑战:
文本匹配的层次包含:词语组成短语、短语组成句子、句子组成段落、段落组成篇章。
传统文本匹配主要是通过相似度计算来展开,需要大量的人工一定和抽取的特征,存在人工代价大、不精确、性能低等问题。
基于深度学习的方法:
基于DL的文本匹配可分为三种类型(此处不太明白,需要重新听一下):
DL文本匹配已经被应用于词性标注、词法分析、情感分析、关系分类等领域了。CNN、RNN是其主要方法。
关于PyTorch
命令行编程时PyTorch的关键特性
Mac下安装:
消除歧义:
词法模糊:冬天能穿多少穿多少,夏天能穿多少穿多少
句法模糊:是(老男人)和女人呢,还是年老的(男人和女人)?
谐音误解
预期违背
同文异读
指代
应用领域:
文本分类/情感分析
问答
对话
机器翻译
图像描述生成
图像问答
基于图像的对话
调整学习率:
调整学习率(learning rate)可以帮助跳出局部最小值
两种类型的分类算法:
1. 生成式模型(Generative):联合概率模型
2. 判别式模型(Discriminative):条件概率模型
NLP发展现状
传统NLP方法面临的调整
大数据和深度学习给NLP带来的变革和机遇
NLP的发展趋势,以及和各行各业的结合应用
自然语言处理具体应用领域:
(文字或语言)检索
基于深度学习的自然语言处理还可以应用于:
文本分类/情感分析
问答/对话/图像问答/基于图像的对话
机器翻译
图像描述生成
深度学习与人工智能的关系:人工智能是宏观上的概念,从技术上来说,主要是用到了机器学习技术,而机器学习中有一种算法是神经网络算法,神经网络是分层的,当层数大于3层时,我们一般就把这样的网络称为深度网络,而目前的深度学习算法就是经过一定的预处理之后,训练深度网络的算法。目前主要有卷积神经网络与循环神经网络。
NLP applications:
文本分类;sentiment analysis
Q & A
dialogue agents
machine translation
image captioning
visual Q & A
visual dialog
NLP工程师课程---课时1 NLP发展历史