【中英字幕】卡耐基梅隆大学 2019 春季《神经网络自然语言处理》

[展开全文]

颛顼 · 2019-04-12 · 预测句子中的下一个单词 3

其中课程的代码在：https://github.com/neubig/nn4nlp-code

其中第一章的数据在data/classes里面

这个课程属于简介，使用了dynet这个神经网络包做了BOW（词袋模型）和CBOW（连续词袋模型）以及Deep CBOW（深度连续模型），还是很轻松的

[展开全文]

小黑在此 · 2019-03-08 · 课程介绍以及使用神经网络做自然语言处理的原因 2

[展开全文]

颛顼 · 2019-04-18 · 词向量和词模型 1

[展开全文]

颛顼 · 2019-04-24 · 针对文本的卷积神经网络 1

实验内容学习

1、环境配置

第二讲之前要先进行一下实验的学习。因为第一讲内容的编码使用的是pytorch 所以要先进行安装。但是anaconda国内镜像（清华和科大）已经停止更新和维护，因此需要恢复原chanel方法是：conda config --remove-key channels

重新配置默认源

但是安装速度很慢，有两种方式解决

（1）pytorch1.1的源文件很大有427M，我参考了网上的方法并改了下参数下载速度很快，使用pip命令进行安装。

pip install http://download.pytorch.org/whl/cu90/torch-1.1.0-cp36-cp36m-win_amd64.whl

实践证明是可以这么安装的，但是anconda更新的时候，却仍然要在更新一次，但我感觉应该也可以用。

（2）如果发现试了两次安装仍很慢，赶紧使用其他运营商的线路进行更新。在我十多次使用移动家庭宽带无法更新后，我使用校园网的VPN更新时仅尝试一次就成功更新。因为校园网是双路由选择，所以及时换线路，在https://pytorch.org/ 官方网站上找到命令，使用conda install 命令进行更新就可以。

2、代码测试

课程代码地址为：

https://github.com/neubig/nn4nlp-code

先做完第一节的内容，再做第二节

本节内容

本节内容主要是讲解LSTM在编码过程中的debug、run过程中的调参tricks和一些其他的策略，包括minibatch的选择、dropout、学习策略的选择等。

大部分内容都可以在论文regularizing and optimizing LSTM language Models中找到

[展开全文]

莉达•布鲁斯 · 2019-05-26 · 预测句子中的下一个单词 0

如何完成句子的分类？这个就是句子分类的任务，将句子分为5个类别，我们可以使用词袋模型来完成这个任务

将每一个单词使用词袋模型表示向量，每个向量的维度都是5（我是这样理解的这个语料库中词的数量只有5个，所以词典大小就是5），然后加起来就是整个句子的向量，然后我们就可以使用这个向量完成softmax的分类了，但是这样的词袋模型完成分类会有一些问题，因为我们是一个词一个词的在向量表示，很有可能出现don‘t like的情况

出现这种情况的原因是don’t‘单独向量化了，然后love单独向量化了，二者并没有结合在一起

而神经网络可以解决这个问题，它可以将元素特征进行组合

我们不对每一个bow向量进行相加，而是把它们放到神经网络中得到score得分，然后进行softmax分类，得到最终该文本的类别

这个是连续词袋模型，将每个词的向量加起来之后，乘以一个矩阵W，假如加起来的词的向量维度是100维，那么w的维度就是5*100，所以最终的输出维度为5维的向量，正好完成分类任务

这样处理只是降低了维度，仍然是线性表示，仍然没有组合特征，如何才能组合特征？

[展开全文]

auto_瑞伊•林奇 · 2019-09-22 · 课程介绍以及使用神经网络做自然语言处理的原因 0

Sentence Classification

Bag of Words (BOW)
- 每个单词都有这五种element 相关度 [very good, good, neutral, bad, very bad]。
- 最简单的做法就是将句子中每个单词对于这些 element 相关度加总，可以取最高值来当作这个句子的表现。
- 当句子有特定字词可能会来改变结果 (例如：don't, nothing...)
- 可以透过 neural net 来 extract combination features
Continuous Bag of Words (CBOW)
- 将每个单词相转换成许多 features (例如：positive words)
- 将 features 加总后，透过这个 features 来预测这个句子的 element
Deep COBW
- 透过运算来将不同的 feature 进行 combine，再来透过这个结果来预测这个句子的 element