本节课讲解 CS231n 课程的主要内容。
- 视觉识别的一个主要问题——图像分类,以及和图像分类相关的目标检测(Object detection)、图像摘要生成(Image captioning)、动作分类(Action classification)等等。
- 目标检测相比于对一整幅图像的分类,需要在图像中标出边界框(bounding box) 确定不同目标的位置。
- 图像摘要则为一副图像生成一句话来描述该图像的内容。
- 深度学习能够在2012年后飞速发展的主要原因:
- 计算能力提升:包括CPU的提升和GPU的出现。
- 数据:由于互联网的发展和技术进步,数据获得了数量级的增长。