lesson25笔记 - 基于视频分析与理解 的高级视觉任务
1. 基于视频分析与理解 的高级视觉任务 Tasks:
视频动作检测/识别(action detection/recognize)
视频描述(video caption(description))
2. Human action: 具有特定语义含义的人类/物体动作的集合.
Action analysis: recognition(分类) , decetion(场视频中的分段label)
3. 应用: 视频贴标签, 城市安防, 智能生活(机器人/智能空调手势)
4. 主要dataset:Hollywood/2 HMDB51 UCF101
5. 困难和挑战
6. 动作检测的一般传统方法:feature extraction-> feature encoding ->feature pooling, kmeans聚类到bag-of-words -> SVM classifier
7. 提升性能的关键: 特征提取, 特征pooling
8. 基于深度学习的动作分析方法
双路模型: fovea stream, context stream
几种特征融合的方法
9. 利用光流表征运动信息