网络新媒体技术

2023, v.12;No.68(02) 11-18

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于播放速率预测的自监督视频表征算法研究
Research on Self-supervised Video Representation Algorithm Based on Playing Rate Prediction

靳巾,张育嘉,徐叙远,刘孟洋

摘要(Abstract):

时空特征学习对于视频无监督表征至关重要。基于前置任务的视频自监督表征方法被证明是有效的方式之一。其中,视频播放率预测的前置任务能够以无监督的方式学习时序特征,近年来得到广泛的讨论。然而,播放速率预测任务只探讨了单个样本的自监督标签,忽略了不同目标的运动频率差别;播放率预测任务的损失函数将所有标签的权重视为均等,而忽略了不同预测标签间与真值间的差距;传统的播放速率预测任务只使用单层分类层用于播放速率预测,影响视频表征的整体性能。针对上述3个问题,提出了一种改进的播放速率前置任务。该方法在训练时创新性地使用对照样本,并使用EMD距离优化不同预测样本和真值间的损失函数,同时使用更深的神经网络预测层,缓解预测任务对视频表征的影响。本文所提出的方法在公开数据集UCF-101和HMDB-51进行仿真实验,比较了所提出方法与传统方法的性能增益。实验表明,改进的播放速度前置任务有较好的视频表征效果。

关键词(KeyWords): 视频表征;自监督学习;前置任务;神经网络;动作识别

Abstract:

Keywords:

基金项目(Foundation):

作者(Author): 靳巾,张育嘉,徐叙远,刘孟洋

DOI: 10.20064/j.cnki.2095-347X.2023.02.002

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享