论文超详细精读七千字AGCLSTM
前言
笔者从人工智能小白的角度,力求能够从原文中解析出最高效率的知识。
之前看了很多博客去学习AI,但发现虽然有时候会感觉很省时间,但到了复现的时候就会傻眼,因为太多实现的细节没有提及。而且博客具有很强的主观性,因此我建议还是搭配原文来看。请下载原文《AnAttentionEnhancedGraphConvolutionalLSTMNetworkforSkeletonBasedActionRecognition》搭配阅读本文,会更高效哦!
资料链接:https:pan。baidu。coms1IPf4IvdyjSLgL1jXmndfQ?pwd8888
提取码:8888总览
首先,看完标题《AnAttentionEnhancedGraphConvolutionalLSTMNetworkforSkeletonBasedActionRecognition》,摘要和结论,我了解到了以下信息:
1。提出了一种新的注意力增强图卷积LSTM网络(AGCLSTM),用于从骨架数据中识别人体动作。
2。提出的AGCLSTM不仅可以捕获空间配置和时间动态中的区别特征,而且可以探索空间和时间域之间的同现关系(cooccurrencerelationship)。时间角度:提出了一种时间层次结构,以增加顶部AGCLSTM层的时间接受域,这提高了学习高级语义表示的能力,并显著降低了计算成本。空间角度:为了选择有区别的空间信息,采用注意机制来增强每个AGCLSTM层中关键关节的信息。一、Introduction
背景
1。3D骨架vsRGB:3D骨架数据用一组关键关节的3D坐标位置表示身体结构,由于骨架序列不包含颜色信息,因此不受RGB视频限制的影响。此外,Johansson等人给出了一个经验和理论基础,即关键关节可以提供关于人体运动的高效信息。
2。现有识别骨架序列的时空特征模型:基于LSTM的时空注意模型。卷积神经网络(CNN)图卷积网络(GCN)进行动作识别。利用图神经网络(GCN)和LSTM分别表示空间信息和时间信息。
3。人体骨骼序列有三个显著的特征:节点间相关性:每个节点与其相邻节点之间具有很强的相关性,使得骨骼帧包含了丰富的身体结构信息。时间连续性:不仅存在于相同的关节(如手、腕、肘),而且存在于身体结构中。空间域和时间域的共现关系网络架构及重点
本文提出了一种新颖而通用的基于骨架的动作识别框架注意力增强图卷积LSTM网络(AGCLSTM),它通过同步学习上述时空特征来改进骨架表示。
如上图,本文提出了注意力增强图卷积LSTM网络(AGCLSTM)的体系结构。特征增强(FA)计算与位置特征的特征差,并将位置特征和特征差连接在一起。LSTM用于消除特征差异和位置特征之间的尺度差异。三个AGCLSTM层可以模拟可区分的时空特征。时间平均池化是在时间域中实现平均池化。利用最后一层AGCLSTM中所有关节的全局特征和聚焦关节的局部特征来预测人类动作的类别。
3。接下来,应用三个AGCLSTM层来模拟时空特征。如上图所示,由于AGCLSTM中的图形卷积算子,它不仅可以有效地捕捉空间构型和时间动力学中的区分性特征,而且可以探索空间域和时间域之间的共生关系。具体来说,AGCLSTM在每个时间步采用注意力机制来增强关键节点的特征,从而促进AGCLSTM学习更具区分性的特征。比如,肘、腕和手的特征对于动作握手来说是非常重要的,在行为识别的过程中应该加强。
4。受CNN空间池化的启发,提出了一种基于时间平均池化的时态层次结构,增加了AGCLSTM顶层的时态感受域,增强了学习高层时空语义特征的能力,显著降低了计算代价。
5。最后,利用AGCLSTM最后一层的所有关节的全局特征和聚焦关节的局部特征来预测人类动作的类别。主要贡献提出了基于骨架的AGCLSTM网络,这是图卷积LSTM在这方面的首次尝试。AGCLSTM能够有效地捕获可区分的时空特征。更具体地说,采用了注意力机制来增强关键节点的特征,从而帮助改进时空表达。提出了时态层次结构,提高了高层时空语义特征的学习能力,并显著降低了计算代价。二、RelatedWork
Neuralnetworkswithgraph(图结构的神经网络)
为了捕捉图序列的时空特征,文献〔20〕首次提出了一种图卷积LSTM,它是GCNS的具有递归结构的扩展。受〔20〕的启发,作者开发了一种新的AGCLSTM网络来从骨架序列中学习固有的时空表示。
Skeletonbasedactionrecognition(骨架动作识别)
文〔39〕提出了一种用于动作识别的时空图卷积网络(STGCN)。每个时空图卷积层使用一个图形卷积算子来构造空间特征,并使用一个卷积算子来建模时间动态。此外,还提出了一种基于零件的图卷积网络(PBGCN)来学习文献〔26〕中零件之间的关系。与STGCN和PBGCN相比,Si等人〔22〕应用图神经网络获取空间结构信息,然后使用LSTM对时间动力学进行建模。尽管在〔22〕中有了显著的性能改进,但它忽略了空间和时间特征之间的共现关系。本文提出了一种新的注意力增强图卷积LSTM网络,该网络不仅能够有效地提取可区分的空间和时间特征,而且可以探索空间和时间域之间的共生关系。三、ModelArchitecture
3。1GraphConvolutionalNeuralNetwork(图卷积神经网络)
3。2AttentionEnhancedGraphConvolutionalLSTM(注意增强图卷积LSTM)
背景:LSTM优点:LSTM作为RNN的变体,在建模长期时间依赖性方面具有惊人的能力。各种基于LSTM的模型被用来学习骨骼序列的时间动力学。LSTM局限性:然而,由于LSTM中的全连接算子,基于骨骼的动作识别存在忽略空间相关性的局限性。AGCLSTM提升的点:与LSTM相比,AGCLSTM不仅能捕获空间构型和时间动态方面的判别特征,还能探索空间和时间域的共现关系。
AGCLSTM结构:
2。上图为AGCLSTM结构。
AGCLSTM单元的功能定义如下:
其中
空间注意网络示意图,如上。
因此,首先将所有节点的信息聚合为查询功能:
其中W为可学习参数矩阵。
那么所有节点的注意得分可计算为:
其中,
3。3AGCLSTMNetwork(AGCLSTM网络)
AGCLSTM模型的整体pipeline如上图所示。
下面,将详细讨论拟议框架背后的基本原理。
JointsFeatureRepresentation(关节功能表征)
在训练过程中,考虑到顶部AGCLSTM上每个时间步的隐藏状态包含一个短期动态,因此以以下损失监督此模型:
文章还探讨了所提模型在part层次上的性能。根据人体的物理结构,身体可以被分为七个部分。与基于关节的AGCLSTM网络类似,首先用线性层和共享LSTM层捕获part特征。然后将part特征作为节点表示输入到AGCLSTM三个层中,对时空特征进行建模。结果表明,此模型也可以在part层面上获得更好的性能。
此外,基于关节和part的混合模型(如上图所示)可以进一步提高性能。
原文链接:https:blog。csdn。netIanYuearticledetails127688691
航拍江西永新多彩田园一幅秀美山乡画卷远处的青山,连片的农业大棚,纵横交错的乡村公路,错落有致的红顶民房,共同构成了一幅秀美山乡画卷。刘力鑫摄俯瞰永新县的广袤田野,只见晴空之下,一块块水稻田黄绿相间,丰景独好……
金句摘抄感悟人民日报金句摘抄多学习多读书多运动!第34天!老人言:30年前看父敬子,30年后看子敬父!这话说的一点都不假啊!但是,不管是那一代人都需要努力,你不努力你的下一代就行努力,无论……
冬游黔东南,天天来过节11月4日,记者从省政府新闻办召开的新闻发布会上获悉,黔东南民族文化丰富多彩。走进冬季的黔东南,就沉浸在歌的海洋、舞的世界。黔东南州是全国30个少数民族自治州之一,总人口……
双11想省钱换机的看过来,这几款价格都到冰点了,闭眼入必不亏文咸谈科技馆双11已经开始了,大家有没有选好自己准备要买的东西呢?本人也是已经经历过无数次双11了,是个资深的剁手党,同时也是个数码爱好者(平常会冲动买买的那种)。所以如……
风景如画的瑞士到底是个什么样的国家,世界金库,全民皆兵各位老铁,最近会持续更新趣谈世界各国军事实力介绍以及各国介绍,希望大家多多关注支持。让一让啊海军紧急集合了报告长官舰队集合完毕应到四艘实到四艘,请指示,大家请看这就是世界……
消息称三星2023年生产智能手机将少于3亿部IT之家10月31日消息,据TheElec报道,三星电子计划在2023年生产2。9068亿台智能手机。这是该公司在2021年底前为2022年设定的3。342亿台生产目标的13。……
飞天圆梦丨梦天问天,合而不同2022年10月31日,中国空间站梦天实验舱发射任务取得圆满成功。11月1日凌晨,梦天实验舱成功对接于天和核心舱前向端口,梦天正式入列。作为空间站组合体的两个实验舱,梦天与问天……
RTX4090比3090Ti强多少?RTX4090和3090万众期待的RTX40系列显卡终于发布了,而今天终于正式解禁了RTX4090,各大AIC厂商也纷纷推出了自家的非公版的RTX4090。新一代RTX40系列显卡采用了全新的AdaL……
好消息!乒坛天才少女伤愈复出,参加公开赛,110过伊藤美诚北京时间7月27日,国乒劲敌韩国乒协方面传来重要消息,乒坛天才少女申裕斌已经伤病痊愈复出,决定参加接下来8月1日的突尼斯挑战赛。众所周知,韩国小将申裕斌自从东京奥运会之后,一直……
湖北朝兴网络科技有限公司推出迪士尼联名系列儿童手表提到迪士尼品牌,一系列的IP元素肯定浮现在脑海,全球闻名的迪士尼,全称为TheWaltDisneyCompany,是总部设在美国伯班克的大型跨国公司,主要业务包括了娱乐节目制作……
红白机最棒的格斗游戏激龟快打,多少人至今放不出技能红白机平台你认为最棒的格斗游戏是什么呢?在小编的心目中只有两款《街头霸王九人版》和《激龟快打》,当然了每个人的喜好是不同的,毕竟八位机时代还是出现了不少的格斗游戏。……
这是比大自然更健康的肉类替代品吗?由于研究表明它们比动物性食物更有益于心脏健康,许多食肉动物正在寻找他们能找到的最好的植物性肉类替代品。这也许可以解释为什么植物性汉堡在快餐店和杂货店的受欢迎程度越来越高。……