GVCNN的网络结构是怎样的
这篇文章主要讲解了“GVCNN的网络结构是怎样的”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“GVCNN的网络结构是怎样的”吧!
网站建设哪家好,找创新互联!专注于网页设计、网站建设、微信开发、成都微信小程序、集团企业网站建设等服务项目。为回馈新老客户创新互联还提供了宁洱免费建站欢迎大家使用!
网络结构:
觉得眼熟吗?看看前端输入的一排图片,是不是和MVCNN非常像。来看一下MVCNN的网络结构:
你可能已经猜到了,其实GVCNN就是对MVCNN做了改进。
MVCNN又是什么来路呢?
它可是最早将深度学习引入到三维形状识别中来的,早在ICCV2015会议上发表出来,当时就已经能在ModelNet40数据集上跑出90.1%的成绩了,可以说是师爷级的网络了。
后续的各种处理点云的方法,都会与它做比较。
它的思路其实很简单,对于三维物体,从多个视角去‘拍照’,得到12幅图片,然后码12个VGG网络上来,进行特征提取,把12组特征进行池化后,进行分类。
所以,MVCNN的缺点也很明显,网络巨大。这与当今小型化的趋势明显不符嘛!这么大的网络,别说往移动终端部署了,就是桌面电脑,跑起来都费劲。所以,这个网络的follower一直也不多。
笔者倒是见过一篇比较老的论文,是把三维物体往球形上面做投影,同样是把三维转换成多个二维图像去处理,跟MVCNN的区别是,往球型投影比平面投影更能反映三维物体的属性
再来看今天的主角GVCNN,它的改进是,把12幅图片进行了分组、加权。
作者考虑到,MVCNN中的12幅图像其实权重是一样的,但是实际当中肯定12幅图像对于分类的贡献是有高有低,通过合理加权,自然可以提高分类准确率。
具体操作就如上图,每个图片得到一组特征值,通过FC层获得分数,对分数进行分组,比如图中分成了三组。
然后,在组内按照MVCNN原来的池化操作进行。组间则是加权后在平均池化,得到最后结果。
下面是结果了:
可以看到,提升效果还是很明显的。
感谢各位的阅读,以上就是“GVCNN的网络结构是怎样的”的内容了,经过本文的学习后,相信大家对GVCNN的网络结构是怎样的这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!
网页名称:GVCNN的网络结构是怎样的
文章链接:http://myzitong.com/article/ighiih.html