论文总字数:33632字
摘 要
三维物体检测算法对核磁共振图像中的肿瘤定位问题的解决和其他三维图像算法的研究都具有很大的意义。然而,尽管目前很多二维图像上的物体检测算法都已经具备了非常优秀的性能,但是目前三维物体检测算法相对来说还有很大的进步空间。
我们提出了两种三维深度卷积神经网络的骨干网络以及一种新三维物体检测方法,我们的方法在Brats数据集中表现出了优异的性能。我们的模型的优势在于使用高分辨率的完整的三维图像输入的同时达到了较高的速度和较低的显存开销,模型具有很好的灵活性允许根据数据集和问题的复杂程度进行扩展。我们通过对比试验对模型的不同设置导致的模型预测性能,模型推理速度,模型参数数量的差异也进行了探究。
据我们所知,我们是首个利用Brats数据集进行物体检测的研究工作,这项工作将为更高速和精准的三维语义分割的实现提供参考。
关键词:三维物体检测,骨干网络,生物医学图像分析,大脑损伤
ABSTRACT
The task of researching 3D object detection algorithm has a significant role in solving MRI based brain lesions detection problems and other problems that are related to 3D images. However, unlike many existed state-of-art 2D object detection models, the performances of 3D object detection models are much worse.
In this paper, we propose to build two new 3D backbone networks as well as one new method for 3D object detection. Our methods have shown outstanding performance on Brats Dataset. Our model has advantage in speed and graphic card memory when using high resolution and complete 3D image as input. The flexibility of our method makes scaling the model based on the complexity of the dataset and the task possible. We explore the impact of using different configurations on the prediction accuracy, speed and size of our model.
To our knowledge, we are the first to perform research on object detection with Brats dataset and this work will be of referential meaning to the development of a faster and more accurate 3D semantic segmentation model.
KEY WORDS: 3D object detection, backbone network, biomedical image analysis, brain lesions
目 录
第一章 绪论 1
1.1引言 1
1.2相关理论与技术基础 2
1.2.1骨干网络 2
1.2.2二维物体检测算法 3
1.2.3语义分割与医学图像 3
第二章 深度学习与卷积网络基础 5
2.1卷积神经网络基础 5
2.1.1三维卷积 5
2.1.2激活函数 6
2.1.3梯度下降优化算法 7
2.2经典骨干网络结构 9
2.2.1VGG 9
2.2.2残差网络 11
2.3目标检测网络基础 11
2.3.1三维盒回归 11
2.3.2锚点与区域建议网络 13
2.3.3非极大值抑止算法 13
2.4端到端检测方法 15
2.4.1YOLO 15
2.4.2SSD 16
2.5类R-CNN检测方法 17
2.5.1类R-CNN算法基本思路 17
2.5.2Fast RCNN和Faster RCNN 18
2.5.3Mask RCNN 20
第三章 三维MRI图像肿瘤定位方法GridNet 22
3.1适用于三维MRI图像的骨干网络 22
3.1.1基于U-Net的三维骨干网络结构 22
3.1.2基于残差学习的三维骨干网络结构 23
3.2基于二维图像物体检测算法的肿瘤定位检测方法 24
3.2.1区域建议网络方法实验与分析 24
3.2.2盒回归方法实验与分析 26
3.3基于MRI图像的三维大脑肿瘤定位方法 28
3.3.1GridNet定位方法 28
第四章 实验 30
4.1三维核磁共振图像数据集 30
4.1.1Brats 数据集 30
4.1.2数据增强 30
4.2代码实现细节 31
4.3实验结果 31
4.3.1评价方法 31
4.3.2骨干网络性能对比结果和分析 32
4.3.3网格正例阈值设置问题 33
4.3.4定位结果可视化 34
第五章 总结 37
5.1基于核磁共振图像的肿瘤定位方法总结 37
5.1.1现有方法总结 37
5.1.2后续工作展望 37
5.2我们的模型对其他问题的影响 37
5.2.1语义分割问题 37
5.2.2弱监督学习问题 38
参考文献 39
致 谢 42
第一章 绪论
1.1引言
随着计算机视觉技术的不断发展,借助广泛存在的摄像头,很多技术都已经被应用到了大家的日常生活。虽然目前更广泛存在的是二维图像,但是在一些特定场景,三维图像能带来对现实世界更真实的反映。比如借助核磁共振技术我们能获得生物体内部器官的状态信息,借助RGB-D图像我们能进一步提升自动驾驶的安全性等等。所以研究高性能的三维视觉模型是有着很高的现实意义的。
我们这次选择对核磁共振图像进行研究,主要有几个原因。一、肿瘤的自动定位可以在一定程度上降低医生的工作负担,在医疗资源紧缺的今天,这项技术的研究可以让更多病人有得到诊断的机会;二、通过算法对核磁共振图像的检查和医生检查结合,可以降低误判或者是漏判的风险,在肿瘤诊断的过程中如果发生漏判,病人很可能因此错过最佳的治疗时机,后果十分严重。而使用三维图像进行肿瘤的分割定位,由于三维图像的空间信息更丰富,我们有更大的把握生成高精度的结果。
ImageNet等一系列的视觉挑战催生了大量的优秀的二维视觉模型如VGG,ResNet等等。这些高性能二维模型都存在对计算资源要求较高的问题,尽管借助GPU的并行计算能力很多算法已经能以较高的速度运行,但是如果将这些模型直接转化为对应的三维模型必然会造成几十倍,甚至上百倍的计算代价的提升。另外,中间结果的存储,模型参数的增长也会带来巨大的显存开销。同时,快速增长的模型参数数量也会使得模型在训练时的过拟合风险增大。所以,针对三维图像设计不同于二维模型的深度学习模型是有必要的。
剩余内容已隐藏,请支付后下载全文,论文总字数:33632字
该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;