一、WORD彩色图像的模式转换(论文文献综述)
宁晨[1](2021)在《基于复杂网络和视觉词典的高光谱遥感图像分类》文中认为高光谱遥感技术能够利用拥有上百个波段的电磁波对地面物体进行成像,所获取的图像中可以表现极为丰富物质信息,该图像能够充分反映物质的物理或化学组成,能够更加精准地对地物分类。与此同时,由于高光谱遥感图像所获取的数据量庞大,在分类任务中也存在着诸如可供训练的数据有限,地物的高光谱特征在大空间内的多样性数据稳定程度受光照、大气影响,维数较高导致的维数灾难等问题。由此,如何能够在相对有限的数据之中,既保证更高的分类精确度,又能缓解高维数据带来的计算压力是亟待解决的问题。针对以上问题,为解决在高光谱遥感图像分类技术中存在的分类准确度不高以及数据量巨大导致的算法性能低下等问题,本文提出以下三个方面的工作,以探究更有效的高光谱遥感图像分类方法。(1)针对于高光谱遥感图像数据的维数高、复杂度高,并且为了更充分地表示相距较远波段之间的关联关系,本文提出了基于复杂网络和视觉词典的高光谱遥感图像特征提取分类方法(Complex networks-Bag of visual words,CN-BOVW)。首先将高维度的光谱向量通过K-means方法聚类,集合聚类中心构成词典,使用待测光谱向量与聚类词典向量进行比较,获取样本点的词频特征;其次,将待测光谱向量由1×N的结构转化为矩阵结构,使用像素值和矩阵位置为依照,以复杂网络的方式进行表示,在经过动态演化之后形成多个子网络,计算这些子网络的拓扑结构参数,组成光谱特征向量,得出样本点向量波段之间的内在联系。最后融合复杂网络特征和视觉词典特征进行分类。(2)为了能兼顾高光谱遥感图像的光谱特征和空间特征,本文将复杂网络方法分别同局部二值模式(Local binary pattern,LBP)算法与Gabor算法相结合,提出了CNLBP算法和CN-Gabor算法。其中,CN-LBP算法分别从高光谱遥感图像的两方面进行特征提取,使用复杂网络方法的描述单个像素点的光谱曲线结构特征,采用LBP算法表示各样本点与周围样本点的关联特征,通过均匀LBP模式简化表示,降低特征维数;CN-Gabor算法同样使用复杂网络进行光谱结构分析,在空间特征方面使用三维Gabor滤波器组在高光谱遥感图像进行滤波操作,使用投票机制对多个Gabor滤波器的分类进行统计,获得量化直方图,以此作为图像的纹理特征。该算法使用特征并行融合的方法,将光谱特征与空间特征作为复向量的实部与虚部,并通过PCA算法降维。(3)本文采用Salinas和KSC数据集验证CN-BOVW算法的分类效果。从实验中的评价指标总体分类精度(Overall Accuracy,OA)、平均分类精度(Average Accuracy,AA)以及Kappa系数显示,本文所提出的CN-BOVW算法的分类精度可以达到98.97%。同时,通过Indian Pines和KSC数据集对融合复杂网络和空间特征的算法进行验证,CNLBP和CN-Gabor两算法总体分类精度也能够达到97.25%和97.21%。通过以上三项工作,本文提出的融合复杂网络和视觉词典的方法以及融合复杂网络和空间特征的高光谱遥感图像分类方法相较现有算法有更优的分类准确度,算法也有一定的应用价值。
徐战[2](2021)在《基于SLAM的煤矿井下空间重建方法的研究》文中认为煤炭是我国的主要能源,随着工业互联网、人工智能、物联网、智能机器人等技术的发展,建设智能矿山符合国家发展战略,是煤炭行业的必然选择。因此,通过研究煤矿井下空间的实时三维建图、定位和导航技术,可以解决井下机器人和人员的定位及导航问题,有利于保障人员安全和提高智能化开采效率,对建设智能矿山具有重要意义。同步定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术在机器人领域用于在未知环境下的定位及地图构建,为机器人的自主定位及导航奠定基础。本文在建设智能矿山的背景下,提出基于SLAM技术的煤矿井下空间重建的方法。本文通过国家煤炭工业采矿工程重点实验室模拟煤矿井下环境,采用RGB-D类深度相机中的Kinect2.0作为传感器获取图像。针对在图像信息获取过程中受矿井低光照、粉尘大等环境因素影响的问题,通过张正友标定法对Kinect2.0相机进行标定,提高了获取的图像信息的精度。并利用不同去噪算法进行实验,根据实验测试和评价指标,最终选择高斯去噪算法。针对在煤矿井下获得的图像缺少纹理和模糊造成特征点误匹配对过多,导致地图构建失败的问题,采用特征点法实现视觉里程计。对比分析SIFT、SURF、ORB特征提取算法特点,提出采用改进的ORB算法,提高了特征点提取的速度。对比分析GMS、RANSAC特征配准算法,采用最近邻法对RANSAC算法进行改进,根据实验对比分析,采用改进的RANSAC算法进行剔除误匹配,减少了迭代次数,提高了机器人在煤矿环境下进行地图构建的鲁棒性。针对在三维地图构建过程中存在信息冗余和累计误差的问题,通过选取构建位姿图的关键帧,剔除重复的图像帧。在地图优化方面,通过BA算法和BoVW方法对位姿进行调整优化,提高构建三维点云地图的全局一致性。为满足机器人自主导航对地图的需求,在三维稠密点云地图的基础上,将其转化为三维八叉树地图,为机器人自主导航奠定基础。本文提出的基于SLAM的煤矿井下空间重建的方法可以稳定高效地构建出煤矿井下环境的三维地图,实现对矿井下工作场景的三维再现,为井下机器人进行智能化开采、建设智能矿山提供了理论创新性和应用价值。
任川[3](2021)在《应用刚柔耦合模型和图像识别的行星齿轮箱微弱故障诊断》文中指出行星齿轮箱具有体积小、传动比大等优点,被广泛应用于农业、航空航天、风力发电等领域。由于其常常在高负载工况下运行,导致行星轮、行星架、太阳轮、齿圈等零件经常会出现轮齿磨损、折断、齿面点蚀、轮齿裂纹等故障,这些故障的产生会对机械运转造成严重影响,甚至会引发重大的机械事故。因此,对行星齿轮箱准确且高效的故障识别尤为重要。本文以行星齿轮箱为研究对象,以刚柔耦合动力学模型和实体HFXZ-I故障诊断试验平台为依托,基于尺度不变特征变换图像识别算法提取微弱故障特征,应用直方图相交核支持向量机对行星齿轮箱微弱故障进行诊断,具体的研究内容如下:利用Solid Works和ADAMS软件,建立刚柔耦合动力学模型。首先以HFXZ-I故障诊断试验平台为依托,依据行星齿轮箱齿轮的故障产生机理以及在ANSYS Workbench软件中的分析结果,使用Solid Works软件建立行星齿轮箱正常和故障工况下的三维模型并装配;其次利用ANSYS APDL软件将行星齿轮箱中需要布置振动加速度传感器的零部件转化为柔性体;最后在ADAMS动力学软件中通过对模型添加材料、约束和接触建立行星齿轮箱刚柔耦合动力学模型。以刚柔耦合动力学模型为依托,开展行星齿轮箱测点选择研究。行星齿轮箱刚柔耦合动力学仿真分别在正常、行星轮故障(磨损、裂纹和断齿)和太阳轮故障(磨损、裂纹和断齿)七种工况下进行,通过转速分析和频谱分析相结合的方法验证模型的准确性。考虑目前“智能组件”的发展,在行星齿轮箱箱体外部和内部分别布置3个测点,通过动力学仿真获得各测点处的振动加速度信号,提取振动信号特征值,确定各个测点布置优先度排序,结果表明:仅考虑齿轮故障时,测点布置优先度最高的位置是在内齿圈上方中心和行星架输出轴轴承上方。结合测点选择结果进行结构改进设计,通过仿真分析验证该改进结构的有效性。以行星齿轮箱微弱故障为分析对象,应用图像识别技术开展故障诊断研究。首先利用信号图像转换方法将采集的原始振动加速度信号转化为2D彩色图像;其次通过尺度不变特征变换算法检测彩色图像的特征点并对检测出的特征点进行向量描述;然后将彩色图像的特征描述向量聚类,构建词袋模型;最后利用直方图相交核支持向量机算法对其进行分类,实现行星齿轮箱故障模式识别。基于测点优化结果,采集实体实验和仿真实验的振动加速度信号,通过仿真实验和实体实验对该方法进行验证。仿真实验设置正常工况以及行星轮1齿磨损、行星轮2齿磨损、太阳轮1齿磨损三种微弱故障工况,实体实验设置正常工况以及行星轮点蚀、行星轮1齿磨损、行星轮2齿磨损、行星轮3齿磨损四种微弱故障工况。在仿真实验中,该方法的准确率高达96.7%,在实体实验中,准确率高达97.3%。实验表明:利用该方法对行星齿轮箱微弱故障进行诊断时,不需要对原始信号降噪便可以提取出大量的信号特征,提高了故障模式识别的准确率。
吴婉婷[4](2021)在《电子航海通告内容识别关键技术研究》文中认为航海通告与海图之间有着密切联系。航海通告是海图改正和数据更新的重要信息源,海图工作人员通过解析通告数据及时完成海图更新工作,保证海图的现势性,以解决海上船舶的航行安全问题。随着信息化时代的到来,互联网技术应用到海图制图行业以及航海通告的发布中,电子航海通告数据资料快速并准确解析成为海图改正领域的重要课题之一。然而,随着海区范围不断扩大,航海通告不断增多,海图工作人员经常性的解析大量通告,不能及时满足海图改正的需求,这为海图更新工作带来了很大的困难。可见,使用手工作业方法有很多弊端。在不增加现有设备情况下,通过使用计算机技术代替手工进行数据录入,可以达到迅速获取通告数据项信息的目的,及时对现有海图进行更新,以保证海图的现势性。依托现代化信息技术,对网页自动获取的电子航海通告进行内容识别成为提高海图改正工作效率的重要步骤。一些通过扫描纸质版航海通告文档生成的电子航海通告文件,由于人为因素或其他环境因素,导致的通告图像存在噪声和倾斜现象的情况普遍存在,直接影响了通告内容识别的准确性和文本结果。因此,图像的预处理工作也是本文的一个重要研究内容。本文以基于网页自动采集的国内外电子航海通告文档为研究对象,研究了数字海图改正、电子航海通告文档的内容与结构、图像的预处理方法、内容识别技术和数据库技术等,结合《航海通告编写规范》对航海通告的具体要求,设计了针对电子航海通告数据预处理系统,包括图像的预处理、文档内容识别、数据辑与管理功能模块。在图像预处理方面:首先探索了图像预处理要做的第一步灰度化处理算法,通过计算各像素点的灰度值的运算来重新设置通告图像中各像素点数值;其次利用最大类间方差算法、双边滤波算法和倾斜校正算法,提高图像的质量。在字符识别方面:首先研究了文本类型识别过程中要用到的PDF拆分技术、格式转换技术;其次对图像类型识别方法进行了研究,最后采用了基于One Note组件的识别方法。在数据编辑和管理方面,首先研究了基于通告Word文档的数据项抽取算法,以及通过设计新的数据库结构来解决抽取数据的存储、编辑、信息交换等问题。最后,本文基于字符识别技术进行了电子航海通告文档内容识别原型的设计,从系统的开发平台、总体路线设计到各功能模块,并对系统结构及案例结果进行分析和总结。测试结果表明:本文的研究成果能够高效快速地处理海量电子航海通告数据,提高海图改正工作的效率,满足一体化航海通告数据库的更新需求,无缝衔接一体化海图生产体系,实现有效的信息传递。
赵彦霞[5](2021)在《基于水印和区块链技术的数字图像交易管理研究》文中提出社会许多领域对数字图像的大量需求,使得国内外出现了大量的数字图像交易网站。但目前的数字图像交易网站一般存在一些不足。例如,为用户提供的数字图像版权保护和版权认证服务不足,为用户提供的有法律效力的交易存证服务不足,为用户提供的个性化服务不足和提供的业务种类少等不足。在数字图像交易管理理论研究方面,也存在对数字图像交易管理的系统性研究、对数字图像进行版权保护和内容认证研究、对区块链中交易使用的智能合约管理研究以及专门针对数字图像的个性化推荐研究不足等问题。本文针对这些存在的问题进行了研究。在理论研究方面,本文对数字图像交易前、交易中和交易后管理上存在的一些问题进行了研究。提出了利用数字水印技术对交易前的数字图像进行版权保护和内容认证的多功能零水印算法;对数字图像交易过程中产生的交易信息写入区块链中进行存证,对区块链智能合约分类算法进行了研究;依据数字图像交易后存储的用户历史数据,研究了利用智能推荐技术的个性化数字图像推荐算法。在实践研究方面,设计了数字图像交易管理系统。将本文提出的算法应用于该系统,并设计了相应的管理模型,以解决数字图像交易网站提供的业务种类少等问题。本文的创新点如下:(1)提出了两种基于奇异值分解和深度学习的数字图像多功能零水印算法。在数字图像交易前,对数字图像进行版权保护和内容认证的研究不足。针对这一问题,本文对数字图像版权保护和内容认证进行了研究。变换域算法比空域算法中水印的鲁棒性更强,离散小波变换(DWT)能够克服离散傅里叶变换和离散余弦变换的一些缺点,奇异值分解(SVD)所得的奇异值可以表示图像内在的代数特征,稳定性好,深度神经网络能够获取图像关键特征。因此,将DWT、SVD分别和深度卷积神经网络(DCNN)和深度置信网络(DBN)相结合,提出了基于SVD和DCNN的数字图像多功能零水印算法以及基于SVD和DBN的数字图像多功能零水印算法。两种零水印算法都构造了零鲁棒水印图像和零半脆弱水印图像。仿真实验验证了两种算法的鲁棒水印对多种强度大的攻击有较好的抵抗性,提取出的半脆弱水印图像也能对原始图像的篡改位置进行定位。(2)提出了两种智能合约分类算法。针对许多数字图像交易网站存在的交易存证法律效力不足的问题,把区块链技术引入数字图像交易过程管理中。在区块链上进行交易的过程中需要使用智能合约,因此本文研究了智能合约分类算法,以便对智能合约进行有效管理。智能合约属于文本信息,因为智能合约不同类别数量相差较大,所以智能合约分类属于非均衡文本分类。智能合约分类的第一步工作是将智能合约转换成能够被计算机识别的数据。由于目前没有针对智能合约的语料库,因此首先利用Word2Vec建立智能合约语料库。然后,利用Word2Vec和智能合约语料库将所有智能合约都转化成等长的数字化向量。智能合约分类的第二步工作是研究如何对数字化的智能合约进行分类。由于智能合约分类属于非均衡的文本分类,所以本文提出了随机权学习机和加权交叉熵函数来克服传统分类方法的缺陷,并分别利用自编码器能降低数据维度的特点和双向长短期记忆神经网络(Bi LSTM)对上下文有记忆的功能,提出了基于自编码随机权ELM网络的智能合约分类算法与基于加权交叉熵损失函数的长短记忆智能合约分类算法。实验验证了两种算法对智能合约的分类是有效的。(3)提出了一种加权TextRank和自组织特征映射神经网络(SOM)的个性化数字图像智能推荐算法。针对数字图像交易完成后的管理中,对用户提供的个性化推荐服务研究不足的问题,本文进行了个性化数字图像推荐研究。通过两种来源获取用户感兴趣的图像。第一种来源是当前用户的相似用户订单中的图像。第二种来源是从数据库中查找的与当前用户最后放入订单中图像同类型的图像。从相似用户和数据库两种来源得到的候选图像集中选择用户感兴趣的部分图像推荐给当前用户。由于用户最后在网站的搜索词、不同时间加入订单和加入购物车的图像,以及用户历史数据中能体现图像类型的关键词语反映用户对图像的兴趣度的作用程度不同,所以,利用TextRank算法适合提取短文本关键词的特点,设计了加权TextRank算法来提取用户历史数据的关键词。因为SOM能够通过竞争对数据进行聚类,所以利用SOM去发现当前用户的相似用户。仿真实验结果验证了提出的算法能够有效地发现当前用户的相似用户,能为当前用户推荐用户感兴趣的数字图像。(4)设计了数字图像交易管理系统。针对许多数字图像交易网站没有提供数字图像处理、数字图像版权保护、数字图像认证、交易存证、个性化推荐服务和智能合约分类等情况,设计了数字交易管理系统。设计了数字交易管理系统的架构和功能,设计了应用于数字图像交易管理系统中的数字图像交易管理、数据安全保护管理、版权保护管理、智能合约管理和个性化推荐管理模型。以上研究成果,能够在一定程度上解决现有许多数字图像交易网站对数字图像版权保护和版权认证,交易的有法律效力存证,区块链技术应用中的智能合约分类,网站业务种类少等问题。将数字水印、区块链和智能推荐等技术应用到数字图像交易管理的研究方法,可以为管理科学的研究提供一些思路和方法。研究成果被应用后,业务种类的增加和对用户的个性化数字图像推荐能够吸引更多的用户消费,从而增加商家的利润。
刘思军[6](2021)在《运动姿态视频测量分析仪高速JPEG译码器设计》文中认为视频测量作为融合传统摄影测量、光学测量、机器视觉与数字图像处理分析、三维重建等的交叉学科,具有环境适应性强、非接触、频响高等优点,尤其是在高速风洞试验中,视频测量因其对试验模型的设计制造无特殊要求,受到了国内外风洞试验机构的青睐。为了提升测量精度,视频测量中用的相机分辨率、帧率越来越高,如何对高分辨率与高帧率带来的高速图像数据进行实时处理,成为高速运动目标的视频测量中待解决的难点之一。为解决高速图像数据的实时编译码难题,对高速译码器的关键技术开展研究。在分析运动姿态视频测量分析仪实现架构及译码器接口与调度缓冲资源约束的基础上,结合课题设计指标与JPEG译码器系统结构,采用自顶向下和模块化的设计方法,完成了高速JPEG译码器的总体架构设计与关键技术分析。针对课题高吞吐率设计指标,在分析JPEG译码算法的基础上,完成了高速译码器各功能模块高吞吐率实现方案设计与基于MATLAB的性能验证。针对串行Huffman解码的解码效率与2D-IDCT变换处理速率较低的问题,在分析Huffman编码表的编码规律和2D-IDCT变换的快速算法的基础上,采用并行流水处理架构和乒乓操作等技术,设计了基于并行与流水架构的高速Huffman解码算法和快速2D-IDCT变换的FPGA实现架构。基于高速JPEG译码器的FPGA实现方案,完成了基于Verilog硬件描述语言对译码器的各个功能模块进行RTL级设计与系统集成。为验证高速JPEG译码器的性能,搭建高速JPEG译码器性能测试平台,测试结果表明,本文设计的高速JPEG译码器能实现吞吐率达2.105GB/s的图像JPEG译码,具备较好的灵活性和可扩展性。
杨峰[7](2021)在《基于机器学习的场景理解关键技术研究》文中进行了进一步梳理场景理解是机器学习、模式识别等学科非常活跃的研究方向。图像分类和图像语义分割是场景理解的两个重要研究内容,虽然随着机器学习方法的不断发展已取得突破性的进展,但依然存在一些亟需解决的问题。本文以图像分类为主要研究对象、机器学习方法为主要研究手段,重点针对经典机器学习方法下图像分类任务中的低分类率图像类别的识别问题、视觉字典的学习耗时问题和场景理解的多任务集成模型设计问题,以及深度学习模式下图像分类网络模型的空间复杂度和网络稳定性问题展开方法研究。论文的主要创新点总结如下:1.针对图像分类任务中普遍存在的低分类率图像类别识别问题,提出一种基于主节点分析的图像分类方法,实现对图像特征表达模型的优化。该方法通过对图像特征进行聚类筛选,大幅度减少视觉单词间的同义问题,有效改善因图像类别分布不平衡、图像类内差异和类间模糊等因素导致的部分图像类别分类率偏低问题。2.针对图像分类任务中视觉字典学习效率问题,本章提出一种基于快速字典学习策略的图像分类方法。该方法对图像分类模型的视觉字典生成模块进行优化,采用并行计算模式引入相似度函数对特征描述符集合进行稀疏采样,通过基于非负矩阵分解的聚类算法实现视觉字典的快速学习。该方法在大幅度减少视觉字典学习时间、显着提高字典学习效率的同时,能够有效提升图像分类的识别率。3.针对基于深度学习的图像分类网络模型设计问题,分别提出基于并行核主成分分析网络的图像分类算法和基于注意力金字塔残差网络的图像分类方法。前者针对网络模型的空间复杂度问题进行研究,通过搭建并行核主成分分析网络,在解决经典卷积神经网络空间复杂度过高问题的同时,有效提高图像分类的识别率;后者对经典残差网络进行改进,将注意力机制和空间金字塔模型引入残差模块,有效提升深度学习网络的稳定性。图像分类公共数据集和作者工作单位自建数据集上的实验结果验证了两个网络模型的有效性。4.针对图像场景理解中多任务集成设计问题,提出了一种基于双通道多特征分析的场景理解模型。该模型通过充分挖掘彩色图像及其对应的灰度图像中蕴含的多种信息,建立彩色通道模型和灰度通道模型,综合前景和背景中的语义信息提取多源特征,并采用压缩感知方法对多源融合特征进行特征降维,实现图像分类和图像分割双重任务。论文中的方法已在图像分类和图像语义分割相关数据集以及自建图像数据集上完成仿真实验。实验结果表明,本文方法能够有效提升图像分类和图像分割等场景理解子任务的性能。
胡杨[8](2020)在《面向智能中医辅助诊疗的多注意力和知识辅助神经网络设计研究》文中指出中医在我国医疗体系处于重要地位,几千年来为民族繁荣和人民健康做出了巨大贡献,特别在最近的新冠疫情(COVID-19)中,中医诊疗技术发挥了重要作用。在“人工智能+”的大背景下,智能中医技术的研究能为中医打开智能化发展的新格局。中医知识体系庞大且错综复杂,医师严重依赖大量临床经验。将中医知识库融合多源体征信息,嵌入中医领域知识,再进行全过程高效、客观的健康管理是智能中医研发的必然趋势。本文的研究内容着重于智能中医辅助诊疗技术中的问诊和望诊部分,尽管基于神经网络的深度学习技术已经被成功应用到了包括医疗领域的各个领域,但与其他智能医疗应用类似的是,在我们研究智能中医的辅助诊疗中的问诊和望诊任务时,将面临如下智能医疗领域常见的,以及本文任务独有的挑战:1.医疗数据中充满噪声,不管是患者提问等文本数据,还是患者舌像等图像数据,对预测结果产生有效影响的往往是细节特征;2.中医诊疗任务是专业性极强的预测任务,需要丰富的领域背景知识作为指导;3.中医临床门诊数据采集成本高,可用的数据有限,对神经网络模型建模效率的要求比其他任务更高;4.中医门诊以全科医学为主,在实际情况中常常需要面对罕见病例的情况,这就要求智能中医辅助诊疗模型具备少样本甚至零样本学习(又称零次学习)的能力;5.除了上述挑战之外,真实门诊场景下采集的问诊,望诊数据,需要克服自然语言中不确定语境,计算机视觉中多种光照,多种拍摄角度,拍摄质量不均衡等各种可能对最终系统性能的干扰因素,对提出模型的鲁棒性,泛化能力提出了更高的要求。面对上述棘手的挑战,在本文涵盖的研究过程中,我们重点从基于注意力与知识辅助两个方面探索了面向智能中医应用的神经网络模型,在做出该研究侧重时我们考量了注意力机制与知识辅助技术的如下益处:1.注意力机制有利于模型更精准地捕捉患者问诊,望诊输入数据中的关键细节特征,并提升模型的建模效率;2.知识辅助可以帮助我们训练更鲁棒的辅助诊疗模型,并有助于增加模型的可解释性。基于上述考量,本文进行了如下方面的创新性研究:(1)在中文患者在线提问的智能导诊任务中,针对患者提问的文本短,噪声多,关键语素特征领域特定强等问题,提出了“关键语素生长的强注意力序列建模架构”(Morpheme Growth,MG),在短文本中抽取并扩展关键语素,增强关键语素特征在循环神经网络建模中的影响力,以提升模型对于关键导诊特征的捕获能力。(2)在舌像-中医处方的关联性挖掘相关研究中,创新地提出了基于舌像的卷积神经网络(Convolutional Neural Network,CNN)自动化中医处方构建模型,为了更好地建模中医专家的诊治疗法,提出了隐式疗法主题辅助任务机制(Auxiliary Latent Therapy Topics,AUX_LDA)以对中医疗法主主题知识进行建模,利用多任务的架构同时学习对于关键药材的检索流程以及中医疗法的隐式构建流程,以达到更逼真的自动化中药处方生成效果。(3)为了进一步改善深度卷积神经网络的建模效率,提出了面向卷积神经网络的内成像特征通道注意力结构(Inner-Imaging Network,In I-Net),该结构将卷积神经网络各层的特征图浓缩信号进行重新排列,形成一张伪内成像图,我们用它来组织卷积通道的互补关系,进一步地,提出的模型使用多尺寸的滤波器在伪内成像图上建模卷积通道间的成组关系,增强深度卷积网络内部组件间的多样性,互补性及卷积建模整体的完备性。(4)在上一个创新工作的基础上,我们将基于内成像机制的卷积网络用于面向舌像的患者患病部位预测这个中医辅助诊疗的真实任务上,为了建模散布在舌像各个部位的细节病理特征,提出了全通道区域注意力网络(Fully-Channel Regional Attention Network),它在内成像通道注意力结构的基础上提出了随机局部区域池化技术(Stochastic Regional Pooling,SRP),通过在一张特征图上采样多个局部区域的信号并作为通道注意力机制的输入,帮助模型自动化屏蔽图像边缘的噪音信号,同时强化舌像上细节病理特征的权重。(5)在最后阶段,本文探索了模型在面对零次学习的情形下,结构化知识图谱辅助深度神经网络完成学习的机制。首先基于语义属性间的共现关系建立属性关系知识图谱,然后提出基于图建模的视觉-语义纠缠网络(Graph-based Visual-Semantic Entanglement Network,GVSE),利用图神经网络对视觉特征中的隐式属性关系映射进行建模,同时与卷积网络通道实现充分地交互,最终获得语义表达能力优异的零次学习特征,帮助模型从某种程度上克服零次学习中的领域漂移问题。这部分的研究为后续解决智能中医辅助诊疗中的零样本难题打下了很好的基础。
谢光艺[9](2020)在《基于视觉特征提取的图像检索算法研究》文中指出随着数字图像的快速和大规模增长,人们找到感兴趣的图像越发困难,这促使人们研究和开发有效的图像存储,索引和检索技术。图像检索和索引已被应用于许多领域,例如互联网、广告、艺术、建筑、教育、医疗、生物和其他许多行业。基于文本的图像检索首先以文本形式手工标记图像,然后使用关键字来检索图像。这种基于字符匹配程度的图像检索方法既主观又费时。基于内容的图像检索方法克服了基于文本方法的缺点,依据图像的视觉特征(颜色,纹理,形状等)在图像集中找到相似的图像(搜索范围)。本文针对图像检索的视觉特征提取的关键性问题,提出了彩色能量导向局部模式、稳定兴趣点区域、一致性区域内主颜色及胡矩,以及结合区域相关和方向相关描述符等算法进行图像检索,做了深入研究,取得的研究成果和创新如下:1.提出了彩色能量导向局部模式特征和直方图结合的图像检索算法。局部二值模式(Local Binary Patterns)是一种着名的表征图像纹理特征的算子,它和它派生的各种算子在图像检索中取得很好的效果,但它们基本上都是对彩色图像中的亮度单通道进行处理,没有利用彩色图像的颜色特征。本文针对彩色图像提出一种彩色能量导向局部模式(Local Color Energy Oriented Pattern),它基于彩色多通道,以彩色图像有限区域能量变化为导向,考虑图像中参考区域和它对应最大能量变化方向处目标区域中对应点处强度的关系,动态的表示图像局部纹理变化特征,较二值模式(LBP)等相应算子只是考虑局部邻域中心点和周围点强度的关系能够表现纹理的变化信息。再将彩色能量导向局部模式特征和图像颜色常用的直方图(Color Histogram)特征结合能更好的表征图像的特征信息。所提方法(LCEOPa CH)在corel-1k、corel-5k和corel-10k三个数据集上进行测试,实验结果表明优于当今的其它基于内容的图像检索方法。2.提出了稳定兴趣点区域图像检索算法。针对传统兴趣点检索方法中非感兴趣区域的兴趣点会降低检索准确率的不足,提出稳定兴趣点区域检索图像的新方法。首先检测查询图像和候选图像的兴趣点,提取其邻域灰度信息并计算伪泽尼克矩,通过比较距离找到最佳匹配点对。其次以匹配点对计算相应凸包区域以得到稳定的兴趣点区域。最后提取稳定兴趣点区域内图像颜色和Gabor小波变换纹理信息进行图像检索。实验结果表明所提算法去除了无关兴趣点的影响,克服了传统兴趣点算法只提取边缘局部特征的不足,与同类算法相比准确率明显提高。3.提出了一致性区域主颜色及胡矩图像检索算法。数量快速增长的数字图像需要有效的检索,主颜色描述符(Dominant Color Descriptor,DCD)在图像处理中已得到广泛使用。但是主颜色描述符考虑的是整幅图像上的所有像素点信息,从而影响了检索的准确率。根据基元理论(The texton theory),先采用基元模板检测提取出图像一致性区域内像素点的信息,并在此区域内的像素点上计算主颜色特征。然后再结合具有平移和旋转不变性的胡矩特征提取图像中的形状信息,从而达到有效结合颜色和形状信息进行图像检索。所提的算法在corel-1k、corel-5k和corel-10k三个数据集上进行测试,实验结果表明优于当今的基于内容的图像检索方法。4.提出了结合区域相关和方向相关描述符的图像检索算法。大量不断增长的数字图像需要有效地检索,但是在准确性和速度之间进行权衡是一个棘手的问题。通过结合区域相关和方向相关描述符(Combining Region and Orientation Correlation Descriptors,CROCD)提出了一种快捷有效的图像检索方法。区域颜色相关模式和方向颜色相关模式分别由区域相关描述符和方向相关描述符提取。然后分别从两个相关模式中提取图像的特征向量。该算法具有统计和纹理描述方法的优点,可以表示图像颜色和纹理在空间的相关性。对于全彩色图像,特征向量只有80维。因此,它在图像检索中非常高效。该算法在准确性和查全率方面在三个数据集上进行了的测试。实验结果表明,所提出的算法优于其他最新算法。
谢靖怡[10](2020)在《基于Kinect的动态中国手语识别》文中研究表明听障人士占我国人口总数的5%,手语对他们来说是交流情感不可或缺的一种语言。但未学习过手语的人无法理解手语的含义,限制了听障人士走出家门、与人交谈的机会,因此对动态中国手语词汇进行识别和理解有助于为听障人士搭建无障碍交流平台,对社会文明进步有着重要意义和应用价值。手语分为静态手语和动态手语,与静态手语相比,动态手语具有手部轨迹运动和手型变化的特点。本文利用Kinect传感器作为硬件采集平台对动态中国手语词汇的识别进行研究,借助Kinect获取彩色图像、深度图像以及骨骼点跟踪,设计了一种利用运动轨迹和手型变化相结合的手语识别方案。本文首先给出一种结合卡尔曼滤波与区域生长法的改进手部跟踪与分割算法,根据手部骨骼点坐标自适应地截取包含部分手和背景的区域,并统计该区域的深度直方图。选取直方图中靠近摄像头的点作为区域生长种子点,得到同时符合肤色区域和深度值的手部区域。对分割区域应用距离变换得到手心坐标,并将其作为卡尔曼滤波跟踪的测量值,对跟踪骨骼点坐标重新校正。当双手出现相互遮挡的情况时,利用多目标椭圆拟合假设区分双手的跟踪点,最终实现手部区域的准确跟踪与精准分割。然后对手部运动轨迹进行归一化处理,消除不同人群带来的手语比划差异。提取骨骼间向量作为轨迹特征,利用以DDTW为核函数的SVM识别轨迹。最后识别手型变化,使用深度运动图记录手型运动变化,给出了一种提取深度运动帧中关键手型的方法。采用帧差法计算帧间的运动能量,提取运动能量变化率高于平均变化率的帧作为关键帧,用以减少视频中无意义的过渡帧,最后提取HOG、LBP组合特征,对特征编码降维后送入极限学习机中分类识别。本文以上述算法为基础,使用Matlab进行仿真与实验,实验结果表明本文给出的动态中国手语识别方案能够对手语词汇进行有效识别。
二、WORD彩色图像的模式转换(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、WORD彩色图像的模式转换(论文提纲范文)
(1)基于复杂网络和视觉词典的高光谱遥感图像分类(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.3 主要研究内容 |
1.4 论文组织结构 |
1.5 本章小结 |
第2章 高光谱遥感图像概述 |
2.1 高光谱遥感图像分类及评价指标 |
2.1.1 混淆矩阵 |
2.1.2 总体分类精度 |
2.1.3 平均分类精度 |
2.1.4 Kappa系数 |
2.2 高光谱遥感图像数据集 |
2.2.1 Salinas数据集 |
2.2.2 Kennedy Space Center数据集 |
2.2.3 Indian Pines数据集 |
2.4 本章小结 |
第3章 复杂网络和视觉词典 |
3.1 复杂网络 |
3.1.1 复杂网络基础 |
3.1.2 复杂网络演化模型 |
3.1.3 复杂网络机器学习 |
3.1.4 复杂网络相关拓扑参 |
3.2 视觉词典 |
3.3 本章小结 |
第4章 融合复杂网络和BOVW的高光谱遥感图像特征提取 |
4.1 高光谱遥感图像复杂网络特征提取算法 |
4.2 高光谱遥感图像视觉词典特征提取算法 |
4.3 CN-BOVW分类算法 |
4.4 本章小结 |
第5章 融合复杂网络与空间词典特征的HSI特征提取 |
5.1 LBP算法和Gabor特征提取算法 |
5.1.1 LBP特征提取算法 |
5.1.2 Gabor特征提取算法 |
5.2 高光谱遥感图像空间特征提取 |
5.2.1 高光谱遥感图像LBP特征提取算法 |
5.2.2 高光谱遥感图像3-D Gabor特征提取算法 |
5.3 CN-LBP算法与CN-Gabor算法 |
5.3.1 并行特征融合方法 |
5.3.2 主成分分析 |
5.3.3 算法描述 |
5.4 本章小结 |
第6章 实验结果及分析 |
6.1 实验环境与设计 |
6.2 CN-BOVW实验结果及分析 |
6.2.1 特征融合对分类性能的影响 |
6.2.2 现有算法与本文算法分类结果对比 |
6.2.3 实验参数的对比分析 |
6.3 融合复杂网络和空间特征分类实验结果及分析 |
6.3.1 特征融合对分类结果的影响 |
6.3.2 CN-LBP和CN-Gabor与其他算法实验对比 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
攻读学位期间取得的科研成果 |
致谢 |
(2)基于SLAM的煤矿井下空间重建方法的研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 智能矿山与智能化开采研究现状 |
1.2.2 视觉SLAM国内外研究现状 |
1.2.3 煤矿井下三维地图构建研究现状 |
1.3 论文主要工作及章节安排 |
1.3.1 主要研究内容 |
1.3.2 章节安排 |
2 视觉SLAM基础理论 |
2.1 RGB-D SLAM算法 |
2.2 相机成像模型 |
2.2.1 针孔模型 |
2.2.2 畸变模型 |
2.3 坐标系的相互转换 |
2.4 相机标定 |
2.5 视觉SLAM算法性能评价指标 |
2.5.1 绝对轨迹误差 |
2.5.2 相对位姿误差 |
2.6 本章小结 |
3 基于RGB -D相机的传感器信息获取 |
3.1 Kinect传感器 |
3.1.1 Kinect介绍 |
3.1.2 Kinect2.0相机标定 |
3.2 深度图像去噪 |
3.2.1 去噪算法 |
3.2.2 评价指标 |
3.2.3 实验结果及分析 |
3.3 点云预处理 |
3.3.1 三维点云获取 |
3.3.2 体素化栅格下采样 |
3.4 本章小结 |
4 基于ORB特征点法的视觉里程计 |
4.1 视觉里程计算法 |
4.1.1 直接法 |
4.1.2 特征点法 |
4.2 图像特征提取 |
4.2.1 SIFT算法 |
4.2.2 SURF算法 |
4.2.3 ORB算法 |
4.2.4 改进的ORB特征提取算法 |
4.2.5 特征提取方法对比实验及分析 |
4.3 图像特征匹配 |
4.3.1 GMS配准算法 |
4.3.2 RANSAC配准算法 |
4.3.3 改进的RANSAC算法 |
4.3.4 特征匹配方法对比实验及分析 |
4.4 位姿估计优化 |
4.4.1 ICP配准算法 |
4.4.2 点云配准实验及分析 |
4.5 本章小结 |
5 基于RGB-D图像的三维地图优化与构建 |
5.1 关键帧的选取 |
5.2 基于BA的局部地图优化 |
5.2.1 SLAM模型 |
5.2.2 局部BA优化 |
5.3 基于回环检测的全局一致性地图优化 |
5.3.1 回环检测 |
5.3.2 词袋模型 |
5.3.3 相似度计算 |
5.4 基于RGB-D图像的三维点云地图构建 |
5.4.1 三维点云地图构建 |
5.4.2 实验及分析 |
5.5 三维八叉树地图构建 |
5.5.1 八叉树地图构建 |
5.5.2 八叉树地图构建实验及分析 |
5.6 算法性能分析 |
5.7 本章小结 |
6 总结和展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
(3)应用刚柔耦合模型和图像识别的行星齿轮箱微弱故障诊断(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 课题研究背景及其意义 |
1.2 行星齿轮箱故障诊断国内外研究现状 |
1.3 图像识别技术的发展现状 |
1.4 论文主要研究内容 |
2 基于Solid Works和ADAMS的刚柔耦合动力学模型建立 |
2.1 行星齿轮箱特点及故障类型 |
2.1.1 行星齿轮箱结构特点 |
2.1.2 行星齿轮箱传动特点 |
2.1.3 行星齿轮箱故障类型 |
2.2 三维模型建立 |
2.3 柔性体建立 |
2.4 故障模型建立 |
2.5 刚柔耦合动力学模型建立 |
2.5.1 模型导入 |
2.5.2 材料设置 |
2.5.3 连接设置 |
2.5.4 接触设置 |
2.5.5 测点布置 |
2.6 本章小结 |
3 基于刚柔耦合动力学模型的测点选择仿真研究 |
3.1 仿真参数设置 |
3.2 仿真信号处理 |
3.3 模型验证 |
3.3.1 转速计算验证 |
3.3.2 频谱成分验证 |
3.4 信号特征分析 |
3.4.1 特征值提取 |
3.4.2 特征值比较 |
3.5 测点选择与结构改进 |
3.5.1 测点选择 |
3.5.2 结构改进 |
3.5.3 刚柔耦合动力学仿真分析 |
3.6 本章小结 |
4 基于图像识别的行星齿轮箱微弱故障诊断研究 |
4.1 数学模型的建立 |
4.1.1 信号图像转换 |
4.1.2 特征描述—SIFT算法 |
4.1.3 词袋(BoW)模型 |
4.1.4 直方图相交核支持向量机 |
4.2 基于测点选择的行星齿轮箱振动信号采集 |
4.2.1 实体实验平台 |
4.2.2 实体实验设置 |
4.2.3 基于实体实验的振动信号采集 |
4.2.4 仿真实验设置 |
4.2.5 基于仿真实验的振动信号采集 |
4.3 仿真实验验证 |
4.3.1 振动信号图像转换 |
4.3.2 基于SIFT的特征检测和描述 |
4.3.3 基于BOW和HIK_SVM的行星齿轮箱微弱故障诊断 |
4.3.4 仿真实验结果分析 |
4.4 实体实验验证 |
4.4.1 振动信号图像转换 |
4.4.2 基于SIFT的特征检测和描述 |
4.4.3 基于BOW和HIK_SVM的行星齿轮箱微弱故障诊断 |
4.4.4 实体实验结果分析 |
4.5 本章小结 |
5 总结与展望 |
5.1 总结 |
5.2 展望 |
参考文献 |
攻读硕士学位期间发表的论文及研究成果 |
攻读硕士学位期间的其他成果 |
致谢 |
(4)电子航海通告内容识别关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 引言 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 论文内容和结构安排 |
第二章 数据结构的分析与定义 |
2.1 通告源数据结构分析 |
2.2 通告预处理数据库结构定义 |
2.2.1 航海通告编写标准 |
2.2.2 数据表结构定义 |
2.3 本章小结 |
第三章 数据处理技术研究 |
3.1 文本类文档的处理技术 |
3.1.1 PDF文档拆分 |
3.1.2 文档格式转换 |
3.2 文本图像预处理 |
3.2.1 灰度化 |
3.2.2 二值化 |
3.2.3 图像去噪 |
3.2.4 倾斜校正 |
3.3 One Note简述 |
3.4 正则表达式 |
3.5 本章小结 |
第四章 系统功能设计 |
4.1 系统开发环境 |
4.2 系统工作流程 |
4.3 系统模块设计 |
4.4 类代码设计 |
4.5 本章小结 |
第五章 案例与分析 |
5.1 应用实例 |
5.1.1 系统界面介绍 |
5.1.2 图像预处理功能 |
5.1.3 字符识别功能 |
5.1.4 数据修编功能 |
5.2 应用结果分析 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
研究生期间取得的科研成果 |
致谢 |
(5)基于水印和区块链技术的数字图像交易管理研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.3 国内外研究现状 |
1.3.1 数字图像交易管理国内外研究现状 |
1.3.2 数字水印技术国内外研究现状 |
1.3.3 区块链技术国内外研究现状 |
1.3.4 智能推荐技术国内外研究现状 |
1.4 研究思路与方法 |
1.5 研究内容及创新点 |
1.6 论文的组织结构 |
第二章 预备知识 |
2.1 数字水印技术 |
2.1.1 数字水印概述 |
2.1.2 数字图像水印技术 |
2.2 区块链技术 |
2.2.1 区块链概述 |
2.2.2 区块链架构模型 |
2.2.3 区块链区块结构 |
2.2.4 区块链的运行过程 |
2.2.5 智能合约 |
2.3 智能推荐技术 |
2.3.1 智能推荐技术概述 |
2.3.2 常用的推荐算法 |
2.4 本章小结 |
第三章 基于SVD与深度学习的数字图像多功能零水印算法研究 |
3.1 理论基础 |
3.1.1 离散小波变换 |
3.1.2 奇异值分解 |
3.1.3 深度学习技术 |
3.1.4 深度卷积神经网络 |
3.1.5 深度置信网络 |
3.2 基于SVD和 DCNN的数字图像多功能零水印算法 |
3.2.1 算法设计思想 |
3.2.2 基于SVD和 DCNN的数字图像多功能构造零水印算法 |
3.2.3 基于SVD和 DCNN的数字图像多功能提取零水印算法 |
3.2.4 仿真实验和分析 |
3.3 基于SVD和 DBN的数字图像多功能零水印算法 |
3.3.1 算法设计思想 |
3.3.2 基于SVD和 DBN的数字图像多功能构造零水印算法 |
3.3.3 基于SVD和 DBN的数字图像多功能提取零水印算法 |
3.3.4 仿真实验和分析 |
3.4 本章小结 |
第四章 数字图像交易管理中智能合约分类算法研究 |
4.1 理论知识 |
4.1.1 智能合约分类的难点 |
4.1.2 智能合约分类相关研究 |
4.1.3 Word2Vec |
4.1.4 堆叠自编码器 |
4.1.5 随机权极速学习机 |
4.1.6 双向长短期记忆神经网络 |
4.1.7 加权交叉熵损失函数 |
4.2 基于自编码随机权ELM网络的智能合约分类算法 |
4.2.1 算法设计思想 |
4.2.2 基于自编码随机权ELM网络的智能合约分类模型 |
4.2.3 基于自编码随机权ELM网络的智能合约分类算法描述 |
4.2.4 仿真实验与分析 |
4.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法 |
4.3.1 算法设计思想 |
4.3.2 基于加权交叉熵损失函数的长短记忆智能合约分类模型 |
4.3.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法描述 |
4.3.4 仿真实验与分析 |
4.4 智能合约分类算法在数字图像交易管理中的应用 |
4.4.1 自编码随机权ELM网络分类算法在数字图像交易智能合约分类中的应用 |
4.4.2 加权交叉熵损失函数Bi LSTM分类算法在数字图像交易智能合约分类中的应用 |
4.5 本章小结 |
第五章 数字图像交易管理中个性化智能推荐算法研究 |
5.1 理论知识 |
5.1.1 Text Rank算法 |
5.1.2 加权Text Rank算法 |
5.1.3 自组织特征映射神经网络 |
5.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法 |
5.2.1 算法设计思想 |
5.2.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐模型 |
5.2.3 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法描述 |
5.2.4 仿真实验和分析 |
5.3 本章小结 |
第六章 数字图像交易管理系统 |
6.1 数字图像交易管理系统架构 |
6.1.1 数字图像交易管理系统整体架构 |
6.1.2 数字图像交易管理Web服务子系统架构 |
6.1.3 区块链数字图像交易管理子系统架构 |
6.2 基于水印和区块链技术的数字图像交易管理系统设计 |
6.2.1 数字图像交易管理Web服务子系统功能设计 |
6.2.2 区块链数字图像交易管理子系统功能设计 |
6.3 数字图像交易管理系统的主要管理模型 |
6.3.1 数据图像交易管理系统的数字图像交易管理模型 |
6.3.2 数字图像交易管理系统的数据安全保护管理模型 |
6.3.3 数字图像交易管理系统的版权保护管理模型 |
6.3.4 数字图像交易管理系统的智能合约管理模型 |
6.3.5 数字图像交易管理系统中个性化推荐管理模型 |
6.5 本章小结 |
第七章 结论与展望 |
7.1 主要结论和创新 |
7.2 研究展望 |
参考文献 |
致谢 |
个人简介及攻读学位期间取得的研究成果 |
(6)运动姿态视频测量分析仪高速JPEG译码器设计(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 JPEG图像压缩标准的发展 |
1.2.2 高速JPEG译码技术的研究现状 |
1.3 论文研究内容与研究目标 |
1.4 论文章节安排 |
2 分析仪系统结构与高速译码器方案 |
2.1 运动姿态视频测量分析仪 |
2.1.1 分析仪系统结构 |
2.1.2 任务切割与映射 |
2.1.3 图像实时采集与存储 |
2.2 JPEG编译码存储系统 |
2.3 高速JPEG译码器设计指标 |
2.4 高速译码器总体架构 |
2.5 实现平台及资源分析 |
2.6 本章小结 |
3 高速译码算法设计与仿真分析 |
3.1 JPEG标准的基本原理和方法 |
3.2 JPEG编码过程 |
3.3 高速译码算法设计 |
3.3.1 数据预处理模块设计 |
3.3.2 熵解码模块设计 |
3.3.3 反量化和反Zig Zag扫描模块设计 |
3.3.4 高速2D-IDCT模块设计 |
3.4 本章小结 |
4 高速译码器FPGA实现 |
4.1 译码器总体结构设计 |
4.2 数据预处理模块FPGA实现 |
4.2.1 输入缓冲模块 |
4.2.2 数据选择模块 |
4.2.3 JFIF头文件解析模块 |
4.2.4 数据拼接模块 |
4.3 熵解码模块FPGA实现 |
4.3.1 读入数据模块 |
4.3.2 Huffman解码模块 |
4.3.3 DPCM_RLD 解码模块 |
4.4 反量化和反Zig Zag扫描模块FPGA实现 |
4.5 高速2D-IDCT变换模块FPGA实现 |
4.5.1 第一级1D-IDCT单元设计 |
4.5.2 转置单元设计 |
4.5.3 第二级1D-IDCT单元设计 |
4.6 本章小结 |
5 系统测试与结果分析 |
5.1 测试平台搭建 |
5.2 测试方案 |
5.3 模块联调仿真测试 |
5.4 系统性能测试与分析 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
攻读学位期间取得的研究成果 |
(7)基于机器学习的场景理解关键技术研究(论文提纲范文)
摘要 |
abstract |
缩略词表 |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究现状 |
1.3 本文的研究内容与创新点 |
1.4 论文的结构安排 |
第二章 场景理解常见算法和模型概述 |
2.1 图像特征表达 |
2.1.1 基于外观属性的图像特征表达 |
2.1.2 基于空间结构模型的图像特征表达 |
2.1.3 基于深度学习的图像特征表达 |
2.2 分类判决 |
2.2.1 基于判别式模型的分类 |
2.2.2 基于生成式模型的分类 |
2.3 相关数据集简介 |
2.3.1 图像分类数据集 |
2.3.2 图像语义分割数据集 |
2.4 本章小结 |
第三章 基于主节点分析的图像分类方法 |
3.1 引言 |
3.2 基于主节点分析算法的图像特征表达 |
3.2.1 相关模型 |
3.2.2 主节点分析算法的实现 |
3.2.3 基于PNA的字典学习算法 |
3.3 实验设置 |
3.3.1 数据集和图像分类基线方法 |
3.3.2 参数设置 |
3.3.3 实施细节 |
3.4 实验结果与分析 |
3.4.1 Scene-15 场景数据集 |
3.4.2 Caltech-101 数据集 |
3.4.3 Caltech-256 数据集 |
3.4.4 综合性能分析 |
3.5 本章小结 |
第四章 基于快速字典学习策略的图像分类方法 |
4.1 引言 |
4.2 基于PFA的快速字典学习策略 |
4.2.1 相关模型 |
4.2.2 PFA算法实现 |
4.3 基于PFA的图像分类 |
4.4 实验结果与分析 |
4.4.1 Scene-15 场景数据集 |
4.4.2 Caltech-101 数据集 |
4.4.3 Caltech-256 数据集 |
4.4.4 综合性能分析 |
4.5 本章小结 |
第五章 基于深度学习模型的图像分类方法 |
5.1 引言 |
5.2 基于并行核主成分分析网络的图像分类方法 |
5.2.1 PK-PCANet网络模型 |
5.2.2 实验结果与分析 |
5.2.3 综合性能分析 |
5.3 基于注意力金字塔残差网络的图像分类方法 |
5.3.1 APRNet网络模型 |
5.3.2 实验结果与分析 |
5.3.3 综合性能分析 |
5.4 本章小结 |
第六章 基于双通道多特征分析的场景理解模型 |
6.1 引言 |
6.2 双通道多特征分析模型的基本框架 |
6.3 基于双通道多特征分析的特征提取算法 |
6.3.1 灰度通道分析 |
6.3.2 彩色通道分析 |
6.3.3 特征降维 |
6.3.4 双通道特征加权融合 |
6.4 基于双通道多特征的图像语义分割 |
6.4.1 查询集 |
6.4.2 超像素标记 |
6.4.3 实验验证和分析 |
6.5 基于双通道多特征的图像场景分类 |
6.5.1 视觉字典学习 |
6.5.2 线性Sc SPM模型 |
6.5.3 实验验证和分析 |
6.6 本章小结 |
第七章 总结与展望 |
7.1 全文总结 |
7.2 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(8)面向智能中医辅助诊疗的多注意力和知识辅助神经网络设计研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究意义与应用前景 |
1.1.1 智能中医本身的研究及应用意义 |
1.1.2 智能中医对理论研究的推动作用 |
1.2 智能中医中望诊和问诊研究现状 |
1.2.1 医疗在线咨询文本理解和分类技术 |
1.2.2 基于舌质及面部图像分析的辅助望诊技术 |
1.3 面临主要挑战及其针对性的创新点 |
1.4 本文的内容及章节安排 |
第二章 本文涉及到的相关理论基础 |
2.1 循环系列神经网络及其注意力机制 |
2.1.1 循环神经网络及其变种 |
2.1.2 循环神经网络中的注意力机制 |
2.2 卷积神经网络及其注意力机制 |
2.2.1 卷积结构及常见的卷积神经网络模型 |
2.2.2 卷积神经网络中的注意力机制 |
2.3 图卷积网络及知识学习与嵌入技术 |
2.3.1 图卷积神经网络基本原理 |
2.3.2 计算机视觉中的图建模及知识注入模型 |
2.4 零样本学习 |
2.5 本章小结 |
第三章 面向患者提问进行科室分类的语素增强模型 |
3.1 概述 |
3.2 准备性的模块 |
3.2.1 基于互信息提取指示项 |
3.2.2 基于词嵌入的句子单词表示 |
3.3 提出的方法 |
3.3.1 序列中的语素扩展和增强 |
(a)扩展策略 |
(b)扩展距离 |
(c)扩展增强项的生成 |
3.3.2 用于提问科室分类的循环系列神经网络 |
3.4 实验结果与分析 |
3.4.1 实验数据集 |
3.4.2 实验设置 |
(a)预处理 |
(b)词嵌入模型的训练 |
(c)对比方法 |
(d)评价指标 |
3.4.3 实验结果 |
(a)训练曲线分析 |
(b)对比结果分析 |
3.4.4 讨论 |
3.5 本章小结 |
第四章 基于舌像分析进行的中药处方自动构建模型 |
4.1 概述 |
4.2 研究材料和提出的方法 |
4.2.1 舌像数据集与对应处方标签的收集 |
4.2.2 神经网络处方构建架构 |
(a)处方自动构建任务描述 |
(b)基于卷积管道及全连接层的模型结构 |
(c)辅助疗法知识建模的优化策略 |
(d)对于患者舌像输入的数据增强 |
(e)基于ImageNet与训练的权重转移 |
4.3 实验结果与分析 |
4.3.1 实验数据与预处理操作 |
4.3.2 实验设置 |
(a)对比实验工作流 |
(b)神经网络的超参数设置 |
(c)评价指标 |
4.3.3 模型性能评价 |
(a)训练过程和疗法主题分布情况 |
(b)处方构建结果对比 |
(c)人工测评 |
(d)评测经过权重预训练的深度模型 |
4.3.4 讨论 |
4.4 本章小结 |
第五章 基于内成像机制的高效视觉建模卷积神经网络 |
5.1 概述 |
5.2 内成像高效卷积网络架构 |
5.2.1 内成像框架整体概览 |
5.2.2 内成像模型在残差网络上的特别版本 |
5.3 内成像卷积架构的理论设计分析 |
5.3.1 在卷积网络上进行内成像机制的理论分析 |
5.3.2 残差和恒等映射联合建模的动机 |
5.4 实验结果与分析 |
5.4.1 数据集 |
5.4.2 实现细节 |
5.4.3 关于不同内成像模型类型的性能分析 |
5.4.4 消解实验及分析 |
5.4.5 内成像机制与空间注意力机制的配合性能 |
5.4.6 与其他模型的对比实验 |
5.4.7 讨论 |
5.5 本章小结 |
第六章 基于内成像及区域注意力模型的舌像病位识别 |
6.1 概述 |
6.2 患者病位分类数据集 |
6.3 全通道区域注意力网络 |
6.3.1 模型整体架构介绍 |
6.3.2 提出模型的技术细节和扩展 |
6.4 实验与分析 |
6.4.1 实现细节 |
6.4.2 消解实验 |
6.4.3 对比其他舌像建模方法 |
6.4.4 对比其他深度卷积神经网络模型 |
6.4.5 可视化 |
6.4.6 讨论 |
6.5 本章小结 |
第七章 基于视觉语义图谱建模的零样本识别探索 |
7.1 概述 |
7.2 图建模视觉-语义纠缠网络模型 |
7.2.1 零次学习问题的定义 |
7.2.2 整体框架 |
(a)语义知识图谱 |
(b)双管道网络结构 |
(c)CNN与GCN的纠缠策略 |
(d)将分层语义特征融合到视觉嵌入中 |
7.3 本章采用的零次学习的预测和优化方法 |
7.3.1 归纳式零次学习模式 |
7.3.2 转导式零次学习模式 |
7.4 实验与分析 |
7.4.1 实验设置 |
(a)数据集 |
(b)评测指标 |
(c)实现细节 |
7.4.2 狭义零次学习的对比结果 |
(a)整体结果 |
(b)与其他注意力类型的网络模型的对比结果 |
(c)关于属性词向量子输出的消解分析 |
(d)关于语义关系特征融合到视觉嵌入的消解分析 |
(e)关于其他超参数的分析 |
7.4.3 广义零次学习的对比结果 |
7.4.4 模型的可视化与消歧性能分析 |
7.5 本章小结 |
总结与展望 |
1 本文研究工作及贡献的总结 |
2 未来研究工作的展望 |
参考文献 |
攻读博士学位期间取得的研究成果 |
致谢 |
附件 |
(9)基于视觉特征提取的图像检索算法研究(论文提纲范文)
摘要 |
ABSTRACT |
符号对照表 |
缩略语对照表 |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 基于内容图像检索系统的工作流程 |
1.2.1 颜色 |
1.2.2 纹理 |
1.2.3 形状 |
1.2.4 空间关系 |
1.2.5 反馈技术 |
1.3 国内外知名的图像检索系统 |
1.3.1 国外知名的系统 |
1.3.2 国内知名的系统 |
1.4 国内外研究现状 |
1.4.1 CBIR研究的早期发展 |
1.4.2 基于兴趣点法的图像检索 |
1.4.3 基于视觉词汇的图像检索 |
1.4.4 基于浅层多特征的图像检索 |
1.4.5 基于深度特征的图像检索 |
1.5 主要研究内容和论文结构安排 |
1.6 论文主要创新及贡献 |
第二章 彩色能量导向局部模式和颜色直方图(LCEOPaCH)的图像检索 |
2.1 研究背景 |
2.2 LCEOPaCH算法 |
2.2.1 彩色图像的量化 |
2.2.2 局部彩色能量指向模式 |
2.2.3 距离准则 |
2.3 实验结果 |
2.3.1 实验数据集 |
2.3.2 评估准则 |
2.3.3 参数评估 |
2.3.4 检索性能 |
2.4 结论 |
第三章 稳定兴趣点区域(SIPR)的图像检索 |
3.1 研究背景 |
3.2 稳定兴趣点区域算法描述 |
3.2.1 兴趣点检测 |
3.2.2 稳定兴趣点区域 |
3.2.3 稳定兴趣点区域的特征提取 |
3.2.4 相似性度量 |
3.3 实验结果 |
3.3.1 实验数据集 |
3.3.2 评估准则 |
3.3.3 检索性能 |
3.4 结论 |
第四章 一致性区域主颜色及胡矩(DCD-HM)的图像检索 |
4.1 研究背景 |
4.2 相关工作 |
4.3 DCD-HM的图像检索算法 |
4.3.1 颜色量化 |
4.3.2 一致性区域 |
4.3.3 主颜色的特征提取 |
4.3.4 胡矩特征的提取 |
4.3.5 距离度量 |
4.3.6 DCD-HM算法流程 |
4.4 实验结果 |
4.4.1 实验数据集 |
4.4.2 评估准则 |
4.4.3 参数评估 |
4.4.4 检索性能 |
4.5 结论 |
第五章 基于区域相关和方向相关(CROCD)的图像检索 |
5.1 研究背景 |
5.2 区域相关和方向相关描述符 |
5.3 CROCD算法流程 |
5.3.1 图像的颜色量化 |
5.3.2 区域相关描述符 |
5.3.3 方向相关描述符 |
5.3.4 特征向量的合成 |
5.3.5 相似性度量 |
5.4 实验结果 |
5.4.1 实验数据集 |
5.4.2 评估准则 |
5.4.3 参数评估 |
5.4.4 检索性能 |
5.5 结论 |
第六章 总结与展望 |
6.1 研究工作总结 |
6.2 研究展望 |
参考文献 |
致谢 |
作者简介 |
(10)基于Kinect的动态中国手语识别(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 目前存在的问题 |
1.4 论文的主要研究内容和章节安排 |
1.4.1 论文的主要研究内容 |
1.4.2 论文的章节安排 |
2 手部区域的分割与跟踪 |
2.1 手部区域分割方法 |
2.1.1 基于肤色的分割 |
2.1.2 基于深度信息的分割 |
2.1.3 彩色与深度摄像头定标 |
2.1.4 结合肤色和深度信息的分割 |
2.2 手部区域跟踪方法 |
2.2.1 基于目标模型建模法跟踪 |
2.2.2 相关滤波法跟踪 |
2.2.3 基于搜索法跟踪 |
2.3 卡尔曼滤波与区域生长法结合的手部改进跟踪算法 |
2.3.1 卡尔曼滤波跟踪 |
2.3.2 改进的结合区域生长法分割结果的卡尔曼滤波跟踪 |
2.3.3 当双手接触和遮挡时的跟踪点预测 |
2.4 实验结果与分析 |
2.5 本章小结 |
3 基于轨迹的手语识别 |
3.1 数据集简介 |
3.2 轨迹数据预处理 |
3.2.1 手语起止点的确定 |
3.2.2 轨迹归一化 |
3.2.3 坐标系间转换 |
3.3 基于轨迹的动态手语识别算法 |
3.3.1 动态时间规整算法 |
3.3.2 支持向量机 |
3.3.3 以DDTW为核函数的SVM |
3.4 基于不同特征的手语轨迹识别实验对比与分析 |
3.4.1 基于不同识别算法的对比实验 |
3.4.2 基于不同轨迹特征的对比实验 |
3.5 本章小结 |
4 基于深度运动图的手型识别 |
4.1 深度运动图 |
4.1.1 深度运动图的生成 |
4.1.2 加权提取的深度运动图 |
4.2 提取深度运动帧中关键手型的方法 |
4.3 手型识别算法 |
4.3.1 极限学习机 |
4.4 手型特征提取与编码 |
4.4.1 方向梯度直方图特征 |
4.4.2 局部二值模式特征 |
4.4.3 特征编码 |
4.5 实验结果与分析 |
4.6 本章小结 |
总结与展望 |
参考文献 |
致谢 |
作者简历及攻读硕士学位期间的科研成果 |
四、WORD彩色图像的模式转换(论文参考文献)
- [1]基于复杂网络和视觉词典的高光谱遥感图像分类[D]. 宁晨. 太原理工大学, 2021(01)
- [2]基于SLAM的煤矿井下空间重建方法的研究[D]. 徐战. 西安科技大学, 2021(02)
- [3]应用刚柔耦合模型和图像识别的行星齿轮箱微弱故障诊断[D]. 任川. 中北大学, 2021(09)
- [4]电子航海通告内容识别关键技术研究[D]. 吴婉婷. 上海海洋大学, 2021(01)
- [5]基于水印和区块链技术的数字图像交易管理研究[D]. 赵彦霞. 河北大学, 2021
- [6]运动姿态视频测量分析仪高速JPEG译码器设计[D]. 刘思军. 西南科技大学, 2021
- [7]基于机器学习的场景理解关键技术研究[D]. 杨峰. 电子科技大学, 2021(01)
- [8]面向智能中医辅助诊疗的多注意力和知识辅助神经网络设计研究[D]. 胡杨. 华南理工大学, 2020(05)
- [9]基于视觉特征提取的图像检索算法研究[D]. 谢光艺. 西安电子科技大学, 2020(02)
- [10]基于Kinect的动态中国手语识别[D]. 谢靖怡. 大连海事大学, 2020(01)