一、Word 的“压缩”功能(论文文献综述)
吴湘平[1](2021)在《图像文本识别的关键技术研究》文中进行了进一步梳理图像文本识别主要利用机器学习算法对图像上出现的印刷体或者手写体进行识别,然后转录为计算机能读取识别的文字。图像文本识别在机器自动化、人机交互、自动驾驶等领域具有广泛的应用,一直是计算机视觉领域的研究热点。近年来,随着深度学习的发展,深度神经网络在场景文本识别和手写识别等方面取得了巨大的成功。然而,图像文本识别仍是一个棘手的问题,主要面临以下挑战:1)对于复杂场景的字符识别,现有方法容易丢失字符结构信息和引入背景噪声;2)对于词识别,现有模型大多依赖词典驱动,难以应用到资源匮乏的语言上;3)对于文本行识别,存在序列过长导致识别性能下降的问题;4)对于具有大字符集的语言,模型复杂、参数庞大,难以应用到存储和计算受限的设备中。本文针对以上问题,主要从图像文本识别的关键技术:识别技术和压缩技术开展研究,其中识别技术包括图像中不同粒度的文本即字、词、句子的识别,最后使用压缩技术对识别模型进行优化,主要研究内容包括以下几个方面:第一,针对复杂场景字符识别中,容易丢失字符结构信息和引入背景噪声等问题,提出了基于语义分割的复杂场景字符识别方法。为了减少字符类标数量,该方法首先设计了一种基于五笔汉字编码的新类标编码方法,将汉字的字形和结构信息编码为140位类标,从而大大减轻了对大字符集类别进行识别的计算和存储需求。其次,采用有效的语义分割模型进行逐像素预测,并利用条件随机场模块来学习类五笔编码的约束规则。最后,在三个公开评测数据集上的实验结果表明,该方法在复杂场景字符识别任务达到了最新水平,并且对于遮挡、超低分辨率、超低对比度等复杂的场景具有鲁棒性。第二,针对词识别模型依赖词典驱动和外部语言资源的问题,提出了基于位置向量的无约束手写单词识别方法。该方法首先生成位置向量,并将位置向量作为单词相对应的字符序列的索引;接着,将提取到图像特征与每个位置向量相结合,送入序列识别网络用于识别相应的字符。最后,在两个国际公共语料库上均取得了最佳结果。实验结果表明,在没有任何语言资源的情况下,该方法的性能与集成丰富语言资源的模型相近,证明了该方法对其他资源匮乏语言识别的有效性和潜在能力。第三,针对文本行识别模型存在序列过长导致识别性能下降的问题,提出了基于自适应超图神经网络的手写文本行识别方法。该方法通过一种基于标签向量的自动超图学习机制来自动建模字符间的关系。首先,将字符标签当做超图的节点,一条超边连接两个或多个节点,表示字符之间的某种关系,使用标签向量来构造自适应超图。其次,使用语义解耦模块和超图神经网络来探索特征与语义之间的相互作用,以提高文本行识别性能。最后,为了验证模型的泛化性,将自适应超图神经网络扩展到多标签图像分类任务上。结果证明,提出的自适应超图神经网络具有建模语义依赖关系的能力。第四,针对大字符集的识别模型参数庞大,难以应用到资源有限设备上的问题,提出了图像文本识别模型的全连接层压缩方法。该方法引入压缩因子来压缩全连接层的神经元,这不仅可以消除特征冗余,而且可以共享分类神经元。它打破了输出神经元数量必须与分类网络中类别数量相一致的局限性,在一定程度上缓解了大类别分类的问题。与其他需要预训练模型和微调的方法相比,该方法可以直接在基线模型上构造和压缩网络以实现端到端的训练。最后,在手写汉字识别,复杂场景字符识别和图像分类等多个任务的实验结果表明,所提出的方法可以大大减少模型参数,同时保持最新的识别性能,特别是对于大类别分类任务。综上所述,本文围绕图像文本识别的关键技术进行深入研究和讨论。针对图像中不同粒度的文本即字、词、句子存在的问题,分别提出基于语义分割的复杂场景字符识别方法,基于位置向量的无约束手写单词识别方法和基于自适应超图神经网络的文本行识别方法。最后针对共同存在的大字符集识别问题,提出基于全连接层的参数共享方法对图像文本识别模型进行参数压缩。本文将所提出的方法在多个国际公开数据集上进行实验,最终均取得优异的性能。
陈辉[2](2021)在《美国国情咨文演说的话语合法化策略:语类分析视角》文中提出20世纪90年代初,冷战结束。美国成为世界上唯一的超级大国,成为一个主导世界格局并具有话语霸权的国家。国情咨文演说代表了美国政府的政治议程,本文探讨了其话语策略,旨在揭示美国政治话语策略的合法化本质以及隐藏在合法化话语中的价值体系和意识形态。作为重要的政治话语,国情咨文演说的政治本质和交际意图是使美国政府的政治议程合法化,以获得国会议员和公众的认可和支持。然而,迄今为止,很少有学者对国情咨文演说的话语合法化策略1进行过系统研究。而且,关于政治话语合法化策略的现有研究主要是从批评话语分析视角展开,在研究视角、研究理论、研究方法和研究深度方面还有很大的完善空间。本文将悉尼学派的语类分析视角运用于国情咨文演说的合法化策略研究中,提出了四个各有侧重但又相互关联的研究问题:1)作为政府工作报告,国情咨文演说关注的优先事项是什么?优先事项的历年变化折射出哪些政策变迁轨迹?2)演说者如何在独白式语篇中与受众进行对话以获得期待的对话空间和协商空间?3)为了实现既定的交际意图,国情咨文演说的语类结构由哪些部分组成并具有哪些突出特征?4)国情咨文演说作为政治话语语类,其语类特征具有哪些合法化功能?语类特征的合法化功能与传统的话语合法化策略之间的联系是什么?前三个问题从语类分析视角全面分析了国情咨文演说的语类特征,为回答第四个问题提供了实证依据;第四个问题以语类分析为主导视角探讨了语类特征的合法化功能及其表现形式,并结合批评话语分析视角识别了传统的合法化策略(van Leeuwen,2007;2008)在文本中的实现方式和作用。本文选择了 1989年至2020年期间五届政府的国情咨文演说作为分析语料。根据不同的研究问题,本文运用相关的理论框架对语料进行标注和编码,对语料文本进行定量和定性分析,从演说者阐述的优先事项、与受众互动表现出的对话性以及演说语篇呈现的高度规约化的语类结构这三个维度对国情咨文演说的语类特征进行了系统分析,旨在探究隐藏在这些语类特征背后的话语合法化功能和策略。首先,本文通过语料库分析软件PowerConc提取了在分析语料库中能凸显话题特征的前50个主题词,归纳了美国五届政府共同关注的十类优先事项:国土安全、经济、社会保障、教育、家庭、就业、科技、犯罪、能源和价值观。上述议题体现了美国历届政府在优先事项上的延续性。然后,以同样的方式提取主题词,本文将在每届政府的语料文本中能凸显话题特征的前10个主题词,分别和在分析语料库中能凸显话题特征的前10个主题词进行比较。分析语料库中的这10个主题词涵盖了就业、家庭、社会保障、教育、国土安全(反恐)和经济六类优先事项,是五届政府共同关注的优先事项。结果显示,除开克林顿政府,其他四届政府都有除了这六类优先事项之外特别重视的工作事项,体现了这四届不同政府在优先事项上的时代性。具体表现为,乔治·布什政府重视推行“自由”价值观和打击毒品犯罪;乔治·沃克·布什政府同样强调“自由”价值观的重要性;奥巴马政府视能源问题为影响国家利益和安全的重要因素;特朗普政府将打击毒品犯罪、推行移民新策、加强基础设施建设和提高妇女地位列为其政治议程中的重要事项。其次,基于评价理论的介入系统框架,本文探究了演说者运用不同的介入方式和介入资源在独白式语篇中和受众进行互动并为自己赢得协商空间的对话过程。国情咨文演说的对话性主要表现在四个方面:二个对话模式,即对话性压缩和对话性扩展;二个主要介入方式,即“否认”和“接纳”;三个核心话题,即“计划”、“问题”和“处事风格/价值观”;二个关键因素,即话语主体责任和对话空间。随后,基于Martin(1992)提出的“语类图式结构”概念,本文在宏观和微观层面还原了国情咨文演说的语类结构,即由一系列可识别的五个“阶段”组成:问候^序曲^政府工作报告^宣言^致谢,其中阶段3“政府工作报告”是其最重要的组成部分,由12个核心“步骤”组成:社会问题、优先事项、新政策、成就、民族自豪感、团结、挑战、价值观、政府责任、嘉宾、故事、国际担当2。国情咨文演说的语类结构在整体上呈现出规律性、灵活性和递归性。最后,基于前三个研究问题的发现,本文解构了演说者运用一系列话语合法化策略来证明其政治议程的合法性的过程。结果显示,国情咨文演说的语类特征本身就具有合法化功能,包括优先事项的意识形态本质、构建理想受众以及高度规约化的语类结构所蕴涵的传统的合法化策略(包括“授权”、“合理化”、“道德评价”、“叙事化”和“情感诉求”)。语类特征的合法化功能占据着主导地位,而传统的合法化策略(van Leeuwen,2007;2008)作为更具体的方式来辅助和提升语类特征的合法化功能,其中“道德评价”、“授权”和“情感诉求”成为贯穿演说始终的主要话语合法化策略。本文是针对政治话语合法化策略进行的一次具有创新性的探索。本文剖析了语类特征的合法化功能,并将语类特征的合法化功能与传统的话语合法化策略联系起来,还扩展了具有开创性意义的van Leeuwen(2007;2008)的分析框架,增添了属于“授权”类别的“机构权威”和“宗教权威”子类别、属于“神话虚构”3类别的“叙事故事”子类别和独立的“情感诉求”类别。另外,本文以语类分析视角为主导视角,并结合批评话语分析视角,原创性地构建了一个专门用于分析政治话语合法化策略的研究路径,弥补了传统的话语合法化策略研究在研究视角、研究理论、研究方法和研究深度上的不足。
陈俞源[3](2021)在《基于BERT模型的建筑事故隐患分类研究》文中指出随着建筑企业信息化建设的推进,智慧化管理需求日益增长,因此,如何构建建筑企业的隐患管理信息系统就成为了目前的研究热点及难点。安全检查通报作为建设项目上最为普及的事故隐患排查方法,其记录着在建项目全周期的隐患变化情况,但对通报进行人工分类需要耗费大量的时间和人力,对人员的知识背景也有较高要求。因此实现建筑事故隐患自动分类功能,提升建筑事故隐患排查效率,对隐患信息的智能化管理具有借鉴意义。本文为实现事故隐患排查信息的自动分类分类功能,提升安全检查通报的实用性和适用性,提出了用于建筑事故隐患分类的Bert改进及压缩模型,并基于Tkinter库建立了隐患自动分类交互系统。本文的主要工作如下:(1)对某建筑公司2013年1月—2020年8月近8年间企业管理系统中的安全检查通报进行了整理,获取了共612份安全检查通报,并对其进行数据清洗、去噪等人工预处理操作剔除了特殊字符、无用信息和全半角混用等语料集噪声,再通过双向交换数据标注的方式进行语料集标注,最终整理得到16033条包含12个隐患类别标签的建筑事故隐患文本数据集,用于后续模型分类性能的验证。(2)使用Word2vec和Bert模型作为文本表示试验模型,设计了3组模型对比试验,并在两者之后接入相同的分类模型,以探究Bert模型对试验语料集的语义表达能力。同时针对试验语料集中的现存问题,提出了Bert模型相应的优化方案:为量化相同术语在不同隐患类别间的重要性差异,使用了基于TF-IDF的术语多类别加权方案,以实现对Bert模型词嵌入过程的改进;为缓解各类别数据分布不均衡对模型分类性能的影响,运用遗传算法优化了focal loss函数的类别权重因子αt,即αt在自定义适应度函数不断的监督训练下,最终取得了12类最优的类别权重值,替代了Bert模型中不适用于不平衡数据集的交叉熵损失函数,从而减缓了在处理文本多分类数据不均衡任务时,模型性能不佳的问题。(3)对Bert模型采用了基于模型替换的模型压缩方法—BERT-of-Theseus,并依次从不同模块替换、不同替换率、模块替换策略和教师模型层数四个层面对BERT-of-Theseus压缩效果进行对比分析,以探究最优的压缩效果,从而达到简化模型的目的。(4)基于Ktinter框架,从整体目标和功能需求、实现过程等多个方面进行了阐述,并依据建筑企业的实际需求,构建了建筑事故隐患分类系统,对已完成框架进行了可视化展示,最后通过测试语料集验证,其较好的完成了隐患分类系统的基本功能。
甘吉[4](2021)在《手写文字识别及相关问题算法研究》文中认为作为信息表达和交流的重要工具,文字被广泛地应用于人们的日常生活和工作中。同时,手写也是每个人在社会中赖以生存的技能。随着计算机的发展和普及,手写文字识别作为一种高级的人机交互方式在近几十年来引起了人们的广泛关注。虽然研究者们在手写识别领域已经取得了大量突破性的进展,但是基于深度学习的手写识别算法仍然有很大的改进空间,因此如何设计更为准确高效的手写识别算法是本文的核心研究内容。另外,随着传感技术的发展,一种新型人机交互方式下的空中手写被提出,即用户可以直接使用手或手指在三维空间中自由地书写。然而,目前的空中手写识别研究仍然处于起步阶段,特别是针对空中手写中文文本识别的研究还处于一片空白。因此,空中手写识别也是本文的主要研究目标之一。本文主要的贡献总结如下:1.本文从一个全新的角度提出了一种基于一维卷积网络的联机手写汉字识别算法,即使用一维卷积网络直接对手写汉字轨迹的时序结构进行建模。本文提出的方法完全不同于目前主流的手写识别算法(包括基于二维卷积网络或循环神经网络的识别算法),并且具有显着的优势:(1)相比于二维卷积网络,提出的方法避免了经验化的领域知识来提取复杂的方向特征图,同时我们的模型参数更少且识别精度更高;(2)相比于循环神经网络,提出的方法能够并行地处理时序数据,其对于长序列手写轨迹的识别速度更快。2.本文提出了一种基于注意力机制的手写英文单词识别算法,该方法采用了编码-解码的架构并通过结合注意力机制迭代地输出目标字符串。同时,本文使用以下策略来进一步改进模型,包括:(1)我们使用一维卷积网络替代循环神经网络编码手写轨迹,显着地提升了模型的编码速度;(2)我们采用了词典约束的解码算法,显着地提升了模型的识别准确率。另外,我们构建了首个大规模的空中手写英文单词数据集IAHEW-UCAS2016用于促进后续的空中手写英文单词识别研究。最后,本文搭建了一个实用的空中手写英文单词识别系统。3.为了有效地识别联机手写中文文本,本文提出了一种新颖的时序卷积循环神经网络,其相比于现有的识别算法更具优势:(1)相比于主流的循环神经网络,提出的方法具有更快的计算速度和更高的识别准确率;(2)相比于最先进的全卷积循环网络,提出的方法避免了经验化的领域知识来提取复杂的特征图,同时模型的训练效率更高(包括更低的计算复杂度,更少的内存消耗,更快的收敛速度)且模型参数更少。为了进一步探究新型的空中手写,本文搭建了世界上首个三维空中手写中文文本识别系统。据我们所知,目前学术界还没有任何针对空中手写中文文本识别的研究。为此,我们构建并公开了首个大规模的空中手写中文文本数据集IAHCT-UCAS2018,从而促进后续的空中手写中文文本识别研究。4.本文提出了一种新颖的基于生成对抗网络的手写文本生成算法。现有的手写生成方法还没有完全地解决手写文本生成任务,因为它们都局限于生成较短的手写单词或者随机风格的手写文本图片。相反,本文提出的模型能够根据给定的任意文本生成任意长度的手写图片,其不局限于事先定义好的语料库或任何词汇表外的单词。同时,我们的模型能够从给定的参考样本中准确地提取出书写风格,从而进一步模仿生成具有相似风格的其它手写文本。实验分析表明本文提出的模型针对手写文本生成具有很好的泛化性,而不是单纯地记忆训练集中的真实手写样本。5.针对基于卷积神经网络的手写汉字识别模型,本文提出了新颖的一体化网络压缩算法。本文提出的压缩算法结合了通道裁剪和参数量化两种策略,能够在保证识别精度的前提下最大限度地压缩识别模型。具体地,在通道裁剪阶段,我们采用了粗细粒度相结合的裁剪策略来迭代地裁剪掉卷积网络中冗余的通道;在参数量化阶段,我们引入了权值丢弃和迭代式量化策略来最大限度地量化模型参数。在公开手写数据集(包括ICDAR-2013,IAHCC-UCAS2016,以及MNIST)上的实验结果表明提出的方法能够显着地压缩基于卷积神经网络的手写汉字识别模型。
赵彦霞[5](2021)在《基于水印和区块链技术的数字图像交易管理研究》文中进行了进一步梳理社会许多领域对数字图像的大量需求,使得国内外出现了大量的数字图像交易网站。但目前的数字图像交易网站一般存在一些不足。例如,为用户提供的数字图像版权保护和版权认证服务不足,为用户提供的有法律效力的交易存证服务不足,为用户提供的个性化服务不足和提供的业务种类少等不足。在数字图像交易管理理论研究方面,也存在对数字图像交易管理的系统性研究、对数字图像进行版权保护和内容认证研究、对区块链中交易使用的智能合约管理研究以及专门针对数字图像的个性化推荐研究不足等问题。本文针对这些存在的问题进行了研究。在理论研究方面,本文对数字图像交易前、交易中和交易后管理上存在的一些问题进行了研究。提出了利用数字水印技术对交易前的数字图像进行版权保护和内容认证的多功能零水印算法;对数字图像交易过程中产生的交易信息写入区块链中进行存证,对区块链智能合约分类算法进行了研究;依据数字图像交易后存储的用户历史数据,研究了利用智能推荐技术的个性化数字图像推荐算法。在实践研究方面,设计了数字图像交易管理系统。将本文提出的算法应用于该系统,并设计了相应的管理模型,以解决数字图像交易网站提供的业务种类少等问题。本文的创新点如下:(1)提出了两种基于奇异值分解和深度学习的数字图像多功能零水印算法。在数字图像交易前,对数字图像进行版权保护和内容认证的研究不足。针对这一问题,本文对数字图像版权保护和内容认证进行了研究。变换域算法比空域算法中水印的鲁棒性更强,离散小波变换(DWT)能够克服离散傅里叶变换和离散余弦变换的一些缺点,奇异值分解(SVD)所得的奇异值可以表示图像内在的代数特征,稳定性好,深度神经网络能够获取图像关键特征。因此,将DWT、SVD分别和深度卷积神经网络(DCNN)和深度置信网络(DBN)相结合,提出了基于SVD和DCNN的数字图像多功能零水印算法以及基于SVD和DBN的数字图像多功能零水印算法。两种零水印算法都构造了零鲁棒水印图像和零半脆弱水印图像。仿真实验验证了两种算法的鲁棒水印对多种强度大的攻击有较好的抵抗性,提取出的半脆弱水印图像也能对原始图像的篡改位置进行定位。(2)提出了两种智能合约分类算法。针对许多数字图像交易网站存在的交易存证法律效力不足的问题,把区块链技术引入数字图像交易过程管理中。在区块链上进行交易的过程中需要使用智能合约,因此本文研究了智能合约分类算法,以便对智能合约进行有效管理。智能合约属于文本信息,因为智能合约不同类别数量相差较大,所以智能合约分类属于非均衡文本分类。智能合约分类的第一步工作是将智能合约转换成能够被计算机识别的数据。由于目前没有针对智能合约的语料库,因此首先利用Word2Vec建立智能合约语料库。然后,利用Word2Vec和智能合约语料库将所有智能合约都转化成等长的数字化向量。智能合约分类的第二步工作是研究如何对数字化的智能合约进行分类。由于智能合约分类属于非均衡的文本分类,所以本文提出了随机权学习机和加权交叉熵函数来克服传统分类方法的缺陷,并分别利用自编码器能降低数据维度的特点和双向长短期记忆神经网络(Bi LSTM)对上下文有记忆的功能,提出了基于自编码随机权ELM网络的智能合约分类算法与基于加权交叉熵损失函数的长短记忆智能合约分类算法。实验验证了两种算法对智能合约的分类是有效的。(3)提出了一种加权TextRank和自组织特征映射神经网络(SOM)的个性化数字图像智能推荐算法。针对数字图像交易完成后的管理中,对用户提供的个性化推荐服务研究不足的问题,本文进行了个性化数字图像推荐研究。通过两种来源获取用户感兴趣的图像。第一种来源是当前用户的相似用户订单中的图像。第二种来源是从数据库中查找的与当前用户最后放入订单中图像同类型的图像。从相似用户和数据库两种来源得到的候选图像集中选择用户感兴趣的部分图像推荐给当前用户。由于用户最后在网站的搜索词、不同时间加入订单和加入购物车的图像,以及用户历史数据中能体现图像类型的关键词语反映用户对图像的兴趣度的作用程度不同,所以,利用TextRank算法适合提取短文本关键词的特点,设计了加权TextRank算法来提取用户历史数据的关键词。因为SOM能够通过竞争对数据进行聚类,所以利用SOM去发现当前用户的相似用户。仿真实验结果验证了提出的算法能够有效地发现当前用户的相似用户,能为当前用户推荐用户感兴趣的数字图像。(4)设计了数字图像交易管理系统。针对许多数字图像交易网站没有提供数字图像处理、数字图像版权保护、数字图像认证、交易存证、个性化推荐服务和智能合约分类等情况,设计了数字交易管理系统。设计了数字交易管理系统的架构和功能,设计了应用于数字图像交易管理系统中的数字图像交易管理、数据安全保护管理、版权保护管理、智能合约管理和个性化推荐管理模型。以上研究成果,能够在一定程度上解决现有许多数字图像交易网站对数字图像版权保护和版权认证,交易的有法律效力存证,区块链技术应用中的智能合约分类,网站业务种类少等问题。将数字水印、区块链和智能推荐等技术应用到数字图像交易管理的研究方法,可以为管理科学的研究提供一些思路和方法。研究成果被应用后,业务种类的增加和对用户的个性化数字图像推荐能够吸引更多的用户消费,从而增加商家的利润。
张延星[6](2021)在《基于深度学习的汉语—塞尔维亚语机器翻译的研究与实现》文中指出近年来,随着中国和塞尔维亚双边关系不断深化,沟通障碍问题日益突出,对译员的需求和译员的数量形成了紧张的供需关系,而构建汉语-塞尔维亚语机器翻译能有效解决这一问题。在构造汉语-塞尔维亚语机器翻译模型过程中,由于塞尔维亚语(塞尔维亚语西里尔文)属于小语种,汉-塞双语平行语料的收集工作存在一定难度,再着塞尔维亚语具有丰富的词形变化(例如,数、时态、格等),使塞尔维亚语词表稀疏严重,造成汉语-塞语词表在词频分布上的不对称,最终导致汉语-塞尔维亚语机器翻译不能取得较好的翻译质量。本文以深度学习为研究背景,结合近些年机器翻译研究领域的学术成果,针对塞尔维亚语语料稀缺、词表稀疏的特征,提出基于语义相关的汉语-塞尔维亚语机器翻译模型,其主要进行了如下方面的工作:(1)研究和分析了机器翻译的发展历程以及相关理论和测评技术指标。(2)根据塞尔维亚语和俄语同属于斯拉夫语族且在语法上具有相似性的特点,参考中俄神经网络机器翻译模型,确定适用于汉语-塞语机器翻译神经网络结构,并进行神经网络的训练。(3)获取训练语料,在数据处理过程中,提出对中文词表和塞尔维亚语词表使用基于语义相关的压缩方法,以降低词表稀疏程度和增加神经网络对语义的理解。(4)提出基于语义相关的机器翻译质量测评方法(BLEU-ws),以此作为临时模型的选取,并在实验中和BLEU测评方法进行对比。(5)对训练后的模型进行优化,并实现可由外部调用的API接口。实验证明,本文通过基于语义相关的压缩词表方式和使用BLEU-ws测评方法,降低了塞尔维亚语词表的稀疏性,克服了汉语-塞语词频分布的非对称性,在模型训练过程中能选择出有较强语义理解能力的翻译模型,对汉语-塞尔维亚语机器翻译质量有明显的提升。最终,对汉语-塞尔维亚语机器翻译模型的测评结果显示,使用BLEU-ws测评方法得到的最优模型的BLEU值达到20.8,较使用BLEU测评方法进行模型训练得到的最优模型BLEU值提升1.6分,提高8.3%。
宋帆[7](2021)在《基于深度学习的商品评论情感分析方法研究》文中指出随着互联网在电子商务行业的全面覆盖,各种商业服务平台快速发展,承载了多种类型的数据信息。与视听多媒体数据相比,因特网中的文字数据消耗资源较少,很容易进行网上传输,因此文字信息是使用最为广泛的表达形式。自然语言处理中的文本情感分析正是研究如何从文字中找到有用的信息内容。由于计算能力和优化算法的限制,目前常用的情感分析算法存在参数较多、只针对特定数据集效果好及实时性无法满足实际应用需要的问题。本文以电商平台在线评论文本数据为研究对象,选择BiLSTM算法作为基础算法并融合注意力机制和词性,从大量的评论数据样本中主动学习文本中的语义信息并获得文本的特征与情感分类结果,达到精准提取文本数据中情感的目的。本文将深度学习模型与知识蒸馏方法相结合,实现情感分析模型的精确化和轻量化,优化模型性能。根据设计的分类模型研究了基于深度神经网络的商品评论情感分析系统,系统可以根据用户的操作自动预测文字内容所表达的情绪状态,从而帮助人们挖掘文本信息,做出正确的判断。本文主要工作总结如下:(1)基于深度学习的商品评论情感分析算法的研究与改进。本文以BiLSTM算法为切入点,设计pos-BiLSTM-Att优化算法,通过融合注意力机制,给予主要特征较高的注意力概率值,从而提高处理速度和准确度,进而提升文本分类效果。还通过嵌入词性信息来更好的学习评论语句特征。为了使设计的pos-BiLSTM-Att模型不仅有较高的情感分析准确度,还能保持较小的复杂度。本文将高精度但是参数量巨大的ALBERT-FN教师模型的知识利用知识蒸馏方法转移至pos-BiLSTM-Att学生模型,从而获得性能更加优越的pos-BiLSTM-Att模型。(2)基于深度学习的商品评论情感分析算法的性能测试与分析。对实验环境与实验数据予以介绍,从算法的预测准确率和实时响应效果出发对本文核心算法与其他情感分析算法进行对比分析。实验表明,在各个不同的数据集上,本文提出的pos-BiLSTM-Att模型的三项关键指标均高于其他对比模型。此外,经过蒸馏过的pos-BiLSTM-Att模型能够以较小的参数量和更快的响应时间达到更佳的预测效果。(3)基于深度学习的商品评论情感分析系统的设计与实现。本文选择Word2vec作为词向量模型,选择蒸馏过的pos-BiLSTM-Att模型作为系统情感分析模型,并依据系统设计需求和应用场景构建系统整体设计方案。设计系统基本功能模块、框架和工作流程,并分别实现系统注册登录以及各个子模块功能,证明系统能够达到预期要求。
申雪姣[8](2020)在《《TTK31-5.5DL型空调机组使用说明书》翻译实践报告》文中认为随着我国科技的不断发展,国际化程度日益加深,越来越多的科技企业开始开拓国际市场。在对外市场的开拓过程中,产品说明书的汉英翻译起到重要作用,优秀的英文说明书能更快更高效地传递信息和推广产品,指导用户操作、使用和维护产品,同时提高产品的国际竞争力。笔者曾于国祥公司进行为期10个月的翻译实习,翻译材料主要涉及产品质量控制相关内容。本实践报告以实习期间翻译的《TTK31-5.5DL型空调机组使用说明书》为语料,运用诺德的文本分析理论,结合具体实例,探讨和总结说明书文本的翻译策略。笔者深入了解了文本分析模式,发现通过该模式的“翻译纲要分析、源语文本分析、翻译策略规划和目标语文本生成”四个步骤,能够将源语文本分析透彻,从而在词汇层面选择了直译和省译的策略使语言直白简练,在句子层面选择顺译、逆译和合译的策略突出语句的逻辑性,在语篇层面选择替代和原词复现的策略使译文完整流畅。通过此次实践,笔者得到以下发现:第一,对某一章节或段落进行翻译纲要分析和对整篇文章进行翻译纲要分析,结果是不完全相同的,这是因为某一章节、段落和整篇文本的目的和作用是不同的;第二,文本分析模式中的四个步骤缺一不可,前两个步骤对于译者深刻认识、了解原文特点具有重要作用,后两个步骤反映了源语文本的文内外因素分析对翻译策略选择的重要意义;第三,文本分析模式是一个循环模式,初次完成循环意味着可以生成译文,多次循环才能提高译文质量;第四,翻译质量控制贯穿翻译过程的始终,是译者不可忽视的一项工作。
吴健[9](2020)在《空压机流量压力优化控制》文中研究说明随着中国制造业的发展,自动化设备在制造业内大量应用,压缩空气作为重要的二次能源,其应用范围日益扩大。本文将LCD面板工厂的空压机控制系统作为研究对象,重点研究了空压机的工艺流程及控制策略,结合厂内已有设备设计了一套优化控制方案,旨在提高空压机系统稳定性,减少电能浪费。通过对空压机原理及LCD工厂压缩空气供应流程、使用场景进行详细分析,发现工厂空压机系统存在供应压力波动大、能源浪费的问题。为了解决上述问题,本文将现有单一压力供应改为分压供应,运用模糊PID控制理论,提出了空压机压力流量优化控制方案,控制方案包括空压机分压控制、流量控制、增压控制三部分。系统实现了空压机集中控制、负荷优化分配、压力自动补偿功能。控制系统的硬件设计以西门子S7-300 PLC为核心,选用合适的传感器、执行器,搭建了由工业以太网、Modbus、CAN网络组成的控制网络。软件设计以SIMATIC STEP7及Win CC为平台,开发了一套功能完善、简洁明了的人机界面。通过测试及模拟运行,验证了该控制系统的软件及硬件功能达到设计要求。实际运行结果表明,空压机压力流量优化控制系统能根据管网压力变化及末端流量需求实现最优控制,有效提高了空压机系统的稳定性及可靠性,设计方案达到了预期的节能效果。
张思卿[10](2020)在《基于深度学习的文本摘要自动生成模型研究与应用》文中研究说明文本自动摘要是利用计算机自动地将文本或文本集合转换成简短摘要的一种信息压缩技术。生成式摘要根据原文内容,将原文语义进行压缩,在允许生成新词汇的情况下对原文进行概括总结。近年来神经网络发展产生的文本表征极大地促进了生成式摘要的发展,但生成式摘要仍存在语义不相关、重复词和评测方法与损失函数不统一等问题。此外,文本摘要技术还有在专业领域应用困难的问题。为解决这些问题,本文提出了相应的改进方案。生成式摘要的基本结构主要由编码器和解码器组成,本文主要工作内容如下:(1)针对语义表征中语义不相关的问题,传统的编码器结构使用双向RNN进行词向量或者字向量的编码工作,将获得的静态上下文语义向量输入解码器生成序列文本,这种方式缺乏对动态语义的理解。本文使用BERT(Bidirectional Encoder Representation from Transformers)作为编码器编码字向量,BERT使用双向Transformer结构捕捉根据上下文不同而不断变化的动态词/字向量,能囊括更完整、更精确的语义。(2)针对摘要概括性不足、OOV(Out-Of-Vocabulary)未登录词和重复词问题,主流的复制生成网络仅仅复制源文档中部分词汇形成摘要,而人类生成摘要的方式具有抽象和概括性。本文提出了结合先验分布的指针生成网络,通过引入句段Embedding对源文本进行压缩语义,来指导指针生成网络的拷贝机制,辅助文本生成。(3)针对文本摘要损失函数和其评测方法ROUGE(Recall-Oriented Understudy for Gisting Evaluation)不统一的问题,主要是针对损失函数无法优化离散的量度。在本文中,本文提出使用强化学习的方法针对ROUGE进行优化,通过此方法模型生成的摘要可以和参考摘要具有更高的重合性,也使得ROUGE分数大大提升。实验结果验证了该方法的有效性。(4)针对文本摘要技术应用困难的问题,本文自制工业领域数据集并在其上完成文本摘要模型迁移,通过模型迁移前后的实验对比,验证了模型迁移的有效性。为进一步实现文本摘要落地应用,本文开发以迁移模型为核心的文本摘要服务以及与之结合的投诉业务模块,嵌入到工业制造领域企业客户管理平台中,通过对二者结合后的应用示范,论证了摘要技术落地后的应用价值。
二、Word 的“压缩”功能(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、Word 的“压缩”功能(论文提纲范文)
(1)图像文本识别的关键技术研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题的研究背景及意义 |
1.2 图像文本识别方法研究现状 |
1.2.1 字符识别研究现状 |
1.2.2 单词识别研究现状 |
1.2.3 文本行识别研究现状 |
1.2.4 模型压缩研究现状 |
1.3 论文的研究内容及创新点 |
1.3.1 研究内容概述 |
1.3.2 主要创新点 |
1.4 论文的组织结构 |
第2章 基于语义分割的复杂场景字符识别方法 |
2.1 引言 |
2.2 相关技术简介 |
2.2.1 语义分割方法 |
2.2.2 类标编码方法 |
2.3 基于语义分割的字符识别模型 |
2.3.1 FCN-ResNet50模块 |
2.3.2 类五笔类标编码模块 |
2.3.3 CRF模块 |
2.3.4 损失函数 |
2.4 实验与分析 |
2.4.1 数据集 |
2.4.2 实验设置 |
2.4.3 对比的方法 |
2.4.4 CTW数据集的实验结果和分析 |
2.4.5 ICDAR2019-ReCTS数据集的实验结果和分析 |
2.4.6 HIT-OR3C数据集的实验结果和分析 |
2.5 本章小结 |
第3章 基于位置向量的无约束手写单词识别方法 |
3.1 引言 |
3.2 相关技术简介 |
3.2.1 长短期记忆网络 |
3.2.2 位置向量 |
3.3 基于位置向量的无约束单词识别模型 |
3.3.1 特征提取模块 |
3.3.2 位置向量 |
3.4 实验与分析 |
3.4.1 手写单词数据集 |
3.4.2 模型训练 |
3.4.3 实验结果 |
3.4.4 消融实验 |
3.4.5 识别样例分析 |
3.5 本章小结 |
第4章 基于自适应超图神经网络的手写文本行识别方法 |
4.1 引言 |
4.2 相关技术简介 |
4.2.1 图神经网络简介 |
4.2.2 超图神经网络简介 |
4.3 基于自适应超图神经网络的文本行识别模型 |
4.3.1 自适应超图的构建 |
4.3.2 通过HGNN进行特征-语义交互 |
4.3.3 序列识别 |
4.4 手写文本行识别的实验 |
4.4.1 手写文本行数据集与评价指标 |
4.4.2 实验设置 |
4.4.3 对比方法 |
4.4.4 实验结果 |
4.4.5 识别样例分析 |
4.5 多标签图像分类的扩展实验 |
4.5.1 优化 |
4.5.2 评价指标 |
4.5.3 多标签数据集 |
4.5.4 实验设置 |
4.5.5 对比方法 |
4.5.6 实验结果 |
4.5.7 消融实验 |
4.5.8 可视化与分析 |
4.6 本章小结 |
第5章 图像文本识别模型的全连接层压缩方法 |
5.1 引言 |
5.2 相关技术简介 |
5.3 基于参数共享的全连接层压缩方法 |
5.3.1 顺序分支结构 |
5.3.2 混洗分支结构 |
5.3.3 紧凑型网络参数压缩分析 |
5.4 实验与分析 |
5.4.1 模型压缩实验数据集 |
5.4.2 实验设置 |
5.4.3 实验对比方法 |
5.4.4 实验结果及分析 |
5.4.5 不同压缩模型结果对比 |
5.5 消融实验与分析 |
5.5.1 分支效果 |
5.5.2 压缩因子效果对比 |
5.5.3 训练和测试阶段的速度表现 |
5.5.4 PSFC和传统FC层的训练收敛性比较 |
5.5.5 可视化分析 |
5.6 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其他成果 |
致谢 |
个人简历 |
(2)美国国情咨文演说的话语合法化策略:语类分析视角(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题意义 |
1.2 理论背景 |
1.3 研究意义 |
1.4 章节安排 |
第二章 文献综述 |
2.1 美国国情咨文演说的文献综述 |
2.1.1 国外研究现状 |
2.1.1.1 国情咨文演说与媒体议程 |
2.1.1.2 国情咨文演说与公众议程 |
2.1.1.3 国情咨文演说与国会议程 |
2.1.1.4 国情咨文演说与语言修辞 |
2.1.1.5 国情咨文演说与其他 |
2.1.2 国内研究现状 |
2.1.3 对本研究的启示 |
2.2 话语合法化策略的文献综述 |
2.2.1 合法化的内涵 |
2.2.2 话语合法化策略研究概述 |
2.2.3 van Leeuwen的合法化策略的具体应用 |
2.2.3.1 政治话语 |
2.2.3.2 媒体话语 |
2.2.4 对本研究的启示 |
2.3 本章小结 |
第三章 话语合法化策略研究的理论脉络 |
3.1 语类分析的理论脉络 |
3.1.1 “语类”概念的来源与发展 |
3.1.2 “语类”概念的界定 |
3.1.3 语类分析的三大学派 |
3.1.3.1 专门用途英语学派 |
3.1.3.2 北美新修辞学派 |
3.1.3.3 澳大利亚悉尼学派 |
3.1.4 语类分析的理论基础 |
3.1.4.1 语类与语境 |
3.1.4.2 语域与语言元功能 |
3.1.4.3 语域的三个语境变量 |
3.2 van Leeuwen的合法化策略体系 |
3.3 本章小结 |
第四章 研究方法 |
4.1 研究问题的提出 |
4.2 语料库研究方法 |
4.2.1 语料库研究方法的优势 |
4.2.2 语料库多功能分析软件的选取 |
4.3 专用语料库的建立 |
4.3.1 语料文本规模的标准 |
4.3.2 语料的基本介绍 |
4.3.3 语料来源的时限范围 |
4.3.4 语料文本的清理 |
4.3.5 专用语料文本的基本信息 |
4.4 语料标注的方法与步骤 |
4.5 语料分析的方法与步骤 |
4.6 本章小结 |
第五章 美国国情咨文演说的优先事项 |
5.1 主题词的意义和提取方法 |
5.2 国情咨文演说的主题词分析 |
5.3 国情咨文演说优先事项的延续性 |
5.3.1 国土安全 |
5.3.1.1 乔治·布什政府 |
5.3.1.2 克林顿政府 |
5.3.1.3 乔治·沃克·布什政府 |
5.3.1.4 奥巴马政府 |
5.3.1.5 特朗普政府 |
5.3.2 经济发展 |
5.3.2.1 乔治·布什政府 |
5.3.2.2 克林顿政府 |
5.3.2.3 乔治·沃克·布什政府 |
5.3.2.4 奥巴马政府 |
5.3.2.5 特朗普政府 |
5.4 国情咨文演说优先事项的时代性 |
5.4.1 乔治·布什政府 |
5.4.1.1 推行自由价值观 |
5.4.1.2 打击毒品犯罪 |
5.4.2 乔治·沃克·布什政府 |
5.4.3 奥巴马政府 |
5.4.4 特朗普政府 |
5.4.4.1 打击毒品犯罪 |
5.4.4.2 推行移民新政 |
5.4.4.3 加强基础设施建设 |
5.4.4.4 提高妇女地位 |
5.5 本章小结 |
第六章 美国国情咨文演说的对话性 |
6.1 语篇的对话性特征 |
6.2 评价理论的适用性 |
6.3 评价理论的介入系统 |
6.3.1 自言 |
6.3.2 借言 |
6.3.2.1 对话性压缩 |
6.3.2.2 对话性扩展 |
6.4 国情咨文演说的对话性 |
6.4.1 语料的标注 |
6.4.2 国情咨文演说的介入资源 |
6.4.3 国情咨文演说的对话性特征 |
6.4.3.1 二个对话模式: 对话性压缩和对话性扩展 |
6.4.3.2 二个主要介入方式: 否认和接纳 |
6.4.3.3 三个核心话题: 计划、问题和处事风格/价值观 |
6.4.3.4 二个关键因素: 话语主体责任和对话空间 |
6.5 本章小结 |
第七章 美国国情咨文演说的语类结构 |
7.1 语类结构的表现形式 |
7.2 国情咨文演说的话语模式 |
7.3 国情咨文演说的分析单位 |
7.4 国情咨文演说的语类结构 |
7.4.1 开始部分 |
7.4.2 主体部分 |
7.4.3 结束部分 |
7.5 国情咨文演说语类结构的特征 |
7.5.1 国情咨文演说语类结构的突出特征 |
7.5.2 国情咨文演说作为混合型语类的特征 |
7.5.3 国情咨文演说语类结构的原型公式 |
7.6 本章小结 |
第八章 美国国情咨文演说的合法化策略 |
8.1 国情咨文演说语类特征的合法化功能 |
8.1.1 优先事项的合法化功能: 意识形态本质 |
8.1.2 介入方式的合法化功能: 理想受众的构建 |
8.1.3 语类结构的合法化功能: 授权、合理化、道德评价、叙事化、情感诉求 |
8.2 国情咨文演说的三大合法化策略: 道德评价、授权、情感诉求 |
8.2.1 道德评价 |
8.2.2 授权 |
8.2.3 情感诉求 |
8.3 语类特征的合法化功能与仪式化机构话语的特征 |
8.4 政治话语合法化策略的研究路径 |
8.5 本章小结 |
第九章 结论 |
9.1 研究发现概述 |
9.2 研究意义 |
9.2.1 理论意义 |
9.2.2 现实意义 |
9.3 研究贡献 |
9.4 研究局限性和未来研究方向 |
参考文献 |
附录1 SOUA分析语料库的基本信息 |
附录2 主要术语英汉对照表 |
附录3 SOUA分析语料库和语料库子库核心主题词的统计情况 |
附录4 对话性压缩和对话性扩展的语言表现形式 |
附录5 总统用于问候的称呼语使用情况(1989年—2020年) |
附录6 “序曲”阶段构成要素的语言表现形式实例和总体分布情况 |
附录7 主体部分的构成情况 |
附录8 “宣言”阶段构成要素的语言表现形式实例和总体分布情况 |
附录9 众议院长廊嘉宾的背景信息 |
(3)基于BERT模型的建筑事故隐患分类研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 隐患分类的研究现状 |
1.2.2 隐患语料集现存问题研究现状 |
1.2.3 文本分类技术研究现状 |
1.2.4 国内外研究现状综述 |
1.3 研究内容及技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
2 文本分类理论概述及试验分析 |
2.1 文本分类的定义 |
2.2 文本分类流程 |
2.2.1 文本预处理 |
2.2.2 文本表示 |
2.2.3 特征降维 |
2.2.4 文本分类算法 |
2.2.5 性能评估 |
2.3 不同文本表示方式对比试验 |
2.3.1 数据获取与预处理 |
2.3.2 试验数据 |
2.3.3 试验环境 |
2.3.4 试验结果对比分析 |
2.4 本章小节 |
3 BERT改进模型的建筑事故隐患分类及试验分析 |
3.1 BERT模型 |
3.1.1 模型结构 |
3.1.2 模型微调 |
3.2 词嵌入加权方案及试验结果分析 |
3.2.1 TF-IDF |
3.2.2 多类别术语加权方案 |
3.2.3 试验环境 |
3.2.4 试验结果及分析 |
3.3 损失函数的优化及试验结果分析 |
3.3.1 代价敏感学习 |
3.3.2 focal loss函数 |
3.3.3 遗传算法的调优 |
3.3.4 试验环境 |
3.3.5 试验结果及分析 |
3.4 模型对比结果分析 |
3.5 本章小节 |
4 BERT及改进模型的压缩 |
4.1 模型压缩的基本框架 |
4.2 BERT-of-Theseus |
4.3 模型对比试验 |
4.3.1 试验环境 |
4.3.2 试验结果及分析 |
4.4 本章小节 |
5 隐患分类系统 |
5.1 整体目标和需求分析 |
5.1.1 系统整体目标 |
5.1.2 功能需求分析 |
5.2 软件环境 |
5.3 分类系统的流程设计 |
5.4 系统的实现 |
5.5 隐患分类系统流程归纳 |
5.6 本章小结 |
6 结论和展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
附录 攻读硕士期间的研究成果 |
致谢 |
(4)手写文字识别及相关问题算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景 |
1.2 国内外研究现状 |
1.2.1 手写识别发展现状 |
1.2.2 相关问题的发展现状 |
1.3 主要研究内容及创新点 |
1.4 论文组织结构 |
第2章 基于一维卷积的联机手写汉字识别 |
2.1 引言 |
2.2 基于一维卷积的联机手写汉字识别算法 |
2.2.1 手写轨迹预处理 |
2.2.2 基于1D-CNN的手写识别架构 |
2.3 实验结果 |
2.3.1 数据集设置 |
2.3.2 不同配置下1D-CNN的识别结果 |
2.3.3 1D-CNN与RNN之间的比较 |
2.3.4 各种策略的消融实验分析 |
2.3.5 在公开数据集上的最终性能比较 |
2.4 结论 |
第3章 基于注意力机制的空中手写英文单词识别 |
3.1 引言 |
3.2 空中手写英文单词数据集 |
3.2.1 空中手写英文单词的样本采集 |
3.2.2 空中手写英文单词的特点 |
3.3 基于注意力机制的手写单词识别算法 |
3.3.1 空中手写英文单词预处理 |
3.3.2 基于注意力机制的编码-解码识别架构 |
3.4 实验结果 |
3.4.1 实验配置细节 |
3.4.2 词典约束解码策略的性能分析 |
3.4.3 注意力机制的可视化分析 |
3.4.4 用户独立性实验分析 |
3.4.5 识别模型的消融实验分析 |
3.4.6 与其它空中手写英文单词识别工作的比较 |
3.4.7 不同方法的最终识别准确率比较 |
3.4.8 识别案例分析 |
3.5 结论 |
第4章 基于时序卷积循序网络的空中手写中文文本识别 |
4.1 引言 |
4.2 空中手写中文文本数据集 |
4.2.1 空中手写中文文本的样本采集 |
4.2.2 空中手写中文文本的特点 |
4.3 基于时序卷积循环网络的手写文本识别算法 |
4.3.1 空中手写中文文本预处理 |
4.3.2 基于时序卷积循环网络的识别架构 |
4.4 实验结果 |
4.4.1 实验配置细节 |
4.4.2 模型的整体性能评估 |
4.4.3 消融实验分析 |
4.4.4 与基于神经网络的主流识别方法比较 |
4.4.5 不同方法在公开数据集上的最终性能比较 |
4.4.6 错误案例分析 |
4.5 结论 |
第5章 基于生成对抗网络的手写文本生成 |
5.1 引言 |
5.2 基于生成对抗网络的手写文本生成算法 |
5.2.1 HiGAN的框架 |
5.2.2 训练损失函数 |
5.3 实验结果 |
5.3.1 实验配置细节 |
5.3.2 手写文本生成效果 |
5.3.3 模型的鲁棒性分析 |
5.3.4 与现有的GAN方法比较 |
5.3.5 使用GAN提升手写识别性能 |
5.4 结论 |
第6章 基于卷积神经网络的手写汉字识别模型压缩 |
6.1 引言 |
6.2 基于卷积神经网络的手写汉字识别模型压缩算法 |
6.2.1 相关知识介绍 |
6.2.2 二维卷积神经网络的一体化压缩方法 |
6.2.3 提出方法与前人工作的比较优势 |
6.3 实验结果 |
6.3.1 实验配置细节 |
6.3.2 通道裁剪性能评估 |
6.3.3 参数量化性能评估 |
6.3.4 整体压缩算法性能 |
6.3.5 错误案例分析 |
6.4 本章小结 |
第7章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
致谢 |
作者简历及攻读学位期间发表的学术论文与研究成果 |
(5)基于水印和区块链技术的数字图像交易管理研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.3 国内外研究现状 |
1.3.1 数字图像交易管理国内外研究现状 |
1.3.2 数字水印技术国内外研究现状 |
1.3.3 区块链技术国内外研究现状 |
1.3.4 智能推荐技术国内外研究现状 |
1.4 研究思路与方法 |
1.5 研究内容及创新点 |
1.6 论文的组织结构 |
第二章 预备知识 |
2.1 数字水印技术 |
2.1.1 数字水印概述 |
2.1.2 数字图像水印技术 |
2.2 区块链技术 |
2.2.1 区块链概述 |
2.2.2 区块链架构模型 |
2.2.3 区块链区块结构 |
2.2.4 区块链的运行过程 |
2.2.5 智能合约 |
2.3 智能推荐技术 |
2.3.1 智能推荐技术概述 |
2.3.2 常用的推荐算法 |
2.4 本章小结 |
第三章 基于SVD与深度学习的数字图像多功能零水印算法研究 |
3.1 理论基础 |
3.1.1 离散小波变换 |
3.1.2 奇异值分解 |
3.1.3 深度学习技术 |
3.1.4 深度卷积神经网络 |
3.1.5 深度置信网络 |
3.2 基于SVD和 DCNN的数字图像多功能零水印算法 |
3.2.1 算法设计思想 |
3.2.2 基于SVD和 DCNN的数字图像多功能构造零水印算法 |
3.2.3 基于SVD和 DCNN的数字图像多功能提取零水印算法 |
3.2.4 仿真实验和分析 |
3.3 基于SVD和 DBN的数字图像多功能零水印算法 |
3.3.1 算法设计思想 |
3.3.2 基于SVD和 DBN的数字图像多功能构造零水印算法 |
3.3.3 基于SVD和 DBN的数字图像多功能提取零水印算法 |
3.3.4 仿真实验和分析 |
3.4 本章小结 |
第四章 数字图像交易管理中智能合约分类算法研究 |
4.1 理论知识 |
4.1.1 智能合约分类的难点 |
4.1.2 智能合约分类相关研究 |
4.1.3 Word2Vec |
4.1.4 堆叠自编码器 |
4.1.5 随机权极速学习机 |
4.1.6 双向长短期记忆神经网络 |
4.1.7 加权交叉熵损失函数 |
4.2 基于自编码随机权ELM网络的智能合约分类算法 |
4.2.1 算法设计思想 |
4.2.2 基于自编码随机权ELM网络的智能合约分类模型 |
4.2.3 基于自编码随机权ELM网络的智能合约分类算法描述 |
4.2.4 仿真实验与分析 |
4.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法 |
4.3.1 算法设计思想 |
4.3.2 基于加权交叉熵损失函数的长短记忆智能合约分类模型 |
4.3.3 基于加权交叉熵损失函数的长短记忆智能合约分类算法描述 |
4.3.4 仿真实验与分析 |
4.4 智能合约分类算法在数字图像交易管理中的应用 |
4.4.1 自编码随机权ELM网络分类算法在数字图像交易智能合约分类中的应用 |
4.4.2 加权交叉熵损失函数Bi LSTM分类算法在数字图像交易智能合约分类中的应用 |
4.5 本章小结 |
第五章 数字图像交易管理中个性化智能推荐算法研究 |
5.1 理论知识 |
5.1.1 Text Rank算法 |
5.1.2 加权Text Rank算法 |
5.1.3 自组织特征映射神经网络 |
5.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法 |
5.2.1 算法设计思想 |
5.2.2 基于加权Text Rank和 SOM的个性化数字图像智能推荐模型 |
5.2.3 基于加权Text Rank和 SOM的个性化数字图像智能推荐算法描述 |
5.2.4 仿真实验和分析 |
5.3 本章小结 |
第六章 数字图像交易管理系统 |
6.1 数字图像交易管理系统架构 |
6.1.1 数字图像交易管理系统整体架构 |
6.1.2 数字图像交易管理Web服务子系统架构 |
6.1.3 区块链数字图像交易管理子系统架构 |
6.2 基于水印和区块链技术的数字图像交易管理系统设计 |
6.2.1 数字图像交易管理Web服务子系统功能设计 |
6.2.2 区块链数字图像交易管理子系统功能设计 |
6.3 数字图像交易管理系统的主要管理模型 |
6.3.1 数据图像交易管理系统的数字图像交易管理模型 |
6.3.2 数字图像交易管理系统的数据安全保护管理模型 |
6.3.3 数字图像交易管理系统的版权保护管理模型 |
6.3.4 数字图像交易管理系统的智能合约管理模型 |
6.3.5 数字图像交易管理系统中个性化推荐管理模型 |
6.5 本章小结 |
第七章 结论与展望 |
7.1 主要结论和创新 |
7.2 研究展望 |
参考文献 |
致谢 |
个人简介及攻读学位期间取得的研究成果 |
(6)基于深度学习的汉语—塞尔维亚语机器翻译的研究与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 汉语-塞尔维亚语机器翻译研究背景 |
1.2 机器翻译发展历程 |
1.2.0 基于规则的机器翻译 |
1.2.1 基于统计的机器翻译 |
1.2.2 基于实例的机器翻译 |
1.2.3 基于深度学习的机器翻译 |
1.3 机器翻译国内外研究现状 |
1.3.1 系统应用 |
1.3.2 技术测评 |
1.3.3 低资源机器翻译 |
1.4 论文解决的主要问题及创新点 |
1.5 论文的组织结构 |
第二章 相关理论和技术的研究 |
2.1 神经机器翻译的主要原理 |
2.1.1 神经网络 |
2.1.2 word2vec词向量初始化模型 |
2.1.3 attention注意力结构 |
2.1.4 引入attention注意力结构的Encoder-Decoder机器翻译模型 |
2.2 基于RNN和基于CNN的翻译模型 |
2.2.1 基于RNN的机器翻译神经网络 |
2.2.2 基于CNN的机器翻译神经网络 |
2.3 神经网络不同的学习类型 |
2.3.1 有监督的学习 |
2.3.2 无监督的学习 |
2.3.3 半监督的学习 |
2.4 基于字符和基于语义的机器翻译测评技术 |
2.4.1 基于字符和流畅度的测评技术 |
2.4.2 基于知识图谱语义相似度的测评技术(BLEU-ws) |
2.5 本章小结 |
第三章 汉语-塞尔维亚语机器翻译的设计 |
3.1 汉语-塞尔维亚语机器翻译的需求 |
3.2 塞尔维亚语语言特点 |
3.3 汉语-塞尔维亚语机器翻译系统的设计目标 |
3.4 汉语-塞尔维亚语机器翻译的总体结构 |
3.5 汉语-塞尔维亚语机器翻译的神经网络结构 |
3.6 汉语-塞尔维亚语机器翻译模型训练流程的设计 |
3.7 本章小结 |
第四章 汉语-塞尔维亚语机器翻译的数据准备 |
4.1 数据采集需求 |
4.1.1 深度学习神经网络训练语料 |
4.1.2 用于模型评测的数据 |
4.2 数据收集 |
4.2.1 语料的下载 |
4.2.2 语料的抓取 |
4.3 数据清洗 |
4.3.1 符号清洗 |
4.3.2 数据去重处理 |
4.3.3 对齐和长度清洗 |
4.3.4 词表清洗 |
4.4 本章小结 |
第五章 汉语-塞尔维亚语机器翻译模型 |
5.1 神经网络模型及超参数配置 |
5.2 数据稀疏问题的处理 |
5.2.1 对汉语词表的压缩 |
5.2.2 对塞尔维亚语词表的压缩 |
5.2.3 压缩后词表词频分布情况 |
5.3 未登录词问题的处理 |
5.4 词向量预训练 |
5.5 数据动态重排序 |
5.6 临时模型的质量监控及融合 |
5.6.1 BLEU测评 |
5.6.2 BLEU-ws测评 |
5.6.3 模型的融合 |
5.7 模型API接口调用示例 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
参考文献 |
致谢 |
作者简介 |
攻读硕士学位期间发表的论文和科研成果 |
(7)基于深度学习的商品评论情感分析方法研究(论文提纲范文)
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状分析 |
1.2.1 文本表示学习 |
1.2.2 情感词典的文本情感分析方法 |
1.2.3 机器学习的文本情感分析方法 |
1.2.4 深度学习的文本情感分析方法 |
1.3 本文主要内容及章节安排 |
1.3.1 主要内容 |
1.3.2 章节安排 |
2 基础理论与关键技术分析 |
2.1 语言模型框架 |
2.1.1 Word2vec模型 |
2.1.2 BERT模型 |
2.2 深度学习相关理论研究 |
2.2.1 激活函数 |
2.2.2 LSTM模型与BiLSTM模型 |
2.2.3 注意力机制 |
2.2.4 知识蒸馏 |
2.3 本章小结 |
3 基于注意力和词性的BiLSTM情感分析模型研究 |
3.1 文本情感分析常用算法研究 |
3.1.1 卷积神经网络分析 |
3.1.2 BiLSTM模型分析 |
3.2 常用情感分析算法存在问题及优化算法设计 |
3.3 结合注意力和词性的BiLSTM模型设计 |
3.3.1 文本预处理 |
3.3.2 模型整体框架 |
3.3.3 实验设置 |
3.3.4 实验结果与分析 |
3.4 本章小结 |
4 基于知识蒸馏的情感分析模型研究 |
4.1 模型压缩方法分析 |
4.2 知识蒸馏 |
4.2.1 教师模型分析与设计 |
4.2.2 知识蒸馏步骤 |
4.2.3 ALBERT-FN模型设置 |
4.2.4 pos-BiLSTM-Att模型设置 |
4.3 实验结果与分析 |
4.3.1 实验设置 |
4.3.2 实验结果分析 |
4.4 本章小结 |
5 商品情感分析系统的设计与实现 |
5.1 系统需求分析 |
5.2 系统总体方案研究与模块设计 |
5.3 系统框架设计与工作流程 |
5.3.1 系统框架设计 |
5.3.2 系统工作流程 |
5.3.3 数据库设计 |
5.4 开发环境搭建与功能实现 |
5.4.1 开发环境搭建 |
5.4.2 功能实现 |
5.5 本章小结 |
6 总结与展望 |
6.1 工作总结 |
6.2 工作展望 |
致谢 |
参考文献 |
攻读硕士学位期间取得的成果 |
(8)《TTK31-5.5DL型空调机组使用说明书》翻译实践报告(论文提纲范文)
摘要 |
Abstract |
Chapter Ⅰ Introduction |
1.1 Task Background |
1.2 Task Significance |
1.3 Framework of the Report |
Chapter Ⅱ Theoretical Basis |
2.1 Nord’s Model for Translation-oriented Text Analysis |
2.1.1 Origin and Development |
2.1.2 Intratextual and Extratextual Factors |
2.2 Related Studies |
Chapter Ⅲ Translation Process Description |
3.1 Pre-translation |
3.1.1 Formulation of Translation Plan |
3.1.2 Interpretation of Translation Brief |
3.1.3 Analysis of Source Text |
3.1.4 Planning of Translation Strategy |
3.1.5 Preparation of Translation Tools |
3.2 In-translation |
3.2.1 Text-specific Difficulties and Solutions |
3.2.2 Translator-dependent Difficulties and Solutions |
3.2.3 Pragmatic Difficulties and Solutions |
3.2.4 Technical Difficulties and Solutions |
3.3 Post-translation |
3.3.1 Self Review |
3.3.2 Peer Review |
3.3.3 Professional Review |
Chapter Ⅳ Case Analysis |
4.1 Lexical Level |
4.1.1 Literal Translation |
4.1.2 Omission |
4.2 Syntactic Level |
4.2.1 Linear Translation |
4.2.2 Reverse Translation |
4.2.3 Combination |
4.3 Discourse Level |
4.3.1 Substitution |
4.3.2 Reiteration |
Chapter Ⅴ Summary of Translation Practice |
5.1 Experience and Gains |
5.2 Problems and Reflections |
AppendixⅠ Source Text |
AppendixⅡ Target Text |
AppendixⅢ Technical Terms |
References |
Acknowledgements |
(9)空压机流量压力优化控制(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究的背景及意义 |
1.2 国内外研究现状 |
1.3 本文研究内容及结构安排 |
第二章 空压机压力流量控制系统 |
2.1 空压机设备简介 |
2.1.1 空压机的分类 |
2.1.2 离心式空压机 |
2.1.3 螺杆式空压机 |
2.2 面板厂空压机系统供应流程 |
2.3 空压机运行指标分析 |
2.4 本章小结 |
第三章 空压机流量压力控制系统优化设计 |
3.1 压力优化控制流程 |
3.1.1 压力优化控制方案整体规划 |
3.1.2 空压机远程手动控制流程 |
3.1.3 空压机压力控制流程 |
3.1.4 空压机分压控制流程 |
3.2 流量优化控制流程 |
3.3 增压系统控制流程 |
3.4 本章小结 |
第四章 空压机流量压力优化控制系统软硬件设计 |
4.1 硬件设计 |
4.1.1 硬件设计原则 |
4.1.2 硬件选型及搭建 |
4.1.3 控制系统网络架构 |
4.2 软件设计 |
4.2.1 软件设计总体框架 |
4.2.2 下位机PLC的软件设计 |
4.2.3 WinCC过程控制软件操作画面组态 |
4.2.4 最终图控展示 |
4.3 本章小结 |
第五章 系统软硬件调试 |
5.1 硬件调试 |
5.2 软件调试 |
5.3 系统联动测试 |
5.4 调试结果与分析 |
5.5 本章小结 |
第六章 结论与讨论 |
6.1 结论 |
6.2 讨论 |
参考文献 |
致谢 |
附录 |
(10)基于深度学习的文本摘要自动生成模型研究与应用(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 国内外研究现状 |
1.2.1 抽取式摘要 |
1.2.2 生成式摘要 |
1.2.3 抽取生成式摘要 |
1.3 本文的主要工作与创新 |
1.4 论文结构安排 |
第二章 文本自动摘要的相关理论和技术 |
2.1 预训练语言模型 |
2.2.1 NNLM和 Word2vec |
2.2.2 ELMo和 BERT |
2.2 深度学习模型 |
2.2.1 基于卷积神经网络的深度学习模型 |
2.2.2 基于循环神经网络的深度学习模型 |
2.2.3 基于Attention的深度学习模型 |
2.3 文本摘要常用解码算法 |
2.3.1 贪心搜索 |
2.3.2 集束搜索 |
2.4 本章小结 |
第三章 基于深度学习的文本摘要模型研究与改进 |
3.1 文本摘要基线模型研究 |
3.1.1 结合注意力机制的Seq2Seq摘要基线模型研究 |
3.1.2 指针生成网络基线模型研究 |
3.2 在Seq2Seq模型中引入BERT |
3.2.1 结合BERT句向量的改进Seq2Seq模型 |
3.2.2 注意力机制下结合BERT句向量的改进Seq2Seq模型 |
3.3 强化学习下结合先验分布的改进指针生成网络 |
3.3.1 基于Sentence Embedding的先验分布 |
3.3.2 结合先验分布的改进指针生成网络 |
3.3.3 强化学习下结合先验分布的改进指针生成网络 |
3.4 数据集介绍 |
3.4.1 LCSTS |
3.4.2 数据预处理 |
3.5 实验配置以及结果分析 |
3.5.1 实验平台配置 |
3.5.2 实验参数设置 |
3.5.3 评价指标 |
3.5.4 结果分析 |
3.6 与公开模型对比 |
3.7 本章小结 |
第四章 基于自制数据集的文本摘要模型迁移 |
4.1 自制数据集 |
4.1.1 数据集制作 |
4.1.2 数据集扩充 |
4.2 模型迁移实验设置 |
4.2.1 数据集划分 |
4.2.2 实验方案及参数设置 |
4.3 实验结果分析 |
4.3.1 模型迁移前 |
4.3.2 模型迁移后 |
4.4 模型迁移后应用性能对比 |
4.5 本章小结 |
第五章 自动文本摘要技术在企业投诉业务中的应用示范 |
5.1 应用示范总体设计 |
5.2 开发环境 |
5.2.1 自动文本摘要服务开发环境 |
5.2.2 投诉业务开发环境 |
5.3 主要功能模块实现及工作流程 |
5.3.1 自动文本摘要服务 |
5.3.2 投诉业务模块 |
5.3.3 智能摘要及分析功能 |
5.4 应用展示 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 全文总结 |
6.2 未来展望 |
致谢 |
参考文献 |
四、Word 的“压缩”功能(论文参考文献)
- [1]图像文本识别的关键技术研究[D]. 吴湘平. 哈尔滨工业大学, 2021(02)
- [2]美国国情咨文演说的话语合法化策略:语类分析视角[D]. 陈辉. 北京外国语大学, 2021(09)
- [3]基于BERT模型的建筑事故隐患分类研究[D]. 陈俞源. 西安建筑科技大学, 2021(01)
- [4]手写文字识别及相关问题算法研究[D]. 甘吉. 中国科学院大学(中国科学院计算机科学与技术学院), 2021(01)
- [5]基于水印和区块链技术的数字图像交易管理研究[D]. 赵彦霞. 河北大学, 2021
- [6]基于深度学习的汉语—塞尔维亚语机器翻译的研究与实现[D]. 张延星. 河北地质大学, 2021(07)
- [7]基于深度学习的商品评论情感分析方法研究[D]. 宋帆. 陕西科技大学, 2021(09)
- [8]《TTK31-5.5DL型空调机组使用说明书》翻译实践报告[D]. 申雪姣. 河北科技大学, 2020(06)
- [9]空压机流量压力优化控制[D]. 吴健. 内蒙古大学, 2020(04)
- [10]基于深度学习的文本摘要自动生成模型研究与应用[D]. 张思卿. 电子科技大学, 2020(03)