回归分析中一种新的参数估计方法

回归分析中一种新的参数估计方法

一、回归分析中参数估计的一种新方法(论文文献综述)

韩嫱[1](2021)在《基于鞅残差的边缘结构模型评估生活方式对慢性心衰患者再住院的影响》文中进行了进一步梳理目的:本研究拟评估饮茶、催眠药、体育锻炼对慢性心力衰竭患者再住院的影响,并构建和验证在验证集中基于鞅残差填补法的边缘结构模型在评估处理因素有效性分析中的作用。方法:利用全部数据计算鞅残差,并将鞅残差纳入验证数据集构建关于未测量混杂因素的模型,对主数据库中的未测量因素进行填补。采用模拟研究对传统Cox回归分析、PSC、log(t)填补法与基于鞅残差填补法进行比较,使用偏倚,相对标准差及RMSE指标评价基于鞅残差填补法在不同情形下的优劣视。应用基于鞅残差填补的方法优化边缘结构模型来评估慢性心衰患者饮茶、体育锻炼及催眠药影响再住院的潜在风险。在边缘结构模型的概率估计阶段分别进行logistic概率估计;在逆概率加权阶段采用稳定加权和截断加权的方式计算权重值,构建虚拟人群;在效用估计阶段,与传统的统计分析方法对比,验证边缘结构模型处理时依性混杂的有效性。结果:1.模拟结果表明,基于鞅残差的方法较传统方法、倾向性评分校准法及log(t)填补法系统地减少了混杂偏倚,且总体精度最高。倾向性评分校准法估计的偏差取决于假设是否被违反以及违反的程度,当假设被违反时,估计就会产生严重偏差;相比之下,即使假设被严重违反,基于鞅残差的填补估计是无偏的。在所有情况下,基于鞅残基的方法的SD与log(t)填补的SD具有可比性;在多数情况下,基于鞅残基的方法的SD与倾向评分校准法的SD具有可比性,但是当验证样本较小、验证样本为外部样本及随机删失,PSC比基于鞅残差的填补具有较大的标准差;而与传统Cox模型相比,无论偏倚,还是SD,基于鞅残差的方法都具有很好的优越性。2.采用传统的Cox回归分析,发现仅排除基线混杂因素的影响,体育锻炼[HR=0.749 95%CI(0.560,1.003)]及饮茶[HR=1.149 95%CI(0.855,1.546)]对慢性心力衰竭患者再住院无显着影响,而催眠药能增加再住院风险[HR=1.652 95%CI(1.195,2.284)];基于鞅残差填补后的边缘结构模型,排除基线混杂因素、时依性混杂因素影响后,结果表明饮茶能够增加心衰患者的再住院风险[HR=1.257 95%CI(1.036,1.525)],体育锻炼能够减小心衰患者的再住院风险[HR=0.784 95%CI(0.625,0.985)],催眠药则对患者再住院无显着影响[HR=1.142 95%CI(0.922,1.413)]。结论:1.在验证集中基于鞅残差填补法多数情况下表现良好,能够有效减小填补后模型分析的偏倚。边缘结构模型能有效解决时依性混杂因素及在处理因素有效性评估中带来的偏倚。2.体育锻炼能显着减小慢性心力衰竭患者再住院,而饮茶会增加患者再住院风险,对于指导慢性心力衰竭患者出院后的日常生活方式提供了新的方向。未发现催眠药物对慢性心衰患者出院后具有改善作用。

梁洁[2](2021)在《队列研究中具有时变和成分性质饮食数据的因果替代效应估计方法》文中研究说明目的:在探索个体食物摄入量对健康结局的长期影响时,研究者既要面临个体食物摄入量随时间的可变性引起的时变混杂挑战,又要解决个体食物摄入量总和受限的成分性质带来的共线性问题。在观察性研究中选择合适的方法控制时变混杂,关键在于对时变混杂类型的正确定义和识别;而正确分析具有成分性质的饮食数据,关键在于饮食数据所在的艾奇逊空间向欧几里得空间的正确转换。为控制时变混杂、估计暴露为具有成分性质的饮食数据的因果替代效应,本课题将构建观察性研究中识别时变混杂的统计学策略,并分别利用基于协变量均衡和残余混杂均衡的加权算法,将G方法中的逆概率加权与边际结构模型方法拓展到时变暴露为连续型变量的情形,将成分数据坐标转换方法与传统替代分析相结合,在加权总体中构建转换坐标与结局的边际结构模型,估计食物替代与健康结局间的因果效应。旨在解决营养流行病学纵向研究中,具有时变和成分性质的饮食数据与健康结局间的因果推断统计学分析策略和方法,从而在多变的饮食行为现实下,指导公众合理膳食,提供个性化膳食指导意见,提高人群健康水平。方法:本文第一部分首先模拟了针对不同类型时变混杂,使用传统回归校正和基于逆概率加权的边际结构模型估计的因果效应,采用估计偏差和均方根误差判断估计准确度,根据模拟结论进一步提出诊断时变混杂类型的必要性,进而展开在观察性研究中正确识别不同类型时变混杂的诊断方法,从而能基于不同时变混杂类型选取合适的混杂控制方法。根据可交换准则和后门准则,分别采用标准化差值法(SMD)、FQ统计量和基于广义倾向性评分的加权相关方法诊断暴露为二分类变量、多分类和连续型变量的情况下,是否存在时变混杂和时变暴露-混杂反馈。进一步描述了现有G方法及其在理论和应用上的优缺点。由于G方法在连续型时变暴露中的拓展方法非常少,提出将现有的针对不随时间变化的连续型暴露权重估计的协变量均衡广义倾向性评分方法(CBGPS)拓展到G方法中(CBGPS-MSM),在多个随访时间点构建CBGPS,得到多个随访时间点的权重,通过计算累积权重构建新的加权总体,达到控制时变混杂及时变暴露-混杂反馈的目的。进一步比较了CBGPS-MSM方法与基于残余混杂的加权方法RBW-MSM在估计因果效应时的估计准确度和均衡混杂的能力。本文第二部分在替代分析的理论基础上,阐明了传统替代分析面临的关键问题,分析了饮食数据的成分性质以及成分数据存在的单纯形空间形式和该空间中的计算方法,从而解释了传统替代分析方法在处理膳食替代分析时的弱点。提出将成分数据ilr坐标转换方法与传统替代分析思想相结合,构建成分坐标转换替代分析(Co TSA)方法,并通过基于中国健康与营养调查(CNHS)前瞻性队列研究的实例分析,将Co TSA方法与传统替代分析方法进行比较,用于评价动物性食物间的不同替代模式对成年人高血压发病率的影响,其结论针对具体食物而不仅仅是食物能量,故而更便于实际应用中指导人群健康膳食。本文第三部分结合了第一部分和第二部分中的方法,将具有成分性质和时变性质的饮食数据与健康结局间的因果效应分析策略应用第二部分实例中。分析该人群中不同动物性食物摄入量随时间变化的趋势;进行成分数据坐标转换;基于转换后的多个相互独立的连续型暴露坐标,诊断纳入的协变量是否为时变混杂;若存在时变混杂进一步诊断是否构成了时变暴露-混杂反馈;基于识别结果选取合适的统计方法估计ilr坐标与高血压发病间的因果相关系数;采用该系数进行Co TSA分析,得到动物性食物间不同替代模式与高血压发病间的直接因果效应。结果:第一部分:(1)模拟了三种不同类型时变混杂存在时,在样本量不同、模型设定是否正确、因果效应是否存在的不同情况下,分别采用传统回归校正和基于逆概率加权的边际结构模型方法估计因果效应。当不存在时变暴露-混杂反馈时,在小样本情况下,采传统回归校正方法控制混杂得到的估计值相较于逆概率加权结合边际结构模型估计的准确度较高;在大样本情况下,两种方法估计的准确度相近;而当时变暴露-混杂反馈存在时,逆概率加权结合边际结构模型估计的准确度更高。(2)模拟了三种不同类型时变混杂存在时,以及由未测量协变量构建的时变暴露-混杂存在时,在样本量不同、右删失变量是否存在的情形下,当暴露为二分类变量,基于SMD的诊断方法一和二能够有效识别时变混杂和时变暴露-混杂反馈;当暴露为连续型变量的情况,采用加权Pearson或Polyseria相关系数替代SMD指标。当存在相对于暴露和协变量内生性的右删失变量时,若不校正删失将会影响时变混杂和反馈的正确识别。(3)通过模拟研究,在时变暴露为连续型变量且存在时变暴露-混杂反馈时,比较传统回归校正、CBGPS-MSM方法与RBW-MSM方法,在混杂程度不同、模型有无误设以及样本量不同的情况下的估计准确度,并判断CBGPS-MSM方法与RBW-MSM方法均衡混杂的能力。在不同的模拟情形下,CBGPS-MSM方法与RBW-MSM方法相较于传统回归校正方法,估计的准确度高且相近,CBGPS-MSM方法均衡协变量的能力优于RBW-MSM方法,两种方法均是时变暴露为连续型变量时控制时变暴露-混杂反馈的有效G方法。第二部分:通过实例研究,探讨不同动物性食物替代模式与高血压发病风险之间的关系,比较了Co TSA和TSA两种方法的结果。与TSA相比,Co TSA避免了食物摄入量间的相关性造成的多重共线性的问题,其并不局限于一对一的替代,能够根据不同的替代模式估计替代效应,且能够提供针对个体食物摄入模式的灵活的个性化替代策略。根据Co TSA的分析结果,基于该人群动物性食物摄入量的成分均值,使用红肉和加工肉替代其他全部动物性食物将最大程度的增加患高血压的风险(HR=1.062,95%CI:1.050-1.074)。第三部分:基于CHNS的前瞻性队列研究,与本研究在2004-2009年的基线调查相比,该5394例人群在2011年的随访调查中红肉和加工肉的摄入量降低,但相对于其他动物性食物摄入量的平均摄入比例增高;时间在久坐和运动方面分配的时间增加,而睡眠时间降低;BMI值增高,人群中吸烟人数比例降低但饮酒人数比例增高;有1267例为新发高血压病例,发病率为25.8%。结合上述情况,在纳入的协变量中需要诊断时变混杂和时变暴露-混杂反馈,基于转化后的暴露ilr坐标,发现BMI、久坐时间、睡眠时间和总能量的平均摄入量被识别为时变混杂,但未构成时变暴露-混杂反馈,因此可采用传统回归校正方法进行分析。分别采用传统回归校正方法和RBW-MSM方法估计出ilr坐标的因果系数,两者所得因果系数估计值相近(βreg=0.0166 vs.βRBW=0.0196)。进一步采用该系数进行Co TSA分析,所得结论与第二部分中的结论一致(HR=1.017,95%CI:1.002-1.032 vs.HR=1.020,95%CI:1.005-1.035)。结论:本文明确了时变混杂的不同类型,探讨了不同混杂类型下的传统控制混杂的方法和G方法的估计效率,提示并非在所有的前瞻性研究中必须使用G方法控制混杂,明确了在时变暴露-混杂反馈存在下G方法的优越性。进一步基于可互换性条件和后门准则,将用于评价协变量均衡的方法加以改进,拓展到队列研究中暴露为不同类型变量时,识别时变混杂和时变暴露-混杂反馈的应用中,通过控制要识别的变量的后门路径,创建外生变量,进行时变混杂和时变暴露-混杂反馈的识别,以在前瞻性队列研究中,为研究者选用合适的控制混杂的统计方法提供统计学参考。当时变暴露为连续型变量时,可以采用基于协变量均衡和残余混杂均衡的CBGPS-MSM方法和RBW-MSM方法,两者均是时变暴露为连续型变量且含有时变暴露-混杂反馈情形下因果推断行之有效的方法。此外,我们提出了Co TSA方法,将成分数据ilr坐标转化与替代的概念相结合,用于实现具有成分性质的饮食数据替代分析。将分析时变混杂的策略和方法与Co TSA方法相结合,基于中国成年人饮食与健康调查的前瞻性队列研究,应用于动物性食物中不同食物间的相互替代,探讨不同替代模式与高血压发病风险之间的因果关系。根据研究结论,建议该人群降低红肉和加工肉的摄入量,以更好的预防高血压。

杜瑶[3](2021)在《基于激光诱导击穿光谱的含油污泥中重金属分析方法研究》文中提出石油作为生活中不可或缺的资源,从开采到使用过程中会产生大量的含油污泥,其中包含大量毒害物质,尤其是含油污泥中重金属,会对人体健康和环境产生严重危害。因此,本研究从含油污泥中重金属元素定量分析和危险性预估的需求出发,建立基于激光诱导击穿光谱技术(LIBS)结合化学计量学的含油污泥重金属快速定量分析以及潜在环境风险预估方法,实现对含油污泥中重金属精准快速检测,为含油污泥区域重金属的环境污染预警与防治提供理论依据与技术支撑。主要研究内容如下:(1)以含油污泥为研究对象,建立基于LIBS的WT-RF模型测定含油污泥中重金属元素定量分析方法。首先,基于信背比优化LIBS激光能量。其次,研究不同预处理方法(归一化、标准正态变换和小波变换)对RF模型性能的影响。最后,建立基于最优预处理方法下LIBS的RF校正模型和标准曲线法。采集含油污泥中重金属元素光谱信息。结果表明,基于LIBS的WT-RF的模型性能更加可靠,其中Cu、Zn、Cr和Pb预测集的RMSEP分别为0.0288、0.0103、0.0309和0.0330,R2P分别为0.9587、0.9605、0.9589和0.9570,可以为含油污泥中重金属定量分析提供一种新方法。(2)以现含油污泥为研究对象,建立基于变量重要性的LIBS结合WT-VIRF的含油污泥中重金属含量测定方法。首先,在小波变换对LIBS全谱数据处理的基础上,对变量重要性最佳阈值和模型参数进行选择与优化。其次,基于最优参数分别构建PLS、RF和LS-SVM的含油污泥中金属定量分析模型。结果表明,相较于PLS和LS-SVM,WT-VIRFRF模型精确度最高,其中Cu、Zn、Cr和Pb预测集的RMSEP分别为0.0271、0.0074、0.0162和0.0245,RP2分别为0.9740、0.9665、0.9750和0.9600,基于LIBS的WT-VIRF分析模型相比全谱RF建模时间减少,是一种可以准确快速实现含油污泥中重金属含量分析方法。(3)以重金属的污染指数值和潜在生态风险值为研究对象,建立基于LIBS的WT-RF模型对内梅罗污染指数Pn和潜在生态风险指数RI指数分析方法。首先,根据XRF得出Pn和RI参考值。其次,在小波变换的基础上选择优化模型参数,构建基于LIBS的RF的Pn和RI指数分析模型。结果表明,预测集的Pn和RI的MRE分别8.67%和8.23%,R2P分别为0.9745和0.9730,LIBS结合WT-RF得出Pn和RI所判定的风险预测结果与XRF一致,为含油污泥区域重金属风险预估提供一种新的思路。

晋冬丽[4](2021)在《部分观测信息下工程结构时变参数识别方法研究》文中指出由于外部荷载效应、环境的侵蚀及材料的老化等耦合因素,结构会出现损伤累积,造成力学性能退化,使得结构参数具有时变性,表现出时变力学特征。此外,工程结构在不同荷载条件、不同工作环境下,结构参数也会表现出明显的时变特征,如车-桥组成的耦合时变系统、人群-大跨度空间结构组成的时变系统。为保证工程结构在服役期间的安全性,其时变力学行为不容忽视。结构参数识别作为结构健康监测的重要研究内容之一,能够直观描述结构在全寿命过程中产生的性能退化、损伤演化规律。因此,研究结构参数的时变规律,变得意义重大。本文针对此问题,以工程时变结构为研究对象,采用小波理论、卡尔曼滤波理论等主要研究方法,利用理论分析、数值模拟及模型试验相结合的研究手段,开展了部分观测信息下工程结构时变参数识别方法的研究。研究内容主要包括以下几个方面:(1)进行了小波多分辨率分析及无迹卡尔曼滤波估计理论研究。阐述了小波多分辨分析的原理和实现过程,对无迹卡尔曼滤波估计等方面进行了理论研究,给出了无迹卡尔曼滤波及小波多分辨分析的算法流程,并进行了不同噪声水平下无迹卡尔曼滤波估计系统响应的仿真分析。阐述了小波多分辨分析在结构参数识别中的应用,对单自由度以及二自由度线性结构系统进行了数值仿真分析,说明方法的可行性。(2)提出基于部分观测信息的WMRA-UKF迭代时变参数识别新方法。该方法在部分观测数据条件下,研究无迹卡尔曼滤波技术对结构系统的状态最优估计,基于WMRA理论,融入无迹卡尔曼滤波技术,建立多自由度时变振动系统的时变参数识别迭代方法理论模型。将其应用于单自由度及多自由度结构系统,并进行了算法的抗噪性研究,表明该方法具有很好的准确性、适用性和抗噪性。(3)为了进一步验证所提出方法的适用性,设计三层钢框架振动台模型试验,基于部分测试的响应数据,通过结构的刚度突变模拟性能退化、损伤发生,验证本方法用于识别结构系统时变参数的正确性与适用性。

邓钦[5](2021)在《基于机器学习的钙钛矿材料性能研究》文中研究说明在材料的发现中,探索材料的结构、组分和性能的关系是非常关键的,机器学习可以作为一种有效的工具。然而,传统机器学习的复杂性和模型可解释性的缺乏,使得很难推导出简单的描述性公式。钙钛矿材料因其在燃料电池和电催化方面具有很多出色的性能而受到许多研究学家的关注。热力学稳定性是一个关键参数,它广泛地决定了材料是否有望合成,以及在一定的操作条件下是否会分解。热稳定性和化学稳定性,在很大程度上取决于材料的形成能。带隙是决定钙钛矿材料光学性能的一个重要参数,它控制各种光电器件的性能。在高温燃料电池技术中,氧空位形成能是实现氧快速扩散和氧催化的重要指标。基于第一性原理的高通量计算(DFT)得到较高精确度的形成能、稳定性、带隙和氧空位形成能,需要花费大量的时间和精力,效率很低,而且通过实验来获取大量钙钛矿材料体系的形成能、稳定性、带隙和氧空位形成能也不现实。所以基于人工智能的机器学习预测方法就成了一种高效的替代方法。本文的主要内容包括以下方面:第一部分,本文提出了一种新方法,将暴力特征工程和线性回归相结合来探索钙钛矿材料的结构、组分和性能关系。探讨了钙钛矿的热力学稳定性、晶格常数与其他特征的关系。利用暴力特征工程构造大量新的描述符,通过特征选择得到重要的描述符子集,然后通过线性回归算法找到了最优描述符,得到了热力学稳定性和晶格常数的新表达式。第二部分,对特征进行了比较,选取有效特征作为描述符,建立了基于随机森林(RF)、梯度提升回归树(GBR)、自适应增强算法(AdaBoost)、分类梯度提升树(Cat Boost)和极端梯度提升树(XGBoost)等不同机器学习算法的预测模型。研究其与ABO3钙钛矿化合物的形成能、稳定性、带隙和氧空位形成能之间的关系,并得到具有较高准确性的模型,对这四种关键性能进行预测。借助训练好的机器学习模型,找到了影响钙钛矿性能的关键特征。结果表明,这种将暴力特征工程和线性回归相结的方法可以在没有先验知识的情况下探索材料的结构、组分和性能关系,加速了材料的发展,为材料的探索和研究提供了一种新方法。在对钙钛矿性质预测的研究中,该模型具有非常高的准确率,可以广泛应用于需要进行大批量性能预测的钙钛矿材料研究中。

汪军[6](2020)在《非线性模型中处理效应的估计及其应用》文中研究表明在流行病学、医学、社会学和经济学等学科中,研究者们通常关心处理效应的估计问题。因为政策干预的效果大小影响着政策是否需要广泛的实施,新药的效果大小影响着是否生产新药,这些效果的大小都可以用处理效应来刻画。因此,处理效应的估计显得极其重要。在流行病学、医学、社会学和经济学等学科中,有很多响应变量是离散的,因此研究非线性模型中处理效应的估计问题也是非常重要的。由于非线性模型的特殊性和模型中存在不可观测的且是异质的变量,一般平均处理效应的估计方法并不适用于非线性模型。在这篇文章中,我们主要考虑非线性模型中处理效应的估计方法,并将理论方法应用到实际数据分析中。在本文中,我们主要的研究工作为以下几点。(1)考虑匹配数据中组之间存在异质性的probit模型,在组之间存在比较大差异(组效应较大)的时候,我们提出一种新的方法估计模型中的处理效应,并在理论上证明提出的估计量具有一致性和渐近正态性。另外,模拟研究表明提出的估计量有良好的有限样本性质,且当组效应来自双峰不对称分布的时候,提出的估计量是优于Heckman方法;就偏差和均方根误差而言,提出估计量比逆概率加权估计量和条件似然估计量好。我们将提出的方法应用于母亲怀孕期间抽烟对低生儿的影响。(2)考虑出现不可观测混杂的非线性模型,允许个体之间不可观测的混杂是异质的。当不可观测混杂较大的时候,我们提出一种新方法估计非线性模型中的处理效应和一个统计量来检验非线性模型中处理效应的存在性,并在理论上证明提出的估计量是一致且渐近正态的。模拟研究表明提出的估计方法对于各种不可观测混杂的分布是稳健的,且提出的估计方法不会改变模型中处理效应的方向。我们将提出的方法应用于母亲怀孕期间饮酒对低生儿的影响。(3)考虑在非线性模型中,允许不可观测混杂对处理变量和结果变量影响方向不一致和不可观测混杂与随机项的关系是任意的。我们利用拟似然方法估计该模型中的处理效应,并且证明拟似然估计量相对于伪真实参数是一致且渐近正态的,当处理变量内生性弱的情况下,我们提出拟似然估计量优于特殊回归估计量。我们将提出的理论方法应用于病人是否拥有私人健康医疗保险对是否就医的影响。

付茜雯[7](2020)在《计算机科技论文摘要的机翻错误类型及译后编辑》文中认为科研论文在知识传播过程中作用重大,推动国际范围内的知识共享。摘要是科研论文中必不可少的一部分,既是对论文的概括性总结,也是读者发现和探寻相关领域知识的快捷途径。然而,目前英文摘要的机器翻译质量在精确性和专业性方面都不尽人意,需要通过后期编辑和人工校对才能产出高质量的中文翻译文本。本文以计算机科学论文摘要为例,对谷歌机器翻译的300篇计算机英文论文摘要的中文版本进行了翻译错误类型分析并归类,并提出相应的译后编辑策略。首先在赖斯文本类型理论翻译策略指导下,对机器翻译系统生成的译文进行译后编辑,再邀请计算机专业以及翻译专业的专业人士进行确认。之后以DQF-MQM错误类型分类框架为依据,对机器翻译系统生成的译文中的错误进行分类。研究发现,机器翻译的计算机英文论文摘要的中文版本中存在七大类翻译错误,其中不符合中文表达习惯的翻译错误占比最大,其次是术语误译、误译、欠译、漏译、过译以及赘译。本论文研究发现,由于源文本的信息型学术文本特征,长难句、被动语态以及术语翻译是造成机器翻译错误的主要原因。针对源文本的逻辑缜密、语步序固定等特征,本研究针对性地对各类错误类型提出了相应译后编辑策略。建议译者在译后编辑中通过将隐性连接转换为显性连接从而保持源文逻辑性,通过增加主语以及调整语序处理被动语态保持源文的学术精准,通过恰当选取词意处理半技术词汇等。本研究采用定性和定量分析方法,系统归类了计算机科技文本摘要中机器翻译出现的错误,并提出相应译后编辑策略,为该领域的译者提供参考建议,从而提高该领域的机器翻译质量。

李猛[8](2019)在《基于太赫兹技术的变压器绝缘油的检测与分析》文中研究指明电力变压器绝缘油的检测与分析是变压器故障诊断的有效手段,目前采用的变压器绝缘油检测技术主要是利用气相色谱法,这种传统的检测分析方法不仅存在操作复杂的缺点,而且不适合在线检测,难以及时发现变压器的故障隐患。因此,研究新的变压器绝缘油的检测分析方法对保障供电安全具有重要的意义。太赫兹时域光谱技术是近十几年发展的一项新的检测分析技术,利用该技术检测分析变压器的绝缘油尚未有先例,是一种具有挑战性的尝试。本文将采用宽频太赫兹时域光谱技术结合化学计量学方法对变压器绝缘油进行分析研究,将为变压器故障的检测分析提供新的手段。本文主要的研究内容包括:(1)研究分析了太赫兹时域光谱信号的噪声问题。为了降低太赫兹时域光谱信号的噪声,本文从硬件和软件两个方面开展了研究。硬件方面,本文分析了太赫兹时域光谱系统中锁相放大器时间常数对噪声的影响;软件方面,本文研究了两种降噪滤波方法:一种是双边滤波算法,另一种是小波变换算法。前者用于太赫兹信号白噪声的初步滤波处理,后者由于太赫兹信号离散精细滤波处理。在研究分析传统的双边滤波、基于离散余弦变换的双边滤波、基于法向修正的双边滤波和自适应双边滤波算法的基础上,提出了基于主成分分析的自适应双边滤波算法,取得了较好的降噪效果;研究分析了四种常规去噪算法,如固定阈值法、无偏估计法、极小最大方差法和启发式阈值法,在对比分析四种阈值算法去噪效果的基础上,本文提出了基于软、硬阈值函数的新方法,通过结合两者的优势使得降噪效果得到明显改进。最后,利用小波变换对改进优化的滤波算法进行优化,获得了满意的去噪效果。(2)研究分析了太赫兹时域光谱的光学参数提取方法。通过对比分析全变差最小化法、菲涅尔解析法和公式法、克莱默-克朗尼格分析法和衰减全反射法等太赫兹时域光谱的光学参数提取方法,针对变压器绝缘油的太赫兹光谱特征特性,本文提出了基于梯度下降算法的光学模型,并用于太赫兹光学参数的提取。采用该方法对不同工作年份的变压器绝缘油进行了实验。实验结果表明,随着工作时间的延长,变压器绝缘油会分解的低分子烃类及杂质成分越多,这为通过变压器绝缘油的分析判断变压器的故障提供了很好的条件。(3)利用太赫兹时域光谱技术对变压器热性故障、电性故障和局部受潮等三种典型的变压器故障的绝缘油进行了定性分析。本文设计搭建了三种常见变压器故障的模型并对模拟实验结果进行取样分析。分别采用混沌粒子群参数优化算法、遗传算法和标准粒子群参数优化算法的支持向量机模型对三种不同热化温度和四种放电模型得到的实验油样进行分析,提出基于退火粒子群参数优化的支持向量机模型,对热化和电性故障的分析的准确率分别达到98.55%和98.18%。(4)利用太赫兹时域光谱技术对变压器绝缘油老化过程中产生的烃类等物质进行检测,由于太赫兹光波具有高透过性,而且对于分子间振动及转动较为敏感的特性,能够检测和观察绝缘油恶化过程中的官能团变化。为了进一步研究局部受潮故障中变压器绝缘油含水量的预测,本文在实验室设计了四种放电模型及多种模拟试验,利用偏最小二乘法对太赫兹吸收光谱进行分析,实现了基于太赫兹时域光谱技术的变压器绝缘油水分含量的定量预测。(5)利用太赫兹时域光谱技术对变压器热性故障、电性故障和局部受潮等三种变压器故障进行识别分类研究。在分析常规区间偏最小二乘法原理、向后区间偏最小二乘法原理和移动窗口偏最小二乘法原理对三种变压器故障进行识别的基础上,提出了基于模糊聚类的优选变量偏最小二乘法。实验结果表明,本文提出的基于模糊聚类的优选变量偏最小二乘法对变压器故障的别分类准确度明显优于其它三种最小二乘法方法,获得了分类准确率接近100%的效果,为变压器的故障判断提供了一种新的方法。本文研究结果与现有的基于气相色谱分析方法进行了对比,结果表明,本项目研究的基于太赫兹时域光谱分析变压器绝缘油的方法,对变压器典型故障的识别完全与现有方法相同,具有很好的应用前景。该论文有图58幅,表26个,参考文献160篇。

唐坤[9](2019)在《数据驱动的城市路网行程时间估计与预测方法研究》文中提出随着城镇化进程的推进,我国城市道路交通系统的运行状况日益恶化,不仅损害了交通参与者的出行效率,而且造成了日益严重的环境污染,极大了损害了人们在城市中的生活品质。为了解决这些问题,城市路网中全面、准确的道路交通信息至关重要。作为一种极为重要的交通基础信息,行程时间最能直接反应道路交通的运行状态,受到了人们的广泛关注。准确、可靠的城市路网行程时间是智能交通系统(Intelligent Transportation System,ITS)的重要基础,在城市交通规划、交通运输管理的各个方面都发挥着极为重要的作用,对提高交通系统运行效率、缓解城市交通拥堵具有重要的指导意义。然而,由于城市交通系统的复杂性,城市路网中的行程时间受到内在与外在因素的综合影响,具有显着的内在不确定性,城市路网行程时间的准确估计与预测是一项极具挑战性的任务。随着信息技术与智能交通系统的发展,交通数据的采集方式日益丰富,交通已经从一个数据匮乏的时期进入到大数据时代。日益剧增的海量数据蕴含了大量的信息与知识,为城市路网中复杂交通问题的解决提供了更多可能的途径。如何从海量的数据中挖掘知识,以此对城市路网的行程时间进行准确地估计与预测是交通研究的热点与难点。顺应这种趋势,本文以城市路网行程时间为研究对象,从数据的角度出发,在海量数据分析的基础上,对大数据环境下数据驱动的城市路网行程时间估计与预测方法进行研究,以此提高行程时间估计与预测方法的有效性与准确性,为提高城市交通系统运行效率、缓解城市交通拥堵提供有效的数据支撑,具有重要的理论价值与实践意义。针对上述研究目标,本文主要的研究工作及创新之处体现在以下几个方面。(1)海量稀疏GPS数据处理方法基于出租车的浮动车GPS数据通常具有规模大、数据稀疏等特点,并且数据的质量容易受到外界因素的影响。为了解决上述问题,本文对基于海量稀疏GPS轨迹数据的行程时间提取处理方法进行了深入研究与改进。针对GPS数据可能存在的数据误差,从采样时间间隔、瞬时行驶速度、车辆停留时间、空间位置漂移等多个角度提出了相应的数据预处理措施,以此提升数据的质量。为了从稀疏的GPS数据中获取行程时间,对基于GPS数据的行程时间提取处理方法进行了研究与改进,包括GPS数据地图匹配、稀疏数据路径推导与路径行程时间分配。为了获得更好的GPS数据地图映射结果,采用了一种基于隐马尔科夫模型HMM的地图映射方法。在此基础上,利用改进的局部区域Dijkstra最短路径搜索算法对稀疏GPS数据点之间的车辆行驶路径进行推导与重构。最后,利用Hellinga算法将GPS数据点之间的路径行程时间分配至构成该路径的所有路段上。通过上述数据处理方法,能够实现基于GPS轨迹数据的行程时间提取,为后续的行程时间估计与预测研究提供了数据基础。(2)基于稀疏GPS大数据的城市路网行程时间估计方法基于GPS数据的城市路网行程时间分析存在多个方面的挑战,包括GPS数据稀疏、交通状态波动、网络级建模困难等。针对上述问题,本文引入张量建模的思想,提出了一种基于稀疏GPS大数据的城市路网行程时间估计模型。该模型是一种数据驱动的时空关系模型,由地图匹配、路网行程时间建模,概率行程时间聚类以及基于张量分解的行程时间估计四个主要部分构成,不仅考虑了行程时间在不同路段上的空间相关性,而且考虑了不同交通状态下行程时间的差异性,同时还考虑了行程时间在当前时间段内的细粒度时间相关性以及行程时间在当前时间段内与历史行程时间内之间的粗粒度时间相关性。以海量出租车GPS轨迹数据为基础,在北京城市路网中进行实例研究的结果表明,新模型不仅能够获得当前时间段内路网中不同路段在不同交通状态下的行程时间,而且能够获得路段上对应交通状态的发生概率。与其他方法相比,新模型不仅能够对更多的缺失行程时间进行估计,而且能够获得更高的行程时间估计精度,同时具有对模型参数较好的鲁棒性。(3)基于贝叶斯概率张量分解的城市路网行程时间估计方法针对复杂城市交通环境下行程时间的不确定性与驾驶员之间的差异性等问题,本文引入概率建模的思想,提出了一种基于贝叶斯概率张量分解的城市路网行程时间估计方法。该方法将不同时间段内不同驾驶员在路网中不同路段上的行程时间构建为三阶张量。考虑到城市路网中道路上行程时间的不确定性,该方法在概率建模的基础上,将张量中的每个元素构建为一个服从对数正态分布的随机变量。通过完全贝叶斯处理,该方法能够实现模型超参数的自动调优与模型复杂度的自动控制,有效地避免了模型在使用大规模稀疏数据情况下容易出现的过拟合问题。提出的新方法是一种上下文感知的时空关系模型,不仅考虑了行程时间在不同路段上的空间相关性,而且考虑了不同驾驶员行程时间之间的差异性,同时还考虑了行程时间在相邻时间段内的细粒度时间相关性以及行程时间在当前时间段内与历史时间段内的粗粒度时间相关性。基于海量GPS数据的实际案例研究结果表明,该方法能够在不产生过拟合的基础上,以较高的精度对路网中的行程时间进行估计,估计精度对模型参数的初始化不敏感,具有较好的模型鲁棒性。(4)基于深度学习的城市路网行程时间预测方法针对现有行程时间预测方法存在的浅层模型表达能力有限、缺乏对环境特征的考虑等问题,本文提出了一种融合环境信息的城市网络级行程时间预测深度学习模型。该方法以提取的道路特征、环境特征、时间相关特征与空间相关特征等行程时间影响因素数据为基础,将行程时间预测问题建模为一个数据驱动的机器学习问题。以稀疏降噪自动编码器为基本元件构建了一个深度网络,以此对城市路网中高度复杂的行程时间进行更好地描述。为了对深度网络进行有效地学习,以贪婪学习为基础设计了一种逐层预训练的半监督深度网络训练方法。提出的新模型是一种深度学习模型,不仅考虑了路段特性与周边环境对行程时间的影响,而且考虑了行程时间在不同路段上的空间相关性与在不同时间段内的时间相关性,能够对大量无标签数据中包含的信息进行充分提取与利用,以一种无监督的方式逐层自适应地学习用于行程时间预测的特征,对交通中复杂的非线性现象具有强大的建模能力。以北京城市路网为例进行研究的实验结果表明,提出的深度网络能够从海量噪声数据中充分提取与利用有用信息,以较高的精度对行程时间进行预测,具有较好的模型稳定性与扩展性,与其他方法相比具有一定的优势。

王建生[10](2017)在《保障性住房能够促进区域人口流动吗? ——基于空间计量交互模型分析》文中研究表明人口流动是推动我国工业化和城市化进程的重要力量,住房是农业转移人口城市融合的必要条件。通过住房保障政策实现农村转移人口城市融合以此提高城市化质量水平,这是2015年中央经济工作会议指出中国将努力化解房地产库存,帮助农村居民在城市买房的应有之义。然而,随着人口红利的消失和老龄化社会的来临,摆在各城市面前的首要问题很可能变成如何吸引更多人口的流入,这也是第十八届五中全会指出要积极应对人口结构失衡的弦外之音。住房是一个人最基本的物质生活资料,由于流动人口收入低,进入城市很难购买商品房,而保障性住房成为解决流动人口住房问题的“重要武器”,能够显着地降低流动人口在城市的生活成本,从而增加城市对流动人口的吸引力,因此大量流动人口流入城市造成了住房等准公共产品的供给问题,这可能也为城市吸引人口流入提供了一个良机。然而,在现有户籍制度和城市偏向政策下,保障性住房真的能够促进人口流动吗?基于此,本文在现有住房政策背景下,以住房市场供求理论为基础,从政府投资建设保障房的视角,探究其对促进人口流动作用机制,试图为区域完善保障性住房政策以及制定合理的人口流动调控政策提供理论上的指导。研究保障性住房和人口流动问题,有助于对中国新型城镇化情景下人口流动规律的认识和把握,然而关于这一问题的理论探讨和经验性检验还非常少见。本文将保障性住房和人口流动纳入一个分析框架,详细分析保障性住房对人口流动的影响机理。在理论机制分析基础上,本文收集了我国人口普查的人口流动数据和保障房有关的财政数据,进行保障性住房对人口流动影响的实证研究。首先,本文基于传统引力模型分析了人口流动的影响因素和机制,重点分析了保障性住房对人口流动的影响。实证结果发现,保障性住房对人口流动有显着影响,但是需要强调的是,本文根据Lesage(2015)提出一种新的方法来解释传统引力模型估计的结果,这种方法在研究中还没有被运用,旨在利用一个新的视角纠正以往引力模型研究中有关解释变量系数含义的一个普遍误差。然后,现有大量文献认为人口流动在空间上存在显着地相互作用,本文运用探索性空间数据分析,发现我国区域人口流动在空间上也存在显着地的空间相关性,基于此,为了验证当存在空间依赖效应时,保障性住房对人口流动的作用方向和大小,本文构建保障性住房对人口流动影响的空间计量交互模型进行实证分析,这种模型还可测度直接效应和空间溢出效应。同时,还进一步将31个省级行政单位根据地理位置划分为发达地区和一般地区,分别进行分区域实证分析。研究发现:人口流动在相邻地理空间上存在显着地相关性,保障性住房建设不仅对本地区人口流入有促进作用,还对其他地区有空间溢出效应,若不考虑空间溢出效应,会低估保障性住房对人口流入的促进作用;分区域来看,发达地区保障性住房对人口流动影响的直接效应大于一般地区这一结果,一般地区大于全样本数据结果;保障性住房对人口流动影响的空间溢出效应结果相同,然而这两种效应在一般地区内都不显着。为了进一步验证本文实证结果的稳健性和可靠性,本文还运用了经济适用房数据和空间贝叶斯MCMC方法进行稳健性检验。结果发现,本文的实证结果都具有稳健性。最后,基于上述理论分析与实证研究结果,本文认为:第一,各地区在吸引人口流入时,要综合考虑人口流动的区域竞争性、协同性和溢出效应。对于地理相邻地区,应该加强人口政策、社会保障政策的协同,放大区域合作效应。第二,各地区不仅需要加大保障性住房建设面积,还要不断完善保障性住房政策,加大户籍制度改革,扩大保障性住房覆盖范围,增加扶持力度,减轻企业负担,这也是政府“供给侧改革”的应有之义。第三,在充分考虑空间依赖性的基础上,研究保障房建设促进人口流动的直接效应和空间溢出效应,对新形势下各地区完善保障性住房政策从而采用“以房争人”手段来推动各地区乃至整个中国的城市化和工业化进程具有重要的现实意义。

二、回归分析中参数估计的一种新方法(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、回归分析中参数估计的一种新方法(论文提纲范文)

(1)基于鞅残差的边缘结构模型评估生活方式对慢性心衰患者再住院的影响(论文提纲范文)

摘要
abstract
常用缩写词中英文对照表
前言
    一、 研究意义
    二、 国内外研究现状和存在问题
    三、 本文主要研究内容
1 理论与方法
    1.1 基于MR的多重填补法控制仅在验证样本中测量的混杂因素
        1.1.1 非时依性数据和内部验证样本
        1.1.2 时依数据和外部验证样本
    1.2 边缘结构模型
        1.2.1 逆概率加权
2 模拟研究
    2.1 非时依性协变量
    2.2 时依性混杂因素和外部验证样本
3 实例应用
    3.1 研究对象及内容
    3.2 数据处理
    3.3 统计分析
    3.4 结果
        3.4.1 患者基本情况描述
        3.4.2 心衰患者再住院单因素分析及权重分布情况
        3.4.3 采用不同方式估计体育锻炼对心衰患者再住院的影响
        3.4.4 采用不同方式估计饮茶对心衰患者再住院的影响
        3.4.5 采用不同方式估计催眠药对心衰患者再住院的影响
4 讨论
    4.1 时依性混杂因素
    4.2 未测量混杂因素
    4.3 生活方式对慢性心衰患者再住院的影响
5 结论
参考文献
综述 控制临床研究中未测量混杂因素的方法及应用
    参考文献
致谢
个人简介

(2)队列研究中具有时变和成分性质饮食数据的因果替代效应估计方法(论文提纲范文)

摘要
Abstract
常用缩写词中英文对照表
前言
第一部分 队列研究中时变暴露的因果推断策略及方法
    1 时变暴露因果推断中的关键问题
        1.1 可识别条件
        1.2 混杂识别准则
        1.3 时变暴露与时变混杂
        1.4 模拟时变暴露存在时不同混杂情形下的因果效应估计结果
        1.4.1 模拟设置
        1.4.2 模拟结果
        1.5 小结
    2 时变混杂的识别方法
        2.1 识别时变混杂
        2.1.1 不存在删失
        2.1.2 存在删失数据
        2.2 时变暴露-混杂反馈的识别方法
        2.2.1 不存在删失数据
        2.2.2 存在删失数据
        2.3 模拟
        2.3.1 模拟设置
        2.3.2 模拟结果
        2.4 小结
    3 时变混杂的控制方法
        3.1 G方法介绍
        3.1.1 参数g-formula
        3.1.2 IPW结合MSM
        3.1.3 基于结构嵌套模型的G估计
        3.1.4 双稳健估计
        3.2 G方法在连续型时变暴露中的拓展
        3.2.1 基于协变量均衡的IPW结合MSM
        3.2.2 基于残余混杂均衡的IPW结合MSM
        3.3 模拟
        3.3.1 模拟设置
        3.3.2 模拟结果
        3.4 小结
    4 小结
第二部分 饮食数据的成分替代分析
    1 引言
    2 传统替代分析
        2.1 替代分析的理论思想
        2.2 传统替代分析模型
        2.3 传统替代分析面临的问题
        2.3.1 多重共线性
        2.3.2 基于总能量和总摄入量的替代分析
        2.3.3 替代分析中食物摄入量的评价尺度
    3 成分替代分析
        3.1 膳食数据的成分性质
        3.2 成分数据所属单纯形空间的计算法则
        3.3 成分坐标转换
        3.4 成分替代分析
    4 实例分析
        4.1 研究背景
        4.2 数据收集
        4.3 统计分析方法
        4.4 结果
    5 小结
第三部分 队列研究中具有时变和成分性质饮食数据的因果替代效应估计
    1 引言
    2 具有时变和成分性质的饮食数据因果替代分析步骤
        2.1 数据描述
        2.2 成分数据坐标转换
        2.3 时变暴露-混杂反馈的诊断
        2.4 估计基于ilr坐标的因果系数
        2.5 计算因果替代效应
    3 小结
参考文献
综述
    1 观察性研究中G方法的理论和实践应用
        1.1 时依混杂概念
        1.2 G方法理论介绍
        1.3 不同G方法间的比较
        1.4 G方法在营养流行病学中的应用
    2 膳食研究中的替代分析方法
        2.1 替代分析的基本假设和方法介绍
        2.2 替代分析前提假设中暗含的成分性质
        2.3 关于替代应发生在营养素还是食物之间的关键问题讨论
    3 小结
    参考文献
致谢
个人简介

(3)基于激光诱导击穿光谱的含油污泥中重金属分析方法研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究背景及意义
    1.2 重金属元素分析进展
    1.3 激光诱导击穿光谱技术
        1.3.1 LIBS技术概况
        1.3.2 LIBS技术原理
        1.3.3 LIBS仪器组成
        1.3.4 影响LIBS分析准确度的主要因素
    1.4 化学计量学
        1.4.1 化学计量学简介
        1.4.2 LIBS分析中的化学计量学方法
    1.5 论文研究内容
第二章 基于 LIBS 结合 WT-RF 的含油污泥中重金属元素定量分析方法研究
    2.1 引言
    2.2 实验部分
        2.2.1 样品制备与参考浓度的获取
        2.2.2 LIBS光谱采集
    2.3 结果与讨论
        2.3.1 含油污泥LIBS光谱解析
        2.3.2 光谱预处理方法的选择与优化
        2.3.3 含油污泥中重金属RF定量分析模型构建
        2.3.4 含油污泥中重金属的标准曲线法分析
    2.4 本章小结
第三章 基于 LIBS 结合 WT-VIRF 的含油污泥中重金属元素含量分析方法研究
    3.1 引言
    3.2 实验部分
    3.3 结果与讨论
        3.3.1 模型输入变量的选择与优化
        3.3.2 基于不同校正模型预测性能比较
    3.4 本章小结
第四章 基于LIBS的 WT-RF的含油污泥中重金属风险预估
    4.1 引言
    4.2 实验部分
    4.3 研究方法介绍
        4.3.1 内梅罗污染指数法
        4.3.2 Hakanson潜在生态危害指数法
    4.4 结果与讨论
        4.4.1 小波参数的选择与优化
        4.4.2 LIBS结合RF的 P_n和RI指数预估模型
    4.5 本章小结
第五章 结论与展望
致谢
参考文献
攻读硕士学位期间取得的科研成果及参与的科研项目
    一:发表论文及专利情况
    二:参与科研项目

(4)部分观测信息下工程结构时变参数识别方法研究(论文提纲范文)

摘要
Abstract
第1章 绪论
    1.1 课题研究的背景与意义
    1.2 工程结构时不变参数识别方法研究现状
        1.2.1 峰值法
        1.2.2 频域分解法
        1.2.3 随机子空间法
        1.2.4 时间序列方法
    1.3 工程结构时变参数识别方法研究现状
        1.3.1 希尔伯特-黄变换
        1.3.2 最小二乘估计类方法
        1.3.3 卡尔曼滤波类方法
        1.3.4 小波分析方法
    1.4 本文研究内容与创新点
        1.4.1 研究内容
        1.4.2 创新点
        1.4.3 技术路线
第2章 小波多分辨分析及无迹卡尔曼滤波理论
    2.1 引言
    2.2 小波多分辨分析
        2.2.1 小波多分辨分析的概念
        2.2.2 小波多分辨分析的理解
    2.3 无迹卡尔曼滤波
        2.3.1 无迹卡尔曼滤波理论
        2.3.2 基于无迹卡尔曼滤波估计的数值仿真
    2.4 本章小结
第3章 基于WMRA的线性结构时变参数识别
    3.1 引言
    3.2 基于WMRA的线性结构时变参数识别
        3.2.1 时变参数识别模型的建立
        3.2.2 时变参数小波多分辨率表达
    3.3 数值仿真
        3.3.1 单自由度线性结构数值仿真
        3.3.2 多自由度线性结构数值仿真
    3.4 本章小结
第4章 基于WMRA-UKF的线性结构时变参数识别
    4.1 引言
    4.2 部分观测信息下基于WRMA-UKF的模型建立
    4.3 数值仿真
        4.3.1 单自由度线性结构数值仿真
        4.3.2 三自由度线性结构数值仿真
        4.3.3 五自由度线性结构数值仿真
    4.4 抗噪性研究
        4.4.1 结构加速度噪声
        4.4.2 观测噪声
        4.4.3 地震加速度噪声
    4.5 本章小结
第5章 基于WMRA-UKF的结构时变参数识别试验验证
    5.1 引言
    5.2 时变刚度框架模型试验
        5.2.1 模型制作
        5.2.2 测试工况
    5.3 结构刚度识别
        5.3.1 工况一:刚度时不变
        5.3.2 工况二:第三层刚度突变
        5.3.3 工况三:第二层刚度突变
    5.4 本章小结
结论与展望
参考文献
攻读硕士学位期间发表的论文和参加科研情况
致谢
作者简介

(5)基于机器学习的钙钛矿材料性能研究(论文提纲范文)

摘要
abstract
第一章 绪论
    1.1 研究工作的背景与意义
    1.2 钙钛矿材料研究进展
        1.2.1 钙钛矿的晶体结构
        1.2.2 钙钛矿的稳定性研究
        1.2.3 钙钛矿氧空位
    1.3 机器学习在钙钛矿材料中的应用
    1.4 本论文的结构安排
第二章 理论基础与方法
    2.1 数据预处理
        2.1.1 缺失值和空值
        2.1.2 处理重复记录
        2.1.3 特征归一化
    2.2 特征工程
        2.2.1 特征变换
        2.2.2 特征组合
        2.2.3 特征选择
    2.3 算法及原理
        2.3.1 线性回归
        2.3.2 随机森林
        2.3.3 神经网络
        2.3.4 GBR
        2.3.5 AdaBoost
        2.3.6 XGBoost
        2.3.7 CatBoost
第三章 钙钛矿材料结构-组分-性能关系的研究
    3.1 引言
    3.2 数据集
        3.2.1 晶格常数数据集
        3.2.2 稳定性数据集
    3.3 方法
        3.3.1 数据预处理
        3.3.2 暴力特征工程
        3.3.3 回归
        3.3.4 性能评估
    3.4 结果与讨论
        3.4.1 探索结构和组分关系的结果分析
        3.4.2 探索结构、组分和性能关系的结果分析
    3.5 本章小结
第四章 钙钛矿材料的关键性能预测
    4.1 引言
    4.2 数据集与方法
        4.2.1 数据集
        4.2.2 数据预处理与特征选择
        4.2.3 模型的建立
    4.3 结果与讨论
        4.3.1 形成能预测结果分析
        4.3.2 稳定性预测结果分析
        4.3.3 带隙预测结果分析
        4.3.4 氧空位形成能预测结果分析
    4.4 本章小结
第五章 全文总结与展望
    5.1 全文总结
    5.2 后续工作展望
致谢
参考文献
攻读硕士学位期间取得的成果

(6)非线性模型中处理效应的估计及其应用(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究背景
    1.2 研究意义
    1.3 本文的主要工作和结构安排
第二章 回顾处理效应的估计方法
    2.1 随机化试验中处理效应的估计
    2.2 无混杂假设下处理效应的估计
    2.3 估计处理效应出现不可观测的混杂时
第三章 匹配Probit模型中处理效应的估计
    3.1 引言
    3.2 Probit模型和估计
    3.3 模拟研究
    3.4 实际数据分析
    3.5 总结
    附录:证明
第四章 出现不可观测混杂的处理效应估计
    4.1 引言
    4.2 处理效应的估计
        4.2.1 提出的估计量
        4.2.2 处理效应的检验
    4.3 模拟研究
    4.4 实际数据分析
    4.5 总结和讨论
    附录A:定理证明
    附录B:拓展
第五章 拟似然方法估计处理效应
    5.1 引言
    5.2 拟似然估计处理效应
        5.2.1 Copula函数
        5.2.2 参数的估计
    5.3 模拟研究
    5.4 实际数据分析
    5.5 总结
        附录
总结与讨论
参考文献
致谢
在学期间公开发表论文及着作情况

(7)计算机科技论文摘要的机翻错误类型及译后编辑(论文提纲范文)

摘要
Abstract
CHAPTER1 INTRODUCTION
    1.1 Research Background and Significance
    1.2 Aims of the Study
    1.3 Organization of the Thesis
CHAPTER2 LITERATURE REVIEW AND FRAMEWORK
    2.1 Overview on Machine Translation and Post-editing
    2.2 Previous Studies on MT Error Types and Post-Editing Strategies
    2.3 DQF-MQM Error Classification Framework
    2.4 Previous Studies on MT Error Types of Paper Abstracts
    2.5 Text Typology Theory
        2.5.1 Text Typology Theory of Reiss
        2.5.2 Previous Studies on Informative Texts and Translation Principles
CHAPTER3 METHODOLOGY
    3.1 Source Text and Text Analysis
        3.1.1 Source Text
        3.1.2 Text Analysis
    3.2 Research Method
    3.3 Translation Process
        3.3.1 Translating300 computer science abstracts with MT system
        3.3.2 Post-editing the MT-generated translation based on Text Typology Theory
        3.3.3 Conducting a semi-structured interview for ensuring post-editing quality
        3.3.4 Analyzing and summarizing the errors in300 abstracts
        3.3.5 Preliminary error classifications based on DQF-MQM Framework
        3.3.6 Conducting the2nd semi-structured interview to confirm error classifications
        3.3.7 Quantitative analysis of all MT errors in the300 abstracts
CHAPTER4 RESULTS AND DISCUSSION
    4.1 Error Types of Machine Translated English Abstracts
        4.1.1 Unidiomatic Translation Errors in MT output
        4.1.2 Terminology Mistranslation Errors in MT Output
        4.1.3 Mistranslation Errors in MT Output
        4.1.4 Under-translation Errors in MT Output
        4.1.5 Omission Translation Errors in MT Output
        4.1.6 Over-translation Errors in MT Output
        4.1.7 Errors of Addition in MT Output
    4.2 Post-editing Strategies for Machine Translated Abstracts
        4.2.1 Post-editing Strategies for Long and Complex Sentences
        4.2.2 Post-editing Strategies for Passive Voice Sentences
        4.2.3 Post-editing Strategies for Technical Terms
CHAPTER5 CONCLUSION
    5.1 Major Findings
    5.2 Limitations and Suggestions
References
Appendix Source Texts and Target Texts of300 Abstracts
    1-20 Abstracts
    21-40 Abstracts
    41-60 Abstracts
    61-80 Abstracts
    81-100 Abstracts
    101-120 Abstracts
    121-140 Abstracts
    141-160 Abstracts
    161-180 Abstracts
    181-200 Abstracts
    201-220 Abstracts
    221-240 Abstracts
    241-260 Abstracts
    261-280 Abstracts
    281-300 Abstracts
ACKNOWLEDGEMENTS

(8)基于太赫兹技术的变压器绝缘油的检测与分析(论文提纲范文)

致谢
摘要
abstract
变量注释表
1 绪论
    1.1 研究背景及意义
    1.2 研究现状
    1.3 论文结构及内容
2 太赫兹时域光谱技术
    2.1 太赫兹技术原理
    2.2 太赫兹时域光谱技术
    2.3 太赫兹时域光谱系统装置及实验过程
3 太赫兹时域光谱系统噪声的分析及处理
    3.1 太赫兹光谱系统的噪声分析
    3.2 锁相放大器时间常数对噪声的影响
    3.3 基于双边滤波及改进算法的太赫兹光谱噪声处理
    3.4 基于小波变换及改进算法的噪声信号处理
    3.5 本章小结
4 太赫兹时域光谱的光学参数提取
    4.1 太赫兹透射时域光谱的光学参数提取方法
    4.2 太赫兹反射时域光谱的光学参数提取方法
    4.3 太赫兹时域光谱光学参数提取方法的比较
    4.4 变压器绝缘油的太赫兹光学参数的提取
    4.5 本章小结
5 基于太赫兹光谱的典型故障变压器油的定性分析
    5.1 多种类型向量机的算法分析
    5.2 热性故障变压器绝缘油的太赫兹光谱分析
    5.3 电气故障变压器绝缘油的太赫兹光谱分析
    5.4 局部受潮故障变压器绝缘油的太赫兹光谱分析
    5.5 本章小结
6 基于偏最小二乘法的故障变压器油的鉴别
    6.1 偏最小二乘法及优化算法
    6.2 太赫兹时域光谱数据采集及光谱分析
    6.3 基于光谱变量优选算法的变压器故障分类
    6.4 分类算法结果及讨论
    6.5 太赫兹时域分析与现有技术对比分析
    6.6 本章小结
7 结论与展望
    7.1 主要工作及总结
    7.2 创新点
    7.3 研究展望
参考文献
作者简历
学位论文数据集

(9)数据驱动的城市路网行程时间估计与预测方法研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景和意义
        1.1.1 选题背景与依托课题
        1.1.2 研究目的与意义
    1.2 研究内容与技术路线
        1.2.1 研究内容
        1.2.2 研究方法与技术路线
    1.3 主要创新点
    1.4 论文组织结构
    1.5 本章小结
第二章 数据驱动行程时间估计与预测研究综述
    2.1 城市路网行程时间估计与预测概述
        2.1.1 城市路网特性
        2.1.2 行程时间估计与预测的异同
    2.2 数据驱动方法概述
        2.2.1 数据驱动方法的概念
        2.2.2 数据驱动方法的基本原理与特点
        2.2.3 数据驱动方法综述
    2.3 行程时间估计研究综述
        2.3.1 基于点传感器数据的行程时间估计模型
        2.3.2 基于区间传感器数据的行程时间估计模型
        2.3.3 基于数据融合的行程时间估计模型
    2.4 行程时间预测研究综述
        2.4.1 朴素方法
        2.4.2 基于交通流理论的行程时间预测
        2.4.3 基于数据驱动的行程时间预测
        2.4.4 基于混合模型的行程时间预测
    2.5 国内外研究现状总结
    2.6 本章小结
第三章 车载GPS数据与基础处理方法研究
    3.1 简介
    3.2 交通数据采集
        3.2.1 交通数据采集方法
        3.2.2 车辆GPS轨迹数据
    3.3 车辆GPS数据预处理
        3.3.1 车辆GPS数据特点
        3.3.2 车辆GPS数据预处理方法
    3.4 基于GPS数据的行程时间提取方法
        3.4.1 地图匹配
        3.4.2 路径推导
        3.4.3 行程时间分配
    3.5 本章小结
第四章 基于稀疏GPS大数据的城市路网行程时间估计方法研究
    4.1 简介
    4.2 相关理论基础
        4.2.1 张量基础与表示方法
        4.2.2 张量的相关定义与运算
        4.2.3 张量分解与重构
        4.2.4 张量补全
    4.3 模型基本框架与相关定义
        4.3.1 相关定义
        4.3.2 模型基本框架
    4.4 基于稀疏GPS大数据的城市路网行程时间估计方法
        4.4.1 地图映射
        4.4.2 基于张量的行程时间建模
        4.4.3 概率交通状态聚类
        4.4.4 行程时间估计
    4.5 实验结果及分析
        4.5.1 实验数据
        4.5.2 行程时间建模结果与分析
        4.5.3 概率交通状态聚类结果与分析
        4.5.4 行程时间估计结果与分析
    4.6 本章小结
第五章 基于贝叶斯概率张量分解的城市路网行程时间估计方法
    5.1 简介
    5.2 研究问题描述与模型基本框架
        5.2.1 研究问题描述
        5.2.2 模型基本框架
    5.3 基于贝叶斯概率张量分解的城市路网行程时间估计方法
        5.3.1 地图映射
        5.3.2 行程时间张量构建
        5.3.3 行程时间张量合并
        5.3.4 基于张量分解的缺失数据估计
        5.3.5 基于对数正态分布的贝叶斯概率张量分解
    5.4 实验结果及分析
        5.4.1 实验数据
        5.4.2 实验设置
        5.4.3 评估指标
        5.4.4 行程时间估计模型性能
        5.4.5 模型性能对比
        5.4.6 模型敏感性分析
    5.5 本章小结
第六章 基于深度学习的城市路网行程时间预测方法研究
    6.1 简介
    6.2 深度学习理论基础
        6.2.1 深度学习简介
        6.2.2 深度学习训练方法
        6.2.3 典型的深度学习模型
    6.3 基于深度学习的城市路网行程时间预测方法
        6.3.1 特征数据提取
        6.3.2 基于机器学习的行程时间预测建模
        6.3.3 稀疏降噪自动编码器
        6.3.4 行程时间预测深度学习模型
        6.3.5 深度网络训练算法
    6.4 实验结果及分析
        6.4.1 实验数据
        6.4.2 实验设置
        6.4.3 评估指标
        6.4.4 模型结果
        6.4.5 模型性能分析
    6.5 本章小结
第七章 总结与展望
    7.1 工作总结
    7.2 研究展望
致谢
参考文献
作者简介、在读期间发表论文及参与科研情况

(10)保障性住房能够促进区域人口流动吗? ——基于空间计量交互模型分析(论文提纲范文)

摘要
ABSTRACT
第一章 导论
    第一节 选题背景与意义
        一、选题背景
        二、理论及现实意义
    第二节 研究内容、方法和技术路线图
        一、研究内容
        二、研究方法
        三、技术路线图
    第三节 可能的创新点与研究展望
        一、可能的创新点
        二、研究展望
第二章 文献综述
    第一节 人口流动相关研究
        一、人口流动相关理论
        二、人口流动的现状研究
        三、人口流动的影响因素研究
    第二节 保障性住房相关研究
        一、高端劳动力人才保障性住房相关研究
        二、外来中低端劳动力住房保障相关研究
        三、本地中低端劳动力保障性住房相关研究
    第三节 保障性住房对人口流动影响的相关研究
        一、保障性住房对人口流动的间接影响研究
        二、保障性住房对人口流动的直接影响研究
    第四节 空间计量交互模型相关研究
    第五节 文献评述与小结
第三章 保障性住房对人口流动影响理论机制分析
    第一节 保障性住房对人口流动影响的分析框架
    第二节 保障性住房对人口流动的影响机理
        一、保障房通过影响商品房促进人口流动的作用分析
        二、三类保障房促进人口流动的作用分析
    第三节 小结
第四章 空间统计分析、模型、数据和变量说明
    第一节 探索性空间数据分析
    第二节 空间计量交互模型设定和相关数据、变量说明
        一、计量模型的设定
        二、数据和变量的说明
第五章 保障性住房对人口流动影响的实证研究
    第一节 传统引力模型参数估计及其解释
    第二节 空间计量交互模型参数估计及效应估计
        一、保障性住房对人口流动影响的全样本数据分析
        二、保障性住房对人口流动影响的分区域数据分析
    第三节 保障性住房对人口流动影响的稳健性检验
        一、经济适用房对人口流动影响的实证分析
        二、基于空间贝叶斯MCMC估计保障性住房对人口流动影响
    第四节 实证部分小结
第六章 研究结论和政策建议
    第一节 研究结论
    第二节 政策建议
参考文献
附录: 攻读硕士学位期间科研成果
后记 (致谢)

四、回归分析中参数估计的一种新方法(论文参考文献)

  • [1]基于鞅残差的边缘结构模型评估生活方式对慢性心衰患者再住院的影响[D]. 韩嫱. 山西医科大学, 2021(01)
  • [2]队列研究中具有时变和成分性质饮食数据的因果替代效应估计方法[D]. 梁洁. 山西医科大学, 2021(01)
  • [3]基于激光诱导击穿光谱的含油污泥中重金属分析方法研究[D]. 杜瑶. 西安石油大学, 2021(09)
  • [4]部分观测信息下工程结构时变参数识别方法研究[D]. 晋冬丽. 河北工程大学, 2021(08)
  • [5]基于机器学习的钙钛矿材料性能研究[D]. 邓钦. 电子科技大学, 2021(01)
  • [6]非线性模型中处理效应的估计及其应用[D]. 汪军. 东北师范大学, 2020(07)
  • [7]计算机科技论文摘要的机翻错误类型及译后编辑[D]. 付茜雯. 大连理工大学, 2020(06)
  • [8]基于太赫兹技术的变压器绝缘油的检测与分析[D]. 李猛. 中国矿业大学, 2019(04)
  • [9]数据驱动的城市路网行程时间估计与预测方法研究[D]. 唐坤. 东南大学, 2019
  • [10]保障性住房能够促进区域人口流动吗? ——基于空间计量交互模型分析[D]. 王建生. 浙江工商大学, 2017(05)

标签:;  ;  ;  ;  

回归分析中一种新的参数估计方法
下载Doc文档

猜你喜欢