一、多因子交叉相关建立雨季开始期预测模型(论文文献综述)
章馨予[1](2021)在《基于复合风格轮动的多因子投资策略研究》文中研究说明
王怡宁[2](2021)在《基于XGBoost的高频交易选股研究》文中提出
蔺浩宇[3](2021)在《基于SVR改进的线性惩罚回归选股策略设计 ——以沪深300成分股为例》文中提出自Fama和French于1992年提出三因子模型以来,多因子选股模型的研究不断深入。从1964年至今,学界和业界提出了数以千计的股票收益率解释因子,而大量因子的涌现也为股市研究带来一定挑战。合适的因子能更恰当地反映公司的收益表现,评价公司整体的效益,也能较好地预测未来的收益表现,为投资选股提供依据;但因子过多会存在冗余的问题,也会导致模型出现过拟合现象。因此,因子的选择一直是研究的热点、难点,需要长期不断地探索研究。因子选择为选股策略提供必要基础,选股策略直接关系着投资者在资本市场的投资获利情况,好的选股策略不仅能让投资者获利,也能让资金需求者解决融资问题,更能活跃国内的金融市场,发挥金融市场融通资金的功能。尽管选股策略一直受学界与业界的高度重视,有较多相关研究,但随着市场与时代的变化,研究仍需不断深入。量化投资的方法更适合市场的快速变化,能极大减少人工成本,更能高效运用较为复杂的算法,因此这类方法能够更好地构建出选股策略。本文以设计能够产生超额收益的选股策略为目的,采用非线性改进线性惩罚回归选股策略,以期为金融市场投资者、相关研究者提供新的选股策略构建思路。在选股策略中结合惩罚项线性回归变量选择模型和非线性股票打分模型,既保留了惩罚线性方法的稀疏性优势,也增加了非线性模型的拟合优势,不仅可以快速找到大量冗余因子中的有效成分,还可以更为准确地拟合因子变量间的相互关系。根据基本研究思路,本文梳理了投资组合的相关理论及量化策略方法的现状,归纳了合适的绩效评价方法与指标,厘清回归模型相关理论,总结出两种相对适宜的选股模型:LASSO(Least Absolute Shrinkage and Selection Operator)回归选股模型和Elastic Net回归选股模型。综合考虑这两种模型强大的因子选择能力和无法刻画非线性关系的局限性后,拟引入SVR(Support Vector Regression)方法,构建两类新的选股模型。在实证与运用中,本文从若干文献中选出曾被验证有效的48个因子,从Join Quant平台获取2008—2011年沪深300成分股的季度收益率,用基础指标计算得到这48个因子的季频数据。在建模过程中,首先通过LASSO回归和Elastic Net选出的有效因子,然后沿用因子选择模型产生的系数为股票打分,选出得分最高的20支股票。之后引入SVR,构建SVR-LASSO和SVR-Elastic Net模型来估计新的变量关系,代替沿用前模型系数进行股票打分,前后共构建四类股票选择模型。结果显示,在这四种收益率估计模型中,SVR-Elastic Net模型的拟合优度最高,SVR-LASSO次之。总体来看,结合了SVR非线性回归的线性惩罚选股策略的拟合误差项均有效降低。故选择SVR-LASSO和SVR-Elastic Net模型构建完整策略。同种模型对不同时期的数据往往有着不同的最优参数和最优结果,固定因子和固定参数拟合难以持续适应市场变化,本文采取滑动窗口法进行回测,建立了模型的模型,策略根据窗口期的不同数据自动选择该窗口期的有效因子和模型最优参数,以优化回测结构。回测期为2012年至2017年,每期向前取12组上期季度因子数据与当期(相对上期)股票收益率数据拟合SVR-Elastic Net和SVR-LASSO模型,以当前期(预测期)因子数据通过拟合后的模型估计下一期收益情况。对估计结果与实际结果进行比较分析,从而选定选股策略。最终得到的回测结果显示,SVR-LASSO选股模型超额收益达22.67%,SVRElastic Net选股模型超额收益达52.62%,结合了SVR方法的LASSO和Elastic Net均能跑赢大盘,故能说明本文构建的选股策略有效。这也意味着在沪深股市可以通过本文构建的选股策略获得超额收益,该选股策略也能够为投资者、相关理论研究者提供新的可行思路。
李晴文[4](2021)在《基于智能算法组合模型的边坡位移预测研究》文中认为滑坡灾害在全世界范围内造成了不可逆的生命、财产、生态环境损失。如何构建高效的滑坡评估预警预报体系,利用合适的预测预报技术,采取行之有效的预防措施对滑坡进行预测,减少或避免滑坡造成的影响将是我们首要考虑的问题。论文通过对边坡位移等监测数据进行分析,利用灰色模型、支持向量回归模型、小波神经网络、粒子群优化等智能算法,构建科学合理的预测模型。并结合实际的边坡工程,研究边坡变形机制机理,把握边坡变形规律,为滑坡防治工作提供指导。主要研究内容和成果如下:(1)论文简要分析了滑坡监测现状及其存在的一些问题。通过对监测数据进行研究,选择既能直观综合反映边坡变形特征又易于获得的边坡位移监测数据进行分析,探究边坡变形规律。通过分析灰色模型和支持向量回归模型的建模过程,归纳模型优缺点。针对模型中存在的问题,对其进行优化改进,使之满足实际工程需要。论文对灰色模型的背景值和初始条件进行改进优化,以此为基础提出PSO算法优化寻参的3参数的变权缓冲NGM(1,1,k,c);同时考虑不同数据区间对预测结果的影响,建立了基于数据融合的灰色预测模型。在支持向量回归模型的改进中,基于模糊信息粒化的SVR模型、基于PSO优化的PSO-SVR模型和WNN-SVR模型的提出,在不同方面改进了传统SVR模型,高效快速确定出模型的最优参数,适用范围更广,并能同时满足拟合和预测需求。(2)针对边坡变形机理的复杂不确定性和单一模型的局限性,研究并扩展了组合模型在边坡工程上的应用。运用特定的定权方法,构建出精度更高,适用性更强的组合模型,并将其成功应用于边坡工程中。选用更具客观准确性的熵权法对PSO-SVR模型和PSO-NGM模型进行赋权,形成的PSO-SVR-NGM无论在变形趋势上还是拟合预测精度上都优于单一预测模型。SVR-NGM-WNN最优加权组合模型通过最优加权组合法组合PSO-SVR模型、PSO-NGM模型和WNN模型,降低了不良模型的干扰,使模型能够充分吸收各单一模型的优点并有效利用已知信息,取得了更精确的预测结果。(3)最后以灰色模型为基础,同时考虑系统误差和监测粗差的作用,建立半参数稳健估计模型。并且顾及气温、降雨量、库水位等影响因素,构建出基于稳健估计的多因素半参数NGM模型。相较于只考虑单一位移影响因素的预测模型,其精确性和合理性更高,适用范围更广。通过在具体的边坡工程的成功应用,验证了该模型的优越性,并且拓展了模型优化研究的方向。
袁晨光[5](2021)在《基于投票集成学习算法的多因子量化选股方案研究》文中认为集成学习是现在非常流行的机器学习算法。目前,集成学习算法在许多着名的机器学习比赛中取得了很好的成绩。集成学习算法通过组建和联合多个机器学习算法来完成特定学习任务,业内它常被称为多分类器系统或基于委员会的学习,其常比单一学习器具有显着优越性。而且集成学习算法在金融市场的应用领域非常广泛,具体包括预测股票市场走势,预判金融市场风险,构建投资股市方案,处理大量高维抽象的信息等应用领域。投票集成学习算法属于集成学习算法的一种,其在预测股指方面也比单一算法优势明显。但如何利用投票集成学习算法设计选股方案,如何更加有效的应用大量的数据进行多因子量化选股,如何利用单一机器学习算法来构建基于较优基学习器组合的投票集成学习算法,关于这些重要问题的研究文献非常缺乏。本文主要研究设计基于投票集成学习算法的多因子量化选股方案,构建基于较优基学习器组合的投票集成学习算法并以期取得超额收益率。首先本文以沪深300指数成分股为选股范围,选取34个影响股票收益的因子,以股票月涨幅大于HS300指数涨幅标记为“1”,否则标记为“0”。其次用随机森林算法筛选出22个比较重要的特征因子,然后比较分析分别基于六个单一算法的多因子量化选股方案,从中筛选出四个相对优秀的单一算法。再次利用这四个算法分别构建基于11种基学习器组合的硬、软投票集成学习算法,并同时构建了11种基于朴素贝叶斯的Bagging融合算法。最后将这些方案进行比较分析,从而选出最优的多因子量化选股方案。本文研究结论表明,本文构建的基于朴素贝叶斯和支持向量机的基学习器组合的硬投票集成学习算法的多因子量化选股方案是最优的,其选股回测的总体表现比六个单一算法、基于其他基学习器组合的投票集成学习算法以及基于朴素贝叶斯的Bagging融合算法更好,同时远好于沪深300指数,在收益方面,其选股回测13个月累计总收益率高达123.5%,在风险方面,最大回撤为3.43%,在稳定性方面,回测13个月跑赢沪深300指数基准10个月。
廖安东[6](2020)在《基于集成学习算法的A股投资策略研究》文中进行了进一步梳理随着经济的高速增长,中国资本市场不断改革完善,未来A股市场将会变得更加公开、透明,政策市的影响将逐步降低。截至2019年底,沪深两市市值合计60多万亿元,上市公司达3800余家,投资者超过1.5亿人。A股的规模迅速增长,每个交易日都会产生巨量的金融数据,证券市场风云变化莫测,投资者的精力也是有限的,不可能逐个去研究投资标的,但是随着计算机科学技术的迅速发展,量化投资应运而生。量化投资是指以数学、金融学、统计学或机器学习算法为基础,利用计算机程序,设计并实现投资交易策略的过程。证券市场波动频繁,股票价格受多种因素影响,传统的线性模型往往预测效果不佳,随着人工智能的发展,机器学习算法逐渐被运用到量化交易中。集成学习是一种非常经典的机器学习算法,通常与单一算法相比具有更多的优势。本文重点研究了基于集成学习算法的A股投资策略,主要工作包括从聚宽量化交易平台提取相关股票数据,并选取了通常会影响股价的50个变量构建特征因子库,使用Python编程语言,将Random Forest和Ada Boost两种算法分别与特征因子库相结合,从而构建集成学习算法选股模型。利用集成学习算法对股票样本数据进行训练,把样本数据划分成训练数据集和验证数据集,分别利用模型对所选的数据进行样本内训练和交叉验证调整参数,最后利用样本外数据进行测试。通过对沪深300和中证500,以及全部A股等样本的对比测试,优化设置模型参数,并根据最终测试结果对模型进行综合评价,选取预测上涨概率最大的10只个股建立投资策略组合,并对投资组合进行回测,分析投资组合表现。文中对Random Forest和Ada Boost算法理论进行了分析和阐述,并使用准确率、AUC等指标对模型进行了评价。经过分析,采用这两种机器学习算法构建的选股模型适用于A股市场,选取的投资组合在测试区间取得了较好收益,能够跑赢大盘指数,对广大投资者和量化爱好者均具有参考意义。
范舰阳[7](2020)在《上市公司基本面的量化预测—前瞻因子模型》文中提出在股票市场中,不同的投资者们会采用五花八门的投资策略,但近年来价值投资类投资者的队伍愈发壮大,A股市场整体风格上也正在从投机、技术分析向投资、基本面分析转变。量化投资也是一个在中国快速发展的投资方式。量化投资中热门的因子投资主要是以用基本面数据设计的因子为基础。但是,传统量化选股模型往往以预测股价或收益率为目标,同时因子投资策略也只是简单地使用已公布的数据。本文作为产品设计,围绕“预测公司基本面而非股价”的理念,弥补了传统因子投资的不足,提供了一个更优的量化投资产品。本产品的核心是利用大量数据和机器学习算法训练出的、能够预测公司基本面因子的量化模型,称为前瞻因子模型(LFM)。具体地,在选定变量,以及获取和预处理数据之后,本文将数据集分割成了样本内训练集和样本外测试集。然后,本文从若干模型中挑选出了LSTM神经网络作为LFM的结构,并在样本内进行了十折交叉验证,结果表明LSTM能够适应本文的任务;在样本外进行回测时,本文以LFM在样本外的预测结果为基础,得到了每个交易日的交易信号,满仓、等权重地持有25只股票,在2016年10月31日至2019年9月30日期间取得了44.6%的累计收益率和13.76%的年化收益率,远超本策略对标的传统单因子策略;和业绩基准沪深300比较,本策略收益率的波动略大,但也换取了很高的超额收益,因此Sharpe Ratio、Sortino Ratio都较高,明显跑赢了基准。最后本文对策略的回测结果进行了归因分析:从Brinson归因分析的结果来看,由于本策略一直保持满仓,超额收益中主动配置的影响较小,超额收益主要来自标的选择的影响,即本策略是靠选股来战胜市场的;从因子分析来看,FF五因子分析和Barra因子分析都表明本策略偏好配置中小盘的成长股,但不倾向于配置大盘股和价值股。总之,本文设计的产品在样本外的业绩显着优于传统因子投资策略和沪深300指数,并通过对LFM的模型评估和投后的归因分析,找到了本产品的选股风格和收益来源,是值得投资者信赖的量化投资策略。此外,本文为基本面预测模型提供了新的实用价值,并为金融数据分析的模型选择、因子投资的研究思路提供了参考。
伊倩倩[8](2020)在《基于Stacking融合模型的生物医药板块智能选股方案研究》文中研究指明生物医药行业是各个国家重点战略性新兴产业,是朝阳性行业。近年来,全球在研新药年复合增速为8%,美国等发达国家在研药数量占比高。我国自生物医药被纳入“十三五重点发展规划”以来,迎来了广阔的增速空间。日益频繁的投融资活动、药企对创新药的巨大需求、成熟的美股市场、快速发展的香港生物科技板及我国科创板的设立,无不凸显出生物医药行业的投资价值与投资机会。近年来,随着人工智能的逐渐发展,将智能算法融入选股方案的方式因其稳定性高、资金容量大且收益可观而日益被广大投资者接受和使用。因此,本文借助机器学习算法,选取全球生物医药板块356家企业2011至2018年的数据,构建了一种基于Stacking框架的XGBoost-RF-Light GBM融合模型的选股方案。首先,本文基于生物医药行业特点构建指标库,利用特征重要性排名和热力图剔除无效指标,并对缺失值作了处理。实验结果显示,生物医药行业的成长性指标及特征指标在之后的选股方案构建中起到了重要作用,说明该板块注重成长与新药研发的特点。随后,本文在Stacking第一层构建了XGBoost和随机森林模型,第二层构建了LGBM模型,并将三者进行融合,以得到最终选股方案。本文的输出指标是预测为涨的概率,筛选股票的标准是将各期预测概率排名前60的股票进行持仓。最后,对该选股方案进行模型评估、回测检验及模型对比。研究结果表明,本文构建的选股方案平均收益率为17.78%,比行业平均基准收益高出8.99%,夏普比率平均为0.29,最大回撤为25.21%。整体来看,该方案能够获得远超行业基准的超额收益,且其最大回撤也相对合理,故模型有效。此外,本文构建的融合模型较其他模型具有更好的分类能力和更高的稳定性,有利于提高选股精度和选股稳定度,能帮助投资者在该板块获取稳定的超额收益。
雷冠军[9](2020)在《基于数据融合的丰满水库长期径流预报研究》文中认为我国的水资源时空分布不均,气候变化和人类活动的影响导致旱涝灾害频发,成为制约经济发展的主要因素。河川径流在水循环系统中起着主导作用,而且极端径流会形成巨灾,径流预报对于防汛抗旱、水资源规划与管理等具有重要意义和价值。河川径流影响因子众多、变化特性复杂,基于成因分析法挖掘因子影响径流形成的规律是径流预报的关键。中长期径流预报预见期长、预报精度低,径流的形成机制尚不清晰,单一尺度因子的分析、单一统计预报方法的改进已不能进一步提高径流预报的精度,而且水文工作者不敢于报极值,中长期径流预报结果只能作为实际工作的参考。开展中长期径流预报理论和技术研究,融合多尺度因子和多方法的预报结果,进一步提高预报的精度和水平,能够为水库调度、水资源开发利用等工作提供支撑。本文以丰满水库流域的年径流为研究对象,选用天文、全球、流域尺度因子,分析挖掘因子与流域来水的相似性、遥相关性、可公度性、结构特性等规律,研究和改进智能学习法、模糊推理法、天文因子对比法、点聚图法、可公度法和可公度网络结构法等技术方法,建立了包含因子融合、结果融合、结构融合的多尺度因子信息融合的中长期径流预报模型。研究成果能够有效提高丰满水库流域径流和极端径流预报的精度,为丰满水库调度提供技术支持。具体研究成果如下:(1)运用统计分析法,挖掘三大尺度因子与流域来水丰枯特性的响应规律。结果表明,丰满水库流域来水的丰枯状态与ENSO事件的冷暖特性、ENSO事件的发生时间距离汛期的远近、基于农谚所选择的气象因子等具有较好的统计规律,且均能通过假设检验。基于线性相关系数法、互信息理论法、关联度分析法研究天文因子、气象因子、天文因子+海洋大气因子+气象因子与流域来水的相关性,结果表明,气象因子的相关性最强,海洋大气因子的相关性最弱,月球赤纬角与流域来水的关联度最大。(2)基于相关性分析所得的因子组合方案,运用神经网络、支持向量机、决策树、随机森林等智能学习方法,融合因子预报径流。结果表明,水量回归预报较差,3级分类预报较优;预报方法不同,方法所对应的最优因子及其组合不同,训练和预报性能均较优且稳健性强的方法为ELM、RBF神经网络。对多方法的最优分类预报结果进行融合,使得定性预报正确率达到89.5%。(3)运用相位对比法融合天文因子、海洋大气因子及其组合预报径流。结果表明,该方法的定量预报正确率为63.16%,24节气阴历日期+太阳黑子相对数的定性预报最优,正确率为63.16%。相位对比法对于极端来水年的丰枯属性识别能力较强,却难以有效预报出平水年,运用定量预报结果反推来水级别的正确率较低。相位对比法存在无法判别的年份,运用模糊推理法基于相关性分析所得的因子组合进一步分析计算因子的相似性,融合因子预报径流。引入TOPSIS模糊综合评判法、相似衍生法相似度、“因子进出法”等,对模糊推理法进行改进。结果表明,相似衍生法模糊推理法的稳健性优于Turksen模糊推理法,二者对径流的定量预报较差、定性预报较优,对其各自最优的定性预报结果进行融合,正确率达到73.68%。(4)采用“主次因子对比法”对单一天文因子对比法、分布式融合结构天文因子对比法进行改进,融合结果预报径流。研究得到能够提高预报精度的混合式融合结构天文因子对比法,定性预报正确率为63.16%。基于分析所得的海洋大气因子、气象因子与流域来水的遥相关规律修正预报结果,进一步改进天文因子对比法,使得预报正确率提高到 73.68%。(5)绘制三大尺度因子与流域来水的点聚图,融合结果预报径流。结果表明,24节气阴历日期和月球赤纬角点聚图具有较好的稳健性,太阳黑子相对数离散性较强难以准确划分其聚类区间,三大尺度因子点聚图的定性预报正确率分别为63.16%、57.89%、21.05%。将海洋大气因子、气象因子与来水丰枯的遥相关规律作为该类因子的点聚图进而得到径流预报结果,并与天文因子点聚图的预报结果进行融合,使得预报正确率提高到 73.68%。(6)将径流分为一般、极端、极值点结构,融合结构预报极端径流。结果表明,以因子融合、结果融合的预报结果作为一般来水结构能够融合多因子、多方法的信息,预报正确率为84.21%;点面结合法的改进与上下包线结构、智能学习分类以及传统点面结合法相比对于极端来水结构的预报精度较高,预报正确率为60%;通过细致划分丰枯水链、引入月球赤纬角对可公度网络结构法进行改进,能够增强方法的可操作性,降低基于极值点结构预报极端来水年高发期的不确定性;综合径流三大结构的预报结果,结合连续极端来水年的判定,预报极端来水的高发年,其中特丰水年、特枯水年的预报正确率分别为66.7%、80%。
韩雨薇[10](2020)在《基于深度学习的多因子股票风险预测方法研究》文中研究表明近年来,深度学习方法在金融领域的广泛应用极大推动了股票相关预测技术的发展。股票风险作为衡量股票投资价值的重要因素,其有效预测能够帮助投资者完善投资风险评估,稳定收益。为了进一步提高预测模型对股票风险的敏感性与预测准确性,本文将量化选股策略中的多因子模型思想引入其中,并加入了多种能反映股票风险特征的新因子,同时针对目前研究及应用中存在的问题进行了改进。本文主要内容及贡献如下:(1)针对传统预测模型在特征选择上过分依赖已有结构化数据指标的问题,本文构建出了一套以券商研究报告为主要特征来源的多因子库。其中券商研究报告作为券商机构针对个股发布的专业性分析报告,能够对投资者行为、股票市场带来一系列波动和影响。其内容中包含的个股投资推荐等级、盈利预测等非结构化数据都可作为股票风险预测的重要因素。同时,本文还设计实现了一套单因子测试框架,从领域知识出发,完成了对特征因子的测试与筛选。(2)针对一般长短期记忆网络(Long Short-Term Memory,LSTM)模型处理多因子输入与长短期历史信息结合的问题,本文在单层LSTM预测模型中,一方面通过改变其输入层、隐藏层、输出层的映射关系,使其适应多因子输入形式;另一方面借助双向LSTM的内部结构充分考虑了历史与未来数据的影响。为了充分利用LSTM中的长期上下文信息,本文还进一步提出了层次化LSTM预测模型。此外,本文通过构建CNN与LSTM结合的混合预测模型,对输入数据中的多维度特征信息进行了有效提取,同时采用Attention机制提升了该模型的可扩展性与预测准确性,实验结果表明该模型预测结果的各项指标都得到了显着提升。目前本文针对研报中非结构化数据挖掘得到的相关因子已在智语投研平台[46]正式上线;同时通过预测模型得到的风险结果也可进一步用于相关量化策略研究。
二、多因子交叉相关建立雨季开始期预测模型(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、多因子交叉相关建立雨季开始期预测模型(论文提纲范文)
(3)基于SVR改进的线性惩罚回归选股策略设计 ——以沪深300成分股为例(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究方法与思路 |
1.2.1 研究方法 |
1.2.2 研究思路 |
1.3 论文结构 |
第2章 文献综述 |
2.1 投资组合理论基础 |
2.1.1 CAPM资本资产定价理论 |
2.1.2 APT统计套利模型 |
2.1.3 Fama-French三因子选股模型 |
2.2 量化策略方法研究现状 |
2.2.1 量化策略国内外研究现状 |
2.2.2 支持向量回归(SVR)的研究现状 |
2.3 本章小结 |
第3章 评价指标与研究方法说明 |
3.1 绩效评价方法理论与综合评述 |
3.1.1 特雷诺指数 |
3.1.2 夏普指数 |
3.1.3 詹森指数 |
3.1.4 绩效评价指标综合分析 |
3.2 回归模型理论介绍与综合分析 |
3.2.1 LASSO回归 |
3.2.2 Ridge回归 |
3.2.3 Elastic Net回归 |
3.2.4 SVR回归 |
3.3 本章小结 |
第4章 数据准备与模型设计 |
4.1 数据准备 |
4.1.1 因子选择 |
4.1.2 数据获取 |
4.1.3 数据预处理 |
4.1.4 因子有效性检验 |
4.2 模型设计 |
4.2.1 LASSO回归选股模型 |
4.2.2 Elastic Net回归选股模型 |
4.2.3 基于正则化线性回归变量选择的SVR选股模型 |
4.2.4 模型评价设计 |
4.3 本章小结 |
第5章 实证分析与应用 |
5.1 模型选择 |
5.1.1 LASSO回归选股实证分析 |
5.1.2 Elastic Net回归选股实证分析 |
5.1.3 基于线性正则回归变量选择的SVR选股实证 |
5.1.4 模型综合评述 |
5.2 回测检验 |
5.2.1 重要参数设置说明 |
5.2.2 回测设置 |
5.3 回测结果 |
5.3.1 SVR-LASSO模型回测结果 |
5.3.2 SVR-Elastic Net模型回测结果 |
5.4 本章小结 |
第6章 结论与展望 |
6.1 研究结论 |
6.2 研究不足与展望 |
参考文献 |
致谢 |
(4)基于智能算法组合模型的边坡位移预测研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究意义 |
1.2 国内外研究现状 |
1.2.1 理论与模拟研究现状 |
1.2.2 边坡变形预测预报研究现状 |
1.3 研究内容和技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
2 滑坡位移监测及预测模型 |
2.1 滑坡位移监测技术 |
2.2 灰色预测模型 |
2.2.1 灰色GM(1,1)模型 |
2.2.2 灰色Verhulst模型 |
2.2.3 NGM(1,1,k,c)模型 |
2.2.4 灰色模型的精度检验 |
2.3 支持向量机模型 |
2.3.1 支持向量回归机 |
2.3.2 SVR模型的精度检验 |
2.4 本章小结 |
3 预测模型优化改进 |
3.1 改进灰色模型 |
3.1.1 原始数据处理 |
3.1.2 背景值优化和初始条件优化 |
3.1.3 PSO-NGM位移预测模型 |
3.1.4 基于数据融合的灰色预测模型 |
3.2 支持向量机优化 |
3.2.1 基于模糊信息粒化的SVR模型 |
3.2.2 PSO-SVR位移预测模型 |
3.2.3 WNN-SVR预测模型 |
3.3 本章小结 |
4 优化模型的加权组合预测模型 |
4.1 基于熵权法的PSO-SVR-NGM组合模型 |
4.2 SVR-NGM-WNN最优加权组合模型 |
4.3 本章小结 |
5 基于稳健估计的半参数NGM模型 |
5.1 半参数模型 |
5.1.1 正则化矩阵R的选取 |
5.1.2 平滑因子α的确定 |
5.2 稳健估计 |
5.3 基于稳健估计的多因素半参数NGM模型 |
5.4 本章小结 |
6 结论和展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
(5)基于投票集成学习算法的多因子量化选股方案研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 研究内容、方法和技术路线 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 技术路线图 |
1.4 本文主要特点 |
第2章 相关理论回顾与文献综述 |
2.1 相关理论 |
2.1.1 单一算法 |
2.1.2 融合算法 |
2.2 相关文献综述 |
2.2.1 股票收益因子选择研究 |
2.2.2 机器学习算法选股模型研究 |
2.3 文献述评 |
第3章 构建多因子量化选股方案的问题描述与分析 |
3.1 问题描述 |
3.2 问题分析 |
第4章 基于投票集成学习算法的多因子量化选股方案策划 |
4.1 建立多因子量化选股方案思路 |
4.2 因子池选取 |
4.3 数据预处理 |
4.3.1 异常值处理 |
4.3.2 缺失值处理 |
4.3.3 数据规范化 |
4.3.4 连续属性离散化 |
4.4 特征选择 |
4.5 单一分类模型选择 |
4.6 多因子量化选股方案评估 |
4.7 选股模型构建 |
4.7.1 单一模型回测 |
4.7.2 投票集成学习算法构建 |
4.7.3 Bagging融合算法构建 |
第5章 方案的合理性论证以及实施途径 |
5.1 多因子量化选股方案的合理性论证 |
5.1.1 硬投票集成学习算法回测比较 |
5.1.2 软投票集成学习算法回测比较 |
5.1.3 Bagging融合算法回测比较 |
5.1.4 小结 |
5.2 多因子量化选股方案的风险提示 |
5.3 多因子量化选股方案的实施途径 |
第6章 结论 |
参考文献 |
附录 |
致谢 |
(6)基于集成学习算法的A股投资策略研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 国内研究现状 |
1.2.2 国外研究现状 |
1.3 研究目标及内容 |
1.3.1 本文研究目标 |
1.3.2 本文研究内容 |
第二章 量化投资概述 |
2.1 量化交易简介 |
2.1.1 量化选股和择时 |
2.1.2 算法交易和统计套利 |
2.2 量化交易发展状况 |
2.2.1 主要发展历程 |
2.2.2 常见经典策略 |
2.3 量化交易优势与缺点 |
2.3.1 量化主要优势 |
2.3.2 量化主要缺点 |
第三章 集成学习理论和研究方法 |
3.1 机器学习介绍 |
3.1.1 数据挖掘简介 |
3.1.2 机器学习算法 |
3.2 决策树分类算法 |
3.2.1 ID3算法介绍 |
3.2.2 C4.5算法介绍 |
3.2.3 CART算法介绍 |
3.2.4 决策树的剪枝 |
3.3 集成学习算法理论 |
3.3.1 集成学习简介 |
3.3.2 并行集成法Random Forest |
3.3.3 串行集成法Ada Boost |
3.4 研究流程及技术工具 |
3.4.1 聚宽平台简介 |
3.4.2 编程语言Python |
3.4.3 本文研究流程 |
第四章 数据处理与特征因子库 |
4.1 样本数据获取 |
4.1.1 建立股票池 |
4.1.2 确定回测区间 |
4.2 特征和标签提取 |
4.3 特征因子预处理 |
4.3.1 中位数去极值 |
4.3.2 缺失值的处理 |
4.3.3 行业市值中性化 |
4.3.4 特征因子标准化 |
4.4 训练集和交叉验证集合成 |
4.4.1 沪深300内选股 |
4.4.2 中证500内选股 |
4.4.3 全A股市场选股 |
4.5 降维与特征因子选择 |
4.5.1 主要降维方法 |
4.5.2 重要特征选择 |
4.5.3 特征比例选择 |
第五章 构建并执行集成学习模型 |
5.1 算法模型的实现 |
5.1.1 实现Random Forest模型 |
5.1.2 实现Ada Boost模型 |
5.2 模型样本内训练 |
5.2.1 Random Forest训练 |
5.2.2 Ada Boost训练 |
5.3 模型主要评价指标 |
5.3.1 模型评价的意义 |
5.3.2 模型的性能评价 |
5.4 交叉验证调整参数 |
5.4.1 Random Forest调参 |
5.4.2 Ada Boost调参 |
5.5 进行样本外测试 |
5.5.1 Random Forest测试 |
5.5.2 Ada Boost测试 |
5.5.3 Ada Boost与 Random Forest对比 |
5.5.4 因子相关性分析 |
第六章 模型选取的投资组合分析 |
6.1 投资组合简介 |
6.2 投资组合分析 |
6.2.1 组合选股情况 |
6.2.2 组合收益情况 |
6.2.3 组合风险情况 |
6.3 模型稳健性检验 |
第七章 研究总结与展望 |
7.1 本文总结 |
7.2 本文展望 |
致谢 |
参考文献 |
附录 |
附录1 :投资组合5-8选股情况 |
附录2 :投资组合5-8回测情况 |
附录3 :投资组合回测全部代码 |
(7)上市公司基本面的量化预测—前瞻因子模型(论文提纲范文)
致谢 |
摘要 |
abstract |
1 绪论 |
1.1 研究背景和研究意义 |
1.2 文献综述和国内外研究现状 |
1.2.1 股价与基本面因子的关系 |
1.2.2 利用基本面信息对未来基本面进行预测 |
1.3 创新点 |
1.4 研究方法 |
1.5 论文结构 |
2 基础理论 |
2.1 量化投资基础理论 |
2.1.1 均值方差模型 |
2.1.2 资本资产定价模型(CAPM) |
2.1.3 套利定价理论(APT) |
2.1.4 Fama-French三因子模型 |
2.2 机器学习基础理论 |
2.2.1 神经网络 |
2.2.2 过拟合问题 |
2.2.3 主成分分析法(PCA) |
3 量化预测变量的选取与处理 |
3.1 自变量的选取和处理 |
3.2 因变量的选取和处理 |
3.3 小结 |
4 前瞻因子模型(LFM)的选择与搭建 |
4.1 模型结构的选择 |
4.2 模型的交叉验证和搭建 |
4.3 模型评估 |
4.4 小结 |
5 投资回测和归因分析 |
5.1 股票筛选 |
5.2 投资回测 |
5.3 归因分析 |
5.3.1 业绩分析 |
5.3.2 Brinson归因分析 |
5.3.3 因子分析 |
5.4 小结 |
6 研究总结与展望 |
6.1 策略总结 |
6.2 研究结论 |
6.3 展望 |
参考文献 |
(8)基于Stacking融合模型的生物医药板块智能选股方案研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景 |
1.2 研究目的和意义 |
1.3 研究内容、方法和技术路线 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.3.3 技术路线 |
1.4 本文的主要贡献 |
第2章 相关理论回顾与文献综述 |
2.1 相关理论回顾 |
2.1.1 有效市场理论 |
2.1.2 Fama-French三因子理论 |
2.1.3 套利定价理论 |
2.2 相关文献综述 |
2.2.1 多因子选股模型文献综述 |
2.2.2 智能算法文献综述 |
2.2.3 评述 |
第3章 问题描述与分析 |
3.1 研究问题描述 |
3.2 研究问题分析 |
第4章 基于智能算法选股方案构建的理论框架 |
4.1 指标构建理论 |
4.2 模型选取理论 |
4.2.1 Stacking算法理论 |
4.2.2 XGBoost算法理论 |
4.2.3 随机森林算法理论 |
4.2.4 LightGBM算法理论 |
4.3 模型评价理论 |
第5章 基于Stacking模型的生物医药板块智能选股方案构建 |
5.1 指标库构建 |
5.2 股票池确定 |
5.3 数据预处理 |
5.4 特征筛选 |
5.5 基于Stacking框架的生物医药板块智能选股方案设计 |
5.5.1 方案设计实施 |
5.5.2 模型构建及参数调优 |
5.5.3 模型评估 |
第6章 基于Stacking框架的选股方案合理性检验及实施途径 |
6.1 回测检验 |
6.2 多模型比较 |
6.2.1 选股方案模型分类能力比较 |
6.2.2 选股方案模型盈利能力比较 |
6.3 本章小结 |
第7章 结论及展望 |
7.1 结论 |
7.2 展望 |
参考文献 |
附录 |
致谢 |
(9)基于数据融合的丰满水库长期径流预报研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景和目标 |
1.1.1 研究背景 |
1.1.2 研究目标 |
1.2 国内外研究进展 |
1.2.1 三大尺度因子径流预报研究 |
1.2.2 因子相关性分析 |
1.2.3 传统统计预报模型 |
1.2.4 现代水文预报模型 |
1.2.5 研究进展的总结 |
1.3 本文研究介绍 |
1.3.1 研究问题 |
1.3.2 研究方法 |
1.3.3 研究内容 |
1.3.4 技术路线图 |
第二章 径流预报技术的系统分析 |
2.1 来水丰枯的影响机理 |
2.1.1 热量与引力作用 |
2.1.2 地形和海陆分布作用 |
2.2 来水预报基于的基本特性 |
2.2.1 周期性 |
2.2.2 有序性 |
2.2.3 遥相关性 |
2.2.4 结构特性 |
2.3 来水与极端来水预报的思路 |
2.3.1 预报因子基于空间尺度的分类 |
2.3.2 预报因子基于时间尺度的分类 |
2.3.3 预报值基于预报特征的分类 |
2.3.4 基于信息融合的流域来水预报 |
2.4 研究流域分析 |
2.4.1 流域介绍 |
2.4.2 流域丰枯机理 |
2.5 小结 |
第三章 三大尺度因子与径流的统计分析 |
3.1 天文尺度因子相位与流域来水规律分析 |
3.1.1 太阳黑子相对数 |
3.1.2 月球赤纬角 |
3.1.3 24节气阴历日期 |
3.2 全球尺度因子相位与流域来水规律分析 |
3.2.1 ENSO事件的发生与结束时间与流域来水丰枯的关系 |
3.2.2 ENSO事件特征值与流域来水丰枯的关系 |
3.3 流域尺度因子相位与流域来水规律分析 |
3.3.1 谚语机理分析 |
3.3.2 气象因子与来水属性级别统计分析 |
3.4 因子数值与流域来水统计分析方法 |
3.4.1 基础数据处理 |
3.4.2 相关性分析的方法 |
3.5 因子相关性分析结果 |
3.5.1 天文因子相关性分析 |
3.5.2 气象因子相关性分析 |
3.5.3 天文因子+海洋大气因子+气象因子相关性分析 |
3.6 结果分析 |
3.6.1 因子相位与流域来水规律 |
3.6.2 因子数值与流域来水相关性 |
3.7 小结 |
第四章 基于智能学习的预报因子融合的径流预报 |
4.1 预报方法 |
4.1.1 神经网络 |
4.1.2 决策树和随机森林 |
4.1.3 支持向量机 |
4.2 数据处理的方法 |
4.2.1 预报因子的处理 |
4.2.2 预报值的处理 |
4.2.3 预报值的评判指标 |
4.2.4 模型和因子优选的TOPSIS-模糊综合评判法 |
4.3 建模预报 |
4.4 结果统计分析 |
4.4.1 流域水量回归预报结果分析 |
4.4.2 流域来水量7级分类预报结果分析 |
4.4.3 流域来水量3级分类预报结果分析 |
4.4.4 33个因子方案分析 |
4.4.5 预报结果的最优方案 |
4.4.6 最优方案的预报结果分析 |
4.5 小结 |
第五章 基于相似性分析的预报因子融合的径流预报 |
5.1 相位对比法 |
5.1.1 基本原理 |
5.1.2 预报结果分析 |
5.2 相似模糊推理法 |
5.2.1 模糊推理法的基本原理 |
5.2.2 相似度的计算方法 |
5.2.3 主成分分析法计算权重 |
5.2.4 TOPSIS-模糊综合评判法优选最优模型 |
5.2.5 预报模型的建立 |
5.3 模糊推理法预报 |
5.3.1 因子组合分析 |
5.3.2 误差评定与优选判别 |
5.4 模糊推理法因子二次筛选 |
5.4.1 因子进出法寻优 |
5.4.2 因子进出法实例分析 |
5.5 模糊推理法预报结果 |
5.6 结果分析 |
5.7 小结 |
第六章 基于天文因子对比法的预报结果融合的径流预报 |
6.1 天文因子对比法机理分析 |
6.2 预报方法1-单一天文因子对比法 |
6.2.1 24节气阴历日期对比法 |
6.2.2 太阳黑子相对数对比法 |
6.2.3 月球赤纬角对比法 |
6.3 预报方法2-天文因子对比法预报结果的融合 |
6.3.1 天文因子预报结果的线性融合 |
6.3.2 天文因子融合法-主次因子对比法 |
6.3.3 天文因子融合法的修正 |
6.3.4 天文因子融合法定量预报 |
6.4 小结 |
第七章 基于点聚图法的预报结果融合的径流预报 |
7.1 点聚图法 |
7.1.1 点聚图的制作 |
7.1.2 预报方案 |
7.2 24节气阴历日期点聚图预报 |
7.2.1 极端来水年24节气阴历日期的聚类特性 |
7.2.2 24节气阴历日期聚类预报方法 |
7.2.3 24节气阴历日期聚类分析建模 |
7.2.4 基于聚类分析的来水预报 |
7.3 月球赤纬角和太阳黑子相对数点聚图预报 |
7.3.1 月球赤纬角聚类预报方法 |
7.3.2 太阳黑子相对数聚类预报方法 |
7.4 海洋大气因子与流域气象因子点聚图预报 |
7.5 多尺度因子点聚图预报结果融合 |
7.6 小结 |
第八章 基于来水结构融合的极端径流预报 |
8.1 基本定义 |
8.2 预报方法 |
8.2.1 一般来水结构预报-多方法预报结果融合 |
8.2.2 极端来水结构预报 |
8.2.3 基于改进可公度网络结构的极值点结构预报 |
8.2.4 极端来水年预报 |
8.3 实例应用 |
8.3.1 一般来水结构分析 |
8.3.2 极端来水结构分析 |
8.3.3 极值点结构的确定及极端来水年预报分析 |
8.3.4 连续极端来水年预报分析 |
8.4 讨论 |
8.5 小结 |
第九章 结论与展望 |
9.1 结论 |
9.2 展望 |
9.3 创新性 |
附表 |
参考文献 |
科研及发表论文情况 |
致谢 |
(10)基于深度学习的多因子股票风险预测方法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题背景与意义 |
1.2 国内外相关研究 |
1.2.1 基于统计学的研究方法 |
1.2.2 基于数据挖掘的研究方法 |
1.2.3 非结构化数据分析 |
1.3 本文研究思路 |
1.4 本文组织结构 |
1.5 本章小结 |
第2章 相关技术综述 |
2.1 股票风险概述 |
2.1.1 主动投资原理 |
2.1.2 股票风险分类与量化 |
2.2 券商研究报告与多因子模型 |
2.3 金融时序模型 |
2.4 深度学习方法 |
2.4.1 多层感知器 |
2.4.2 卷积神经网络 |
2.4.3 循环神经网络 |
2.4.4 长短期记忆神经网络 |
2.4.5 注意力机制 |
2.5 本章小结 |
第3章 特征因子提取与测试 |
3.1 总述 |
3.2 基于券商研究报告的特征因子提取 |
3.3 投资评级系列特征因子 |
3.3.1 一致预期评级因子 |
3.3.2 评级变动因子 |
3.3.3 评级调整因子 |
3.4 盈利预测系列特征因子 |
3.4.1 一致预期盈利预测因子 |
3.4.2 盈利预测变动因子 |
3.5 特征因子检测 |
3.5.1 因子分布与正态转换 |
3.5.2 因子覆盖率检测 |
3.5.3 因子自相关性检验 |
3.5.4 因子RankIC序列检验 |
3.5.5 因子Alpha分位测试 |
3.5.6 因子时间衰减测试 |
3.6 其他特征因子举例 |
3.6.1 PEG |
3.6.2 目标价 |
3.7 特征因子库建立 |
3.8 本章小结 |
第4章 基于深度学习的多因子股票风险预测模型 |
4.1 总述 |
4.2 传统时间序列的股票风险预测 |
4.2.1 指数平滑预测法 |
4.2.2 ARIMA预测法 |
4.3 基于LSTM的多因子股票风险预测模型 |
4.3.1 问题描述 |
4.3.2 模型概述 |
4.3.3 输入层 |
4.3.4 编码层 |
4.3.5 特征提取层 |
4.3.6 分类预测层 |
4.3.7 模型训练 |
4.4 基于层次化LSTM的股票风险预测模型 |
4.4.1 模型概述 |
4.4.2 输入层 |
4.4.3 底层编码层 |
4.4.4 高层编码层 |
4.4.5 分类预测层 |
4.4.6 模型训练 |
4.5 基于CNN与 LSTM的混合预测模型 |
4.5.1 模型概述 |
4.5.2 输入层 |
4.5.3 编码层 |
4.5.4 Attention层 |
4.5.5 特征抽取层 |
4.5.6 分类预测层 |
4.5.7 模型训练 |
4.6 本章小结 |
第5章 模型验证结果与分析 |
5.1 数据集构建 |
5.1.1 研报数据处理 |
5.1.2 股票池数据的选择 |
5.1.3 因子数据的预处理 |
5.1.4 股票风险的自动化标注 |
5.1.5 多因子输入的时间对齐设置 |
5.2 实验结果对比与分析 |
5.2.1 实验评估方法 |
5.2.2 训练参数 |
5.2.3 对比实验设计 |
5.2.4 实验结果 |
5.3 投资结果展示与案例分析 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 本文工作总结 |
6.2 不足与展望 |
参考文献 |
攻读硕士学位期间主要的研究成果 |
致谢 |
四、多因子交叉相关建立雨季开始期预测模型(论文参考文献)
- [1]基于复合风格轮动的多因子投资策略研究[D]. 章馨予. 东华大学, 2021
- [2]基于XGBoost的高频交易选股研究[D]. 王怡宁. 东华大学, 2021
- [3]基于SVR改进的线性惩罚回归选股策略设计 ——以沪深300成分股为例[D]. 蔺浩宇. 江西财经大学, 2021(11)
- [4]基于智能算法组合模型的边坡位移预测研究[D]. 李晴文. 大连理工大学, 2021
- [5]基于投票集成学习算法的多因子量化选股方案研究[D]. 袁晨光. 上海师范大学, 2021(07)
- [6]基于集成学习算法的A股投资策略研究[D]. 廖安东. 电子科技大学, 2020(04)
- [7]上市公司基本面的量化预测—前瞻因子模型[D]. 范舰阳. 浙江大学, 2020(02)
- [8]基于Stacking融合模型的生物医药板块智能选股方案研究[D]. 伊倩倩. 上海师范大学, 2020(07)
- [9]基于数据融合的丰满水库长期径流预报研究[D]. 雷冠军. 中国水利水电科学研究院, 2020(04)
- [10]基于深度学习的多因子股票风险预测方法研究[D]. 韩雨薇. 浙江大学, 2020(08)