一、基于递归神经网络的证券组合投资(英文)(论文文献综述)
路季超[1](2021)在《基于深度学习的股票预测模型与交易策略研究》文中研究表明量化交易以先进的数学模型代替人的主观判断,可以有效避免在极端情况下做出非理性的投资决策,其在股票、期货和外汇领域有着广泛的学术研究和应用价值,目前已成为投资领域的研究热点。近年来随着深度学习的快速崛起,投资界越来越重视人工智能在量化交易领域的应用。本文提出了基于深度学习的股票预测模型,并在预测结果基础上建立交易策略以获取超额收益,本文主要研究内容如下:1)考虑到新闻与市场情绪同为影响股票价格走势的重要因素,制作社交热度与情绪指标因子加入现有因子库,同时利用boruta方法选择出与因变量相关的所有特征因子。实验结果表明,引入另类因子能进一步提高因子库质量,同时使用boruta特征选择法能够有效提升特征选择质量,提高最终的预测精度。2)针对金融时间序列预测问题,本文提出了基于不同尺度信息提取并融合的预测模型。首先,考虑到股票预测的特殊性,对传统Inception结构进行改进,以提取不同尺度的信息并融合,从而得到更好的表征。在该结构中,以单向一维卷积代替传统卷积方式,单向性保证只能获取前向信息,符合股市中无法知晓未来交易信息的实际情况;同时,由于不需要从序列间的整体排布提取信息,主要关注同一序列不同周期下的变化规律,采用一维卷积核代替传统二维卷积核;此外,通过在结构中引入残差连接,不仅可以避免网络过深造成模型训练困难,且有助于将原始信息和提取信息相融合。其次,在改进Inception结构的基础上,结合LSTM与注意力机制构建完整网络结构,以进一步提高整体模型性能。最终,通过完备的实验证实模型的有效性。3)基于预测结果建立“动态资金配置策略”,本策略根据预测涨跌幅,按比例动态进行资金和股票仓位配置,综合考虑投资收益与风险,相较传统二元涨跌预测,该策略通过资金配置进一步提高超额收益率。此外,使用专业的回测框架进行回测,该框架可以模拟真实交易中手续费、委托订单等情况,为策略评估提供更全面、可靠的分析手段,通过与同期大盘和基准策略进行比较,验证策略的有效性。最终,本文形成了一套“数据集构建及预处理-深度学习模型构造-模型训练与预测-策略制定与回测”的完整研究框架。
姚贵斌[2](2021)在《基于深度学习的实体识别与关系抽取的研究与应用》文中认为随着信息时代的到来,在人机交互中产生了大量的文本,音频,图像等非结构或半结构等形式存储的数据。其中文本数据居多,为了有效的提取文本中有价值的信息供人们使用,实体识别和关系抽取技术是自然语言处理领域的两项基本任务,旨在帮助人们挖掘出文本中具有实体意义的名称及其之间存在的关系,这对构建领域知识图谱,智能问答系统等具有重要的意义及价值。传统的关系抽取任务将实体识别和关系抽取分成两个独立的子任务,没有考虑两个任务之间的依赖传递性和两次对输入数据编码的信息冗余性,影响了抽取的效率和准确度。针对流水线式的抽取策略存在的不足,本文主要研究如何将两个任务进行联合抽取,主要的创新点和工作如下:(1)考虑到语言模型的建立对挖掘句子内部语义信息有着直接的影响,本文采用XLNet语言模型对输入数据建模词向量,但没有直接用训练好的字向量表示或词向量表示,而是用双向LSTM对输入的字向量提取特征,当用预测矩阵检测到前向LSTM和后向LSTM提取出的特征是同一个词的概率最大时,通过矩阵运算融合为词向量特征。这种向量表示策略既保留了中文以词成句的特点,也加深了词语中每个字的特征表示。(2)模型共分为了三个模块,分别为共享模块,实体识别模块和关系抽取模块。共享层实现了对两个任务输入文本表示的共同编码,实体识别结果和共享层的输出一起作为关系抽取模块的输入,关系抽取和实体识别可通过损失函数,利用反向传播算法一起更新共享层的参数,实现了真正的联合抽取。在1998人民日报一月份,COAE2016任务三和自构建经济金融领域小数据集作了实验对比与分析,验证了本文所提模型在实体关系抽取任务上的有效性。(3)根据研究理论成果,基于Python语言和前端框架相关知识设计了主要针对经济金融领域的实体关系抽取系统。系统可以直接提取出文本中的实体关系三元组,为构建领域数据集提供了技术支持。
顾倩茹[3](2021)在《融入投资者情绪的上证指数涨跌预测方案研究 ——基于SRNN算法》文中指出当今社会,不管是从资金供给者、筹集者的角度来看,对股票的需求都日益增加。因此实现股票价格的预测对实现理财目标、稳定经济发展都十分重要。目前的经济下,股市中还存在着很多非理性因素,投资者对大盘的看法往往对股价走势产生影响。在这样的背景下,如何把投资者的情绪量化,并加入到股票行业的研究中,实现更为精准的股价涨跌预测,就具有非常重要的学术意义和现实意义。本文的最终目标是利用上证指数的一些技术指标数据以及股评实现股价涨跌预测。这一过程中最关键的一步就是把投资者情绪量化。网络上的各种评论都是文字类的,我们想转换成数值,首先要弄清这些评论文本所表达的情绪类别。因此,本文最主要的目的就是验证切片循环神经网络(SRNN)模型对股评文本的情绪分类效果,并用其对股评文本进行分类。首先,本文爬取东方财富网股吧上证指数吧中股民对上证指数走势的评论文本,先对这些文本数据进行预处理,然后选取一定比例人工对其进行标注,分为看涨、看跌和中性三个类别。然后利用SRNN模型和RNN模型对数据进行学习和分类。结果表明,从分类准确率上来看,SRNN模型的分类准确率为77.1%,RNN模型的分类准确率为76.12%,因此,SRNN略胜一筹。另外,从分类的时间上来看,当字符长度都为256时,SRNN模型最快用时57秒,而RNN模型需要258秒,因此,SRNN模型有绝对的速度优势,而且随着字符长度的增加,这种优势会越来越显着。其次,本文为了预测上证指数的涨跌,选取了很多的输入指标,主要包括两部分。第一部分是2015年8月到2020年8月间相关技术指标,并用主成分分析对其中的数值型指标进行了降维。第二部分是情绪指标。这里我们用训练好的SRNN模型和RNN模型对经预处理后的全部股评文本进行分类,并借鉴前人构建的情绪指标公式来分别计算每天的情绪指标数值。然后把情绪指标与技术指标相结合,利用Cat Boost模型对其进行分析和建模,结果表明,使用SRNN分类方法分类股评文本后构建的情绪指标对上证指数的涨跌有更好的预测效果,总体预测准确率为76.52%,比RNN的提高了0.99%,从而本文证明了选用SRNN模型来对股评文本进行分类的合理性及优势。最后,本文还考虑了不加入情绪指标,仅仅使用技术指标来对上证指数的涨跌进行预测。结果表明,不加入情绪指标时,Cat Boost模型的预测准确率为73.56%,相比加入SRNN分类结果下的情绪指标时要低2.96%。因此,本文证明了考虑投资者情绪对上证指数走势的影响,把情绪指标纳入预测中是十分有必要的。
娄磊[4](2021)在《基于小波变换的LSTM混合模型研究及对股票价格预测》文中研究说明股票价格指数的走势不仅与个人投资者以及上市公司的利益有关,更与国家经济政策调控密切相关.从始至终,准确预测股票价格指数已经成为投资决策中日益重要的问题.市场发展的初期研究人员寄希望于建立传统时间序列、神经网络和支持向量回归模型准确预测股票价格指数趋势,在一定程度上这些模型预测结果可以大致反应其大体走势,但是预测结果误差比较大精准度有待提高,所以近年来很多专家学者探索混合模型对股票价格指数预测,并取得了不错效果.我国股票市场是政策市场,不仅具有涨跌幅的限制,还受到国家相关经济政策影响,预测起来难度比较大,很多适用于国外市场的模型可能并不能准确预测我国市场,同时,股票价格的高波动不确定性以及数据成份复杂还有一系列噪声的干扰都给准确预测股票价格指数带来了困难,针对数据成份复杂这一问题,采用小波变换、ARIMA模型以及非线性数据预测模型(包括LSTM、SVR)的混合模型解决.通过小波变换使用db3小波函数作为小波变换基函数对原始数据分解,再使用二插值法进行重构,得到了一组消除了短期波动影响保留了长期趋势的低频趋势序列、三组在股票价格指数的均值线上下荡表现出短周期非线性特点的高频波动序列,发挥了小波变换“数学显微镜”的特点;建立ARIMA模型预测低频序列,建立LSTM、SVR模型预测高频序列;最后选择各频率预测效果最好的模型构建混合预测模型.在实证部分,将上证指数、深证指数、名臣健康收盘价格作为训练集,分解得到低频序列和高频序列.先建立ARIMA模型对低频序列预测;再建立LSTM、SVR模型对高频序列预测;最后将混合模型M-ARIMA-LSTM-SVR与其他模型预测结果对比.得M-ARIMA-LSTM-SVR模型的误差最小、稳定性最好.
梁鑫[5](2021)在《面向金融事件检测的层级多标签文本分类》文中提出上市公司在股票交易市场中的股价很容易受到各种事件的影响,投资者进行事件检测可以帮助人们及时识别伴随这些事件的投资风险和机会。金融事件体系往往呈现为层级结构,在实际应用中可以用树形结构来表示这些事件,因此本文将金融事件检测问题建模为一个层级多标签文本分类问题,其中每个事件就是一条从根结点到目标节点的序列标签。常规的层级多标签文本分类方法通常会忽略事件层级间存在的依赖关系,将每个事件都视为独立的个体,施以相同的惩罚系数。针对这个问题,本文从数据集构建、算法设计和实验对比三个方面构建解决方案,总体来说本文的核心贡献如下:·本文针对具有大量事件类别标签的金融应用场景,提出了一种神经层级多标签文本分类算法,即F-HMTC。F-HMTC基于Transformer的编码单元来学习文本的潜在特征,使用一层前馈神经网络作为分类器。为了有效引入层级依赖信息辅助文本分类,本文设计了基于层级多标签文本距离和迭代正则机制的目标函数引导模型优化。·本文提出了一种有效区分层级分类结果的工业评估指标,即HMDScore,并利用该指标对模型表现进行衡量。许多研究基于拍平分类的评价指标比如准确性/错误率和精确率/召回率来衡量层级分类模型,但这些指标实际上并不能将不同类型的错误进行区分,因为不同的错误所代表的意义也不一样。因此本文基于层级多标签距离提出了适合我们实际应用场景的HMDScore。大量实验表明,该指标可以有效衡量层级分类模型的表现。·本文从实际应用场景出发构建了一个准确完整的数据集,并基于该数据集开展了大量对比实验来验证本文提出的结论。为了开发出贴近实际应用场景的检测算法,本工作从头构建了模型训练的数据集。数据集构建包括数据收集和文本标注两个部分,对于前者,本工作基于爬虫技术获取了丰富的文本语料,在标注部分我们结合模型迭代中发现的问题设计了科学有效的预推荐和标注策略。最后,本文基于层级抽样的策略组织业务专家对测试集进行复核,确保数据集可以准确反应真实的业务场景和模型的泛化能力。
冯文芳[6](2020)在《金融杠杆与资产价格泡沫:影响机制及其监控研究》文中进行了进一步梳理资产价格泡沫和高杠杆在历史上反复出现,但次贷危机后的资产价格泡沫形成机制和高杠杆作用机理更加复杂;现代金融技术发展产生的影子银行和金融衍生品等不但空转套利推高金融杠杆,而且让问题复杂化;内嵌于银行体系的表外业务严重期限错配以及中国经济转型期结构中存在的各种扭曲现象,使得金融杠杆过度膨胀导致的资产价格泡沫演化过程中出现的新问题和新情况,原有传统理论都无法较好解释经济中的资产价格泡沫现象。目前,中国正处于经济转型和结构升级的重要关口,党的十九大明确提出“我国经济已由高速增长阶段转向高质量发展阶段”,经济增长速度从高速增长开始转为中高速增长,但是金融杠杆仍在不断攀升,金融杠杆增长与经济发展错配现象严重,资本市场的过度繁荣引致资金在金融体系内空转,导致资产价格泡沫和系统性金融风险不断膨胀和累积。金融危机后上述问题成为经济学研究的热点并引起社会各界的广泛关注。在此背景下,首先,通过阅读和归纳国内外关于金融杠杆、资产价格泡沫和经济增长等方面的经典着作和前沿文献,厘清选题的发展脉络、研究现状、存在问题、争论焦点和研究盲点等,为后期研究顺利展开提供文献支撑和理论基础。其次,准确定义资产价格泡沫是研究的逻辑起点,遵循目前国内外经济学界的三种主流观点,对资产价格泡沫的涵义进行明确界定并分析了其一般特征;从理论角度和影响因素角度剖析了资产价格泡沫的形成机理;运用ADF、SADF、GSADF和RADF等资产价格泡沫识别方法,对资产价格泡沫的存在性、存在周期、出现频率和程度大小等进行了识别和检验,实证结果表明在样本研究期内显着存在周期性资产价格泡沫;并且运用协整模型和向量误差修正模型(VECM)提取了资产价格泡沫。第三,以金融杠杆经济本质研究作为切入点,从微观和宏观角度分别定义和度量了金融杠杆,揭示微观金融杠杆与宏观金融杠杆背离的原因和实质;采用债务收入比法和即时拆分法(TD)测算了我国的金融杠杆;重点揭示和研究了金融加杠杆的根源、实质、动力、渠道、特点和成因等;不但构建了金融杠杆驱动的资产价格泡沫模型,从理论上厘清两者之间的内在逻辑关系,而且把滚动宽窗Granger因果检验模型和Bootstrap统计检验结合,从实证上验证了金融杠杆和资产价格泡沫相互动态影响机制的程度、频率与方向以及与经济事件之间的关系。第四,高杠杆和资产价格泡沫仅是表象,隐藏其背后的实质是虚拟经济与实体经济的失衡,因此加入经济增长因素,从表象分析上升到实质研究,进一步揭示金融杠杆、资产价格泡沫与金融、经济之间的影响效应。具体内容包括:(1)运用差分广义矩估计(DGMM)和门限效应,对国内16家上市银行从两个阶段检验了货币政策传导的银行风险承担渠道的杠杆机制的有效性,实证结果表明:货币政策可以通过杠杆率对银行风险承担产生显着影响;货币政策与银行风险承担之间存在双重杠杆率门限效应;(2)运用傅里叶变换和频谱分析法研究了资产价格泡沫与经济增长之间的周期联动效应,实证结果表明:我国资产价格泡沫和经济增长的周期联动关系较复杂,并且两者在周期联动上更多的存在背离现象;(3)基于R&D模型,加入金融杠杆因素,研究了不存在和引入资产价格泡沫时经济增长的均衡结果,并推断出资产价格泡沫与经济增长共容的条件。(4)运用MCMC算法和SV-TVP-SVAR模型从时期与时点两个角度对金融杠杆、资产价格泡沫与经济增长三者之间的时变关系进行验证,实证结果表明:三个经济变量之间具有非常显着的时变特征。最后,高杠杆下去杠杆是必然选择,准确定义去杠杆的涵义并对目前去杠杆存在的误区做了澄清;分别探索了实体去杠杆和金融去杠杆的路径;运用合成控制法(SCM)检验了限贷政策能否抑制房地产泡沫?实证结果表明:在4个研究样本中,限贷政策对3个样本的商品房销售价格无法起到降低的作用;囿于传统资产价格泡沫监控研究方法与模型的缺陷,尝试运用人工智能中的支持向量回归(SVR)模型和BP神经网络(BPNN)技术构建了资产价格泡沫监控系统,结果表明,人工智能技术可以很好逼近与诠释样本历史数据所蕴含的内在规律,有效实现监控功能。根据上述主要研究结论,提出了四点政策建议:(1)拓展宏观货币政策调控目标范围,把资产价格纳入中央银行决策信息集,构建货币和信贷流动以及资产价格泡沫监控系统;(2)减少或消除刚性兑付和不必要的政府隐性担保,实现国有资产管理体制和商业银行行为市场化,政府职能回归公共管理本质;(3)坚持中性稳健的货币政策,保持适度的货币流动性,建立宏观审慎评估体系MPA和对金融体系资产实施穿透管理,对影子银行进行有效管理;(4)精准掌控“结构性去杠杆”的节奏、力度、时间、主体,有条不紊降低杠杆率。
于玉洁[7](2020)在《基于特征选择的股票指数多分类集成模型》文中研究表明本文首先介绍了股票指数在金融市场上的重要性,着重强调了机器学习应用于金融数据分析的科学性和有效性。在国内和国外的各种研究中,机器学习方法都展示出了不同于传统方法的优异结果。其次,由于沪深300指数在金融市场上的重要地位,本文选择沪深300指数作为对象,运用理论推导和实证分析相结合的方法以及定量实验和定性分析相结合的方法开展了研究。现今,关于股票指数多分类的问题仍然具有挑战性,良好的分类的结果往往可以为投资者的决策提供参考。本文针对这一类问题进行研究,计算不同时间间隔的股票指数收益率和相应的分位数来确定样本的标签,构造三分类数据集。然后,为了从不同的角度筛选特征,采用了三种特征选择方法,分别为信息熵增益、Relief F算法、主成分分析法获取特征重要性排序。本文提出了基于特征选择的股票指数多分类集成模型,并通过编写Python代码来进行实证分析。在模型建立的过程中,利用卷积层和循环层构建网络结构,再结合支持向量机组成模型,通过OWA算子对三种特征选择方法与模型分别结合得到的输出值进行集成,计算最终预测结果。最后,通过在不同时间间隔数据集上进行拟合实验,在多种评价指标上,包括准确率、F1-score、AUC值,体现出了更好的分类效果。本文提出的基于特征选择的股票指数多分类集成模型中,采用三种特征选择方法降低维度提高运算速度,同时保留关键信息。卷积层和循环层保证了连续的时间序列信息被充分学习,然后结合支持向量机增强了模型的非线性表达能力,体现了其只利用部分支持向量的分类原则的高效性。根据三种特征选择方法分别与模型结合的分类结果,OWA算子可对模型输出值进行集成,实现模型优化、提高分类准确率的结果。
童川[8](2020)在《新闻极性驱动的中概股预测研究》文中指出股票市场的预测一直是数据研究热点,但是受到很多因素的影响,其预测难度较高。新闻是影响股价的重要因素,投资者也经常依赖新闻进行股票交易与决策,因此对新闻的剖析可以为投资者提供有效信息。新闻作为非结构性数据运用到股票预测中困难重重,而随着机器学习技术和自然语言分析技术的发展,使得该问题的解决成为了可能。目前国内外资本市场政策上的显着差异性导致越来越多的国内企业在国外上市,而关于中文新闻对中概股预测影响的研究却很少。行为金融学理论发现投资者的投资行为和交易决策容易受到新闻等文本的影响,因此对新闻文本进行极性分析有利于帮助投资者实时判断新闻表达的内容是积极还是消极的,并在极短的时间内做出相应的决策,快速抓住收益的机会并合理规避亏损的风险。股票价格趋势预测属于计算机科学与金融学的交叉学科,在机器学习预测能力日渐提升的情况下,本文通过借鉴两种领域不同的算法思想,使用财经新闻对股票价格趋势进行预测,主要工作如下:(1)在支持向量机的算法理论基础之上,实现自定义全自动机器打标签模型,增加关键短语权重,提出一种新的循环评估支持向量机模型,使用随机种子将语料集合随机分配生成不同的训练集合和验证集合,加入循环评估机制进行训练,在达到设定的预测精确率后退出循环得到最终训练结果,并使用样本外集合进行测试证明其合理性和有效性,从而改善在中概股方面新闻极性驱动对股票价格影响与预测的研究。同时,与卷积神经网络模型以及朴素贝叶斯模型进行预测性能、预测趋势、模拟交易等三方面的对比实验,论证了本文提出的循环评估支持向量机模型具有较为优秀的预测效果,能够帮助投资者识别新闻的极性并获得更高的投资收益。(2)利用卷积神经网络和长短期记忆网络能够提取文本特征的网络特性,同时考虑到卷积神经网络在特征提取方面的优越性以及长短期记忆网络在处理时序信息时的天然优势。而空洞卷积可以通过设置扩张率来扩大卷积操作过程中的感受野,从而避免常规卷积的池化操作导致信息丢失的现象,由此提出一种LSTM-Di CNN模型,分别与CNN、LSTM、CNN-LSTM、LSTM-CNN、Di CNN和Di CNN-LSTM六种模型进行对比试验。七种模型的输入层均后接词嵌入层,输入数据均为统一语料集合的财经新闻文本数据。词嵌入层使用Glo Ve处理生成词向量,通过间接引入外部训练数据防止过拟合,并且减少训练的参数个数来提高训练效率。使用自定义全自动机器打标签操作,运用交叉验证的思想将语料集合随机分配,七种模型就预测性能、模拟交易收益率、模拟交易多空收益率等三方面进行比较,验证了准确率最高、相应收益率最高的模型为LSTM-Di CNN模型。综上所述,本文就新闻极性对股票价格波动趋势的影响进行研究,通过机器学习和深度学习的算法进行基本面和技术面的融合分析。将所提算法应用到实际的交易策略中,且均取得了良好的实验效果。
张璐瑶[9](2020)在《信息熵在机器学习算法中的运用 ——以股价预测为例》文中研究指明随着现代科技的高速发展,人们已经步入了一个大数据时代,机器学习则成为了处理现实中纷繁复杂信息的核心技术手段。但现有机器学习算法依然存在诸多不足之处,而信息熵在机器学习中还有许多待研究的部分。面对股市中庞大的信息量,学者们也加大了将机器学习应用于金融市场的研究力度。以股价涨跌预测为背景,系统性地研究信息熵在机器学习算法中的运用,对机器学习算法的发展、国家金融和科技的发展都有着非常重要的意义。曾有学者针对实际问题提出了基于信息熵的强化学习算法、不确定性数据处理方法等,但信息熵在机器学习算法中的运用仍有很大的研究空间。本文选取了决策树算法、SVM(Support Vector Machine,支持向量机)算法、BP神经网络(Back Propagation Neural Network)、隐马尔科夫算法四种具有代表性的机器学习算法为研究对象,探索了现有研究中信息熵可应用于机器学习的方式,如:用于构建决策树的信息熵、可以用作BP神经网络中损失函数的交叉熵、可以与隐马尔科夫算法结合的最大熵原理等。基于前人的研究,本课题还创新性地结合了信息熵和SVM算法,提出了一种新型组合算法——“信息熵-SVM新型组合算法”,并介绍了这种新型算法的核心思想和操作步骤。为便于测试、对比基于信息熵改进前后的模型的性能,课题设计了股价涨跌预测实验。实验选取了浦发银行、上海机场和中信证券三支股票为标的股票,从股票每天的日交易数据中选取了四个指标作为模型的输入特征,目标是通过机器学习算法预测下一个交易日股价的涨跌情况,从而得到各模型的预测性能,最后对各模型性能进行对比分析。本文使用七种机器学习算法对三支股票进行股价涨跌预测,以预测结果与股票实际涨跌吻合度、F1值、建模所需时间、模型可解释性等为评价指标,通过模型间横向、纵向对比分析,得出了以下结论:(1)信息熵可以增强机器学习算法在实际建模中的可解释性;(2)信息熵可以作为机器学习算法建模时分析和处理数据集的工具,从而有效精简原始数据集,剔除冗余信息,提高模型的预测性能;(3)在特定应用场景中,将交叉熵引入机器学习算法中作为损失函数更为合适;(4)在机器学习算法中运用最大熵原理,可以为算法提供处理规则的方法,提高算法预测的准确度。本论文的研究为后人探索使用信息熵改进机器学习算法提供了参考,也为股市的投资者提供了一些研究股票价格规律的新算法。
王涛[10](2020)在《股票新闻情感倾向性分析模型的构建与应用研究》文中认为文本情感倾向性分析是自然语言处理领域的热点问题之一,主要目标是对文本的情感倾向性进行分类,将文本根据不同的情感倾向分为“正面”、“中性”和“负面”,也称为文本情感分类。本文选择股票新闻文本作为研究对象,使用深度学习模型对股票新闻文本的情感倾向性分析进行研究,挖掘其中包含的情感倾向,本文主要研究内容和工作如下:首先,研究了股票新闻文本和股票新闻文本倾向性,并分析了它的特点。其次,研究了篇章级股票新闻文本情感分类任务,针对传统模型的不足,引入了情感词编码、句位置编码和Bi-DLSTM,构建了基于Bi-DLSTM和多层注意力机制的篇章级股票新闻文本情感分类模型,详细介绍了模型的各个模块,并进行实验验证了模型的有效性。第三,研究了对象级股票新闻文本情感分类任务,引入了情感词编码和BiDLSTM,构建了基于多层注意力机制的对象级股票新闻文本情感分类模型,详细介绍了模型的各个模块,并进行实验验证了模型的有效性。最后,研究了股票新闻文本情感分类在股票量化上的应用,研究了情感分类结果数据的有效性,构建了新闻情感因子,并对因子进行了有效性分析,接着构建了单因子选股策略并进行了历史回测,验证了因子具有一定的选股能力。本文针对股票新闻文本语料集,使用本文构建的两个文本情感分类模型,在不同的实验验证目标下进行了大量定性和定量的实验。通过实验比较,基于Bi-DLSTM和多层注意力机制的篇章级股票新闻文本情感分类模型的实验正确率达到了82.94%,基于多层注意力机制的对象级股票新闻文本情感分类模型的实验正确率达到了81.15%。实验结果验证了本文构建的两个模型分别在篇章级股票新闻文本情感分类任务和对象级股票新闻文本情感分类任务上的合理性和有效性。本文最后使用新闻情感因子构建的单因子选股策略,使用2018年8月31日至2019年8月31日一年时间的历史数据进行回测,年化收益达到23.89%,大幅跑赢中证500指数和沪深300指数,验证了因子的有效性和较好的选股能力,同时说明了本文的研究具有一定的实用意义。
二、基于递归神经网络的证券组合投资(英文)(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于递归神经网络的证券组合投资(英文)(论文提纲范文)
(1)基于深度学习的股票预测模型与交易策略研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究目的及意义 |
1.2 国内外研究现状 |
1.3 主要研究内容 |
1.4 论文组织结构 |
第二章 投资预测基础方法 |
2.1 传统金融模型 |
2.2 传统算法模型 |
2.2.1 随机森林 |
2.2.2 支持向量机 |
2.3 深度学习在量化领域的探索 |
2.3.1 卷积神经网络 |
2.3.2 循环神经网络 |
2.3.3 混合模型 |
2.4 本章小结 |
第三章 量化因子数据集构建 |
3.1 量化因子概述 |
3.2 量化因子库制作 |
3.2.1 个股选择 |
3.2.2 基本量化因子库 |
3.2.3 另类量化因子制作 |
3.3 数据预处理 |
3.4 数据降维 |
3.4.1 主成分分析 |
3.4.2 因子分析 |
3.4.3 boruta特征选择方法 |
3.5 实验及分析 |
3.5.1 评价指标 |
3.5.2 实验评估 |
3.6 本章小结 |
第四章 基于深度神经网络的股票价格预测模型研究 |
4.1 针对时序任务的Inception结构 |
4.1.1 Inception结构概述 |
4.1.2 针对股票预测的Inception结构优化 |
4.1.3 残差连接 |
4.2 长期金融时序学习 |
4.2.1 长短期记忆网络结构剖析 |
4.2.2 反向传播算法 |
4.3 注意力机制 |
4.4 网络整体结构 |
4.4.1 结构概述 |
4.4.2 模型可视化 |
4.5 相关实验 |
4.5.1 实验方法 |
4.5.2 实验结果及分析 |
4.6 本章小结 |
第五章 基于预测的交易策略研究 |
5.1 量化投资基础理论 |
5.1.1 有效市场假说理论 |
5.1.2 市场的可预测性 |
5.1.3 交易策略发展 |
5.2 整体研究框架 |
5.3 交易策略研究 |
5.4 回测与评估 |
5.4.1 评价指标 |
5.4.2 实验评估 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 研究展望 |
参考文献 |
攻读硕士学位期间取得的科研成果 |
致谢 |
(2)基于深度学习的实体识别与关系抽取的研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 实体识别的研究现状 |
1.2.2 关系抽取的研究现状 |
1.2.3 国内外研究现状分析 |
1.3 本文研究内容及结构安排 |
第2章 基于深度学习的实体识别和关系抽取技术理论研究 |
2.1 语言模型的相关理论 |
2.1.1 语言模型的发展 |
2.1.2 本文采取的语言模型创新依据 |
2.2 神经网络对于特征抽取的作用 |
2.2.1 神经网络 |
2.2.2 神经网络对模型的优化过程 |
2.2.3 常见的几种神经网络 |
2.3 条件随机场(CRF) |
2.4 本章小结 |
第3章 基于深度学习的实体识别和关系抽取模型 |
3.1 实体识别模型建立 |
3.1.1 模型数学建模 |
3.1.2 XLNet语言模型 |
3.1.3 特征抽取过程 |
3.2 关系抽取模型建立 |
3.2.1 模型数学建模 |
3.2.2 特征抽取过程 |
3.3 联合抽取模型建立 |
3.4 实验与分析 |
3.4.1 实体识别实验 |
3.4.2 关系抽取实验 |
3.4.3 联合抽取实验 |
3.5 本章小结 |
第4章 基于联合抽取模型的领域应用 |
4.1 实体关系抽取技术在知识图谱中的应用 |
4.2 经济领域实体关系抽取系统实现 |
4.2.1 系统设计 |
4.2.2 系统评估 |
4.2.3 系统功能扩展可行性研究 |
4.3 本章小结 |
第5章 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
5.2.1 当前存在的问题 |
5.2.2 今后的研究内容 |
参考文献 |
攻读学位期间取得的研究成果 |
致谢 |
(3)融入投资者情绪的上证指数涨跌预测方案研究 ——基于SRNN算法(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究的背景 |
1.2 研究的目的和意义 |
1.2.1 研究的目的 |
1.2.2 研究的意义 |
1.3 研究的内容、方法和技术路线 |
1.3.1 研究的内容 |
1.3.2 研究的方法 |
1.3.3 研究的技术路线图 |
1.4 本文的主要特点 |
第2章 相关理论回顾与文献综述 |
2.1 相关理论回顾 |
2.1.1 循环神经网络 |
2.1.2 切片循环神经网络 |
2.1.3 CatBoost分类 |
2.2 相关文献综述 |
2.2.1 投资者情绪相关文献综述 |
2.2.2 基于深度学习的文本分类方法文献综述 |
2.2.3 机器学习算法进行预测文献综述 |
2.2.4 文献述评 |
第3章 问题描述与分析 |
3.1 上证指数预测问题描述 |
3.2 上证指数预测问题分析 |
第4章 基于切片循环神经网络的文本分类方案策划 |
4.1 数据选取及预处理 |
4.1.1 技术指标选取 |
4.1.2 技术指标数据预处理 |
4.1.3 输入及输出指标描述性统计 |
4.1.4 主成分分析降维 |
4.1.5 股评文本爬取及预处理 |
4.1.6 打标签及语料库数据选取 |
4.1.7 中文文本分词 |
4.2 基于GloVe模型的词向量训练 |
4.3 基于SRNN和 RNN的股评文本分类 |
4.4 RNN及 SRNN分类结果比较 |
4.5 RNN与 SRNN分类结果下情绪指标的构建 |
第5章 SRNN文本分类方案合理性检验 |
5.1 SRNN文本分类合理性检验 |
5.1.1 基于RNN和 SRNN分类结果的CatBoost模型的训练及预测 |
5.1.2 RNN与 SRNN分类结果下构建的情绪指标预测准确率比较及评价 |
5.2 不加情绪指标与加入情绪指标情况下预测准确率比较 |
5.2.1 不加情绪指标时Cat Boost的预测效果 |
5.2.2 不加情绪指标与加入情绪指标情况下预测准确率比较 |
第6章 结论 |
6.1 基本结论 |
6.2 优点与不足 |
6.2.1 优点 |
6.2.2 不足及展望 |
参考文献 |
附录 |
致谢 |
(4)基于小波变换的LSTM混合模型研究及对股票价格预测(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 选题背景及研究目的及意义 |
1.1.1 选题背景 |
1.1.2 研究目的 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 主要研究内容及章节安排 |
第2章 股票价格指数预测模型 |
2.1 市场可预测性原理与预测难题 |
2.1.1 市场可预测原理 |
2.1.2 股票价格指数预测难题 |
2.2 传统预测模型 |
2.2.1 ARIMA |
2.2.2 LSTM |
2.2.3 支持向量回归模型 |
2.3 基于小波变换理论及预测方法 |
2.3.1 小波变换理论 |
2.3.2 基于小波变换的预测方法 |
第3章 基于小波变换的LSTM混合预测模型 |
3.1 M-ARIMA-LSTM-SVR模型 |
3.2 M-ARIMA-LSTM-SVR参数设置 |
3.2.1 小波变换基函数及分解层数选择 |
3.2.2 ARIMA参数 |
3.2.3 神经网络和SVR结构设置 |
3.3 仿真 |
3.3.1 建立M-ARIMA-LSTM-SVR模型预测 |
3.3.2 建立ARIMA、LSTM、SVR预测 |
3.3.3 仿真结果对比 |
第4章 实证预测与结果分析 |
4.1 数据选取 |
4.2 小波分解与重构 |
4.2.1 Mallat分解 |
4.2.2 Mallat重构 |
4.2.3 Mallat重构后的股票价格指数与原始数据的对比 |
4.3 建立ARIMA对低频趋势序列预测 |
4.3.1 平稳性检验 |
4.3.2 ARIMA模型定阶 |
4.3.3 模型检验 |
4.3.4 ARIMA模型的预测 |
4.4 高频波动序列的预测 |
4.4.1 建立LSTM模型对高频波动序列预测 |
4.4.2 建立SVR模型对高频波动序列的预测 |
4.5 组合模型对上证指数的预测 |
4.6 各模型预测结果比较分析 |
4.7 对其他指数预测 |
第5章 结论与展望 |
5.1 实证分析结论 |
5.2 展望 |
参考文献 |
攻读硕士学位期间取得的成果 |
致谢 |
(5)面向金融事件检测的层级多标签文本分类(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 本文工作与贡献 |
1.3 本文架构 |
第二章 层级多标签文本分类技术概述 |
2.1 文本表征算法 |
2.1.1 基于词袋模型的文本表征算法 |
2.1.2 基于词嵌入的文本表征算法 |
2.2 基于机器学习的文本分类算法 |
2.2.1 基于规则信息构建的分类算法 |
2.2.2 基于多标签学习的分类算法 |
2.2.3 基于层级信息构建的分类算法 |
2.3 基于深度学习的文本分类算法 |
2.3.1 基于前馈神经网络的分类算法 |
2.3.2 基于循环神经网络的分类算法 |
2.3.3 基于卷积神经网络的分类算法 |
2.3.4 基于注意力机制的分类算法 |
第三章 数据获取与数据处理 |
3.1 数据获取 |
3.1.1 数据爬虫的基本设计 |
3.1.2 爬虫调度和过滤策略 |
3.2 数据标注 |
3.2.1 数据标注规则设计 |
3.2.2 数据标注流程设计 |
3.2.3 基于KNN的标签预推荐算法 |
3.3 数据预处理 |
3.3.1 中文分词 |
3.3.2 去停词与文本清洗 |
3.3.3 数据标准化 |
第四章 基于层级信息依赖的F-HMTC算法 |
4.1 特征工程构建 |
4.1.1 基于词袋模型的特征向量 |
4.1.2 基于深度学习的词嵌入特征向量 |
4.1.3 基于注意力机制的文本特征向量 |
4.2 F-HMTC算法的主体模型设计 |
4.2.1 文本编码模块设计 |
4.2.2 基于层级依赖的标签距离度量机制 |
4.2.3 迭代正则机制 |
第五章 实验对比与结果分析 |
5.1 实验结果的评价指标 |
5.1.1 衡量拍平策略的基本指标 |
5.1.2 传统层级分类任务的衡量体系 |
5.1.3 基于层级多标签距离的衡量体系 |
5.2 实验结果的总结分析 |
5.2.1 拍平分类的实验结果分析 |
5.2.2 层级分类的实验结果分析 |
5.2.3 惩罚系数的比较分析 |
第六章 总结与展望 |
6.1 本文工作总结 |
6.2 未来发展展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表论文、参与科研和获得荣誉情况 |
(6)金融杠杆与资产价格泡沫:影响机制及其监控研究(论文提纲范文)
摘要 |
Abstract |
主要缩略词、符号变量的注释表 |
第一章 绪论 |
1.1 研究背景与研究意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究思路、内容与方法 |
1.2.1 研究思路 |
1.2.2 研究内容 |
1.2.3 研究方法 |
1.3 论文创新与不足之处 |
1.3.1 论文创新 |
1.3.2 不足之处 |
第二章 文献综述 |
2.1 资产价格泡沫的含义及其形成机理研究综述 |
2.1.1 理性预期理论 |
2.1.2 行为金融理论 |
2.1.3 以分形和混沌理论为代表的非线性理论 |
2.1.4 信贷理论 |
2.1.5 金融发展理论 |
2.2 资产价格泡沫的存在性检验及测度研究综述 |
2.2.1 资产价格泡沫的存在性检验 |
2.2.2 资产价格泡沫存在性的检验方法 |
2.2.3 资产价格泡沫的测度方法 |
2.3 金融杠杆与资产价格泡沫的影响关系研究综述 |
2.3.1 金融杠杆与资产价格泡沫的影响关系 |
2.3.2 金融杠杆与房地产泡沫的影响关系 |
2.4 资产价格泡沫对经济增长的影响研究综述 |
2.4.1 资产价格泡沫对经济增长的促进作用 |
2.4.2 资产价格泡沫对经济增长的不利作用 |
2.4.3 资产价格泡沫与经济增长的周期联动效应 |
2.5 资产价格泡沫监控研究综述 |
2.5.1 主张从市场层面入手监控资产价格泡沫 |
2.5.2 从货币政策角度监控资产价格泡沫 |
2.5.3 利用托宾税监控资产价格泡沫 |
2.6 对现有文献的评述 |
2.7 本章小结 |
第三章 资产价格泡沫形成机理及其检验研究 |
3.1 资产价格泡沫的理论界定 |
3.1.1 资产 |
3.1.2 资产价格泡沫的载体类型 |
3.1.3 资产价格泡沫涵义界定 |
3.2 资产价格泡沫的形成机理分析 |
3.2.1 资产价格泡沫形成的理论基础 |
3.2.2 资产价格泡沫形成的影响因素 |
3.3 资产价格泡沫的检验 |
3.3.1 检验方法 |
3.3.2 变量说明及数据来源 |
3.3.3 检验结果及其分析 |
3.4 资产价格泡沫的提取 |
3.4.1 向量误差修正模型 |
3.4.2 资产价格泡沫提取 |
3.5 本章小结 |
第四章 金融杠杆与资产价格泡沫的影响机制研究 |
4.1 金融杠杆的经济本质及度量 |
4.1.1 金融杠杆的经济本质 |
4.1.2 金融杠杆的度量 |
4.2 金融加杠杆的机理分析 |
4.2.1 金融加杠杆的根源 |
4.2.2 金融加杠杆的实质 |
4.2.3 金融加杠杆的内在驱动力 |
4.2.4 金融加杠杆的实现路径 |
4.2.5 金融加杠杆的特征与成因 |
4.3 基于金融杠杆驱动的资产价格泡沫模型构建 |
4.3.1 理论分析 |
4.3.2 基于金融杠杆驱动的资产价格泡沫模型 |
4.4 金融杠杆与资产价格泡沫影响关系的实证分析 |
4.4.1 滚动宽窗Granger因果检验方法 |
4.4.2 变量说明与数据检验 |
4.4.3 实证结果及其分析 |
4.5 本章小结 |
第五章 金融杠杆和资产价格泡沫的影响效应研究 |
5.1 金融杠杆影响商业银行风险承担效应研究 |
5.1.1 理论分析 |
5.1.2 研究假设与变量定义 |
5.1.3 动态面板模型和门限检验方法 |
5.1.4 实证结果及其分析 |
5.2 资产价格泡沫与经济增长的周期联动效应研究 |
5.2.1 频谱分析方法 |
5.2.2 变量说明及数据来源 |
5.2.3 实证结果及其分析 |
5.3 资产价格泡沫与经济增长的共容效应研究 |
5.3.1 模型基本假设 |
5.3.2 资产价格泡沫与经济增长的共容条件 |
5.4 金融杠杆、资产价格泡沫与经济增长的时变效应研究 |
5.4.1 SV-TVP-SVAR模型 |
5.4.2 变量说明及数据来源 |
5.4.3 实证结果及其分析 |
5.5 本章小结 |
第六章 金融去杠杆与资产价格泡沫监控系统研究 |
6.1 去杠杆的范畴界定及认知 |
6.1.1 去杠杆的范畴界定 |
6.1.2 去杠杆的正确认知 |
6.2 实体去杠杆路径研究 |
6.2.1 “去杠杆”与“稳增长”的困境 |
6.2.2 实体去杠杆的路径 |
6.3 金融去杠杆路径研究 |
6.3.1 金融去杠杆的阶段和政策 |
6.3.2 金融去杠杆的路径 |
6.4 限贷政策抑制资产价格泡沫的效应研究 |
6.4.1 合成控制法 |
6.4.2 变量说明与数据来源 |
6.4.3 实证结果及其分析 |
6.5 资产价格泡沫监控系统研究 |
6.5.1 SVR模型与股市泡沫监控系统研究 |
6.5.2 BP神经网络与房地产泡沫监控系统研究 |
6.6 本章小结 |
第七章 研究结论与展望 |
7.1 主要研究结论 |
7.2 政策建议 |
7.3 研究展望 |
参考文献 |
攻读博士学位期间的科研情况 |
致谢 |
(7)基于特征选择的股票指数多分类集成模型(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.2 研究现状 |
1.3 研究方法 |
1.4 主要研究内容和创新 |
第二章 相关的基本理论 |
2.1 金融基础概念 |
2.1.1 沪深300指数的概念及特点 |
2.1.2 技术指标 |
2.2 特征选择方法 |
2.2.1 信息熵增益 |
2.2.2 Relief F算法 |
2.2.3 主成分分析法 |
2.3 几种机器学习方法 |
2.3.1 支持向量机 |
2.3.2 神经网络 |
2.3.3 逻辑回归方法 |
2.4 OWA算子模型集成方法 |
2.4.1 OWA算子定义 |
2.4.2 模型集成方法 |
2.5 常用评价标准 |
2.5.1 混淆矩阵 |
2.5.2 ROC曲线 |
第三章 基于特征工程的股票指数多分类集成模型 |
3.1 数据集预处理 |
3.1.1 三分类标签设定 |
3.1.2 输入样本重塑 |
3.2 特征选择 |
3.2.1 特征集合的扩充 |
3.2.2 特征选择方法的应用 |
3.3 基于OWA算子集成模型的建立 |
3.3.1 模型结构 |
3.3.2 模型集成 |
第四章 实证分析 |
4.1 数据的获取和处理 |
4.2 特征选择过程 |
4.3 模型预测结果和评价 |
4.4 实证结论 |
第五章 总结与展望 |
5.1 工作总结 |
5.2 未来展望 |
参考文献 |
附录 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(8)新闻极性驱动的中概股预测研究(论文提纲范文)
摘要 |
ABSTRACT |
符号说明 |
第一章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 量化金融研究现状 |
1.2.2 事件驱动的量化策略研究现状 |
1.2.3 机器学习的股票预测研究现状 |
1.2.4 中概股研究现状 |
1.3 研究内容与方法 |
1.3.1 研究内容 |
1.3.2 研究方法 |
1.4 组织结构及内容安排 |
1.5 创新点 |
1.5.1 研究内容的创新 |
1.5.2 研究方法的创新 |
第二章 相关理论 |
2.1 股票预测分析原理 |
2.1.1 基本面分析 |
2.1.2 技术面分析 |
2.2 事件驱动相关理论 |
2.3 自然语言处理(NLP) |
2.3.1 特征提取 |
2.3.2 词嵌入 |
2.4 机器学习 |
2.4.1 支持向量机(SVM) |
2.4.2 卷积神经网络(CNN) |
2.4.3 长短期记忆网络(LSTM) |
2.5 本章小结 |
第三章 基于SVM的新闻极性驱动股价趋势预测 |
3.1 引言 |
3.2 自定义全自动机器打标签模型 |
3.3 数据的获取与处理 |
3.3.1 数据的获取 |
3.3.2 数据的预处理 |
3.3.3 特征词提取 |
3.4 循环评估支持向量机分类 |
3.5 参数优化 |
3.5.1 特征空间数的确定 |
3.5.2 核函数的选择 |
3.6 实验与对比 |
3.6.1 预测性能的对比 |
3.6.2 预测趋势的对比 |
3.6.3 模拟交易的对比 |
3.7 本章小结 |
第四章 基于空洞卷积融合时序特征的新闻极性股价预测 |
4.1 引言 |
4.2 基于空洞卷积融合时序特征的新闻极性分析 |
4.2.1 金融与新闻的数据获取 |
4.2.2 词嵌入层 |
4.2.3 算法简介 |
4.3 参数优化 |
4.3.1 Epoch的优化 |
4.3.2 Dropout的优化 |
4.4 实验与对比 |
4.4.1 实验方案设计 |
4.4.2 预测性能的对比 |
4.4.3 模拟交易收益率的对比 |
4.4.4 模拟交易多空收益率的对比 |
4.5 本章小结 |
第五章 总结与展望 |
5.1 本文总结 |
5.2 研究展望 |
参考文献 |
致谢 |
作者简介 |
1 作者简历 |
2 攻读硕士学位期间发表的学术论文 |
3 参与的科研项目及获奖情况 |
4 发明专利 |
学位论文数据集 |
(9)信息熵在机器学习算法中的运用 ——以股价预测为例(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景及研究目的和意义 |
1.2 国内外研究现状 |
1.3 本文贡献 |
1.4 本文结构 |
第2章 信息熵与机器学习算法 |
2.1 信息论及信息熵基础 |
2.2 其他常用熵 |
2.3 机器学习算法简介 |
2.3.1 决策树算法 |
2.3.2 SVM算法 |
2.3.3 BP神经网络模型 |
2.3.4 隐马尔科夫模型 |
2.4 现阶段机器学习发展瓶颈 |
2.5 机器学习算法中的信息熵 |
2.5.1 决策树算法中的信息熵 |
2.5.2 BP神经网络中的交叉熵损失函数 |
2.5.3 最大熵马尔科夫模型 |
2.6 本章小结 |
第3章 实验设计和股票数据预处理 |
3.1 使用机器学习算法预测股价的实际意义 |
3.2 股票价格涨跌预测实验过程设计 |
3.3 数据来源及预处理 |
3.3.1 数据来源及解释 |
3.3.2 股票特征的选择及特征数据的解释 |
3.3.3 数据预处理及股票特征的趋势化处理 |
3.4 机器学习模型性能评价指标 |
3.5 本章小结 |
第4章 信息熵-SVM新型组合算法 |
4.1 信息熵-SVM新型组合算法简介 |
4.2 基于信息熵的股票数据特征分析 |
4.3 本章小结 |
第5章 股价涨跌在七种机器学习算法上的预测 |
5.1 在决策树算法上的预测 |
5.2 在传统SVM算法上的预测 |
5.3 在信息熵-SVM新型组合算法上的预测 |
5.4 在以二次代价函数为损失函数的BP神经网络上的预测 |
5.5 在以交叉熵为损失函数的BP神经网络上的预测 |
5.6 在传统简单隐马尔科夫模型上的预测 |
5.7 在最大熵马尔科夫模型上的预测 |
5.8 实验结果汇总 |
5.9 本章小结 |
第6章 模型间的对比分析 |
6.1 模型预测效果横向分析 |
6.2 模型预测效果纵向分析 |
6.3 本章小结 |
结论 |
总结 |
未来工作展望 |
参考文献 |
致谢 |
(10)股票新闻情感倾向性分析模型的构建与应用研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 相关研究 |
1.3 本文工作 |
1.3.1 本文研究内容和工作 |
1.3.2 本文主要贡献 |
1.4 本文组织结构 |
第二章 相关理论与情感词典研究 |
2.1 深度学习模型 |
2.1.1 卷积神经网络 |
2.1.2 循环神经网络 |
2.1.3 长短期记忆网络 |
2.2 注意力机制 |
2.3 基于深度学习模型的文本情感分类方法 |
2.3.1 文本预处理 |
2.3.2 生成词向量 |
2.3.3 深度学习神经网络模型 |
2.4 构建情感词典 |
2.4.1 基础情感词典 |
2.4.2 领域情感词典 |
2.5 本章小结 |
第三章 篇章级股票新闻文本情感分类模型 |
3.1 研究动机 |
3.2 股票新闻 |
3.2.1 股票新闻 |
3.2.2 股票新闻特点及分类 |
3.2.3 股票新闻情感倾向性分析 |
3.3 篇章级股票新闻文本情感分类模型 |
3.3.1 文本预处理 |
3.3.2 研究过程 |
3.3.3 模型架构 |
3.3.4 嵌入模块 |
3.3.5 Bi-DLSTM神经网络模型 |
3.3.6 多层注意力机制 |
3.3.7 输出模块 |
3.3.8 目标函数 |
3.4 实验及结果分析 |
3.4.1 实验设置 |
3.4.2 实验设计 |
3.4.3 实验结果及分析 |
3.5 本章小结 |
第四章 对象级股票新闻文本情感分类模型 |
4.1 研究动机 |
4.2 对象级股票新闻文本情感倾向性分析 |
4.3 对象级股票新闻文本情感分类模型 |
4.3.1 研究过程 |
4.3.2 模型架构 |
4.3.3 嵌入模块 |
4.3.4 Bi-DLSTM神经网络模型 |
4.3.5 多层注意力机制 |
4.3.6 输出模块 |
4.3.7 目标函数 |
4.4 实验及结果分析 |
4.4.1 实验设置 |
4.4.2 实验设计 |
4.4.3 实验结果及分析 |
4.5 本章小结 |
第五章 新闻情感因子 |
5.1 研究动机 |
5.2 新闻情感因子构建 |
5.2.1 研究数据 |
5.2.2 有效性研究 |
5.2.3 新闻情感因子构建 |
5.2.4 因子数据处理 |
5.2.5 组合因子 |
5.3 因子有效性检验及分析 |
5.4 单因子选股策略历史回测及结果分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
攻读硕士学位期间发表的学术论文 |
四、基于递归神经网络的证券组合投资(英文)(论文参考文献)
- [1]基于深度学习的股票预测模型与交易策略研究[D]. 路季超. 西北大学, 2021(12)
- [2]基于深度学习的实体识别与关系抽取的研究与应用[D]. 姚贵斌. 太原理工大学, 2021(01)
- [3]融入投资者情绪的上证指数涨跌预测方案研究 ——基于SRNN算法[D]. 顾倩茹. 上海师范大学, 2021(07)
- [4]基于小波变换的LSTM混合模型研究及对股票价格预测[D]. 娄磊. 长春理工大学, 2021(02)
- [5]面向金融事件检测的层级多标签文本分类[D]. 梁鑫. 华东师范大学, 2021(07)
- [6]金融杠杆与资产价格泡沫:影响机制及其监控研究[D]. 冯文芳. 东南大学, 2020(02)
- [7]基于特征选择的股票指数多分类集成模型[D]. 于玉洁. 北京交通大学, 2020(04)
- [8]新闻极性驱动的中概股预测研究[D]. 童川. 浙江工业大学, 2020(02)
- [9]信息熵在机器学习算法中的运用 ——以股价预测为例[D]. 张璐瑶. 哈尔滨工业大学, 2020(02)
- [10]股票新闻情感倾向性分析模型的构建与应用研究[D]. 王涛. 上海交通大学, 2020(01)