线性回归在股票价格预测中的应用

尽管存在众多复杂的方法和系统旨在预测未来的股价,简单的线性回归方法有助于理解过去的趋势,并被专业人士和初学者用来尝试将现有或过去的趋势外推到未来。如果现有趋势持续到未来,那么可能拥有一个潜在的赢家。

需要注意的是,没有任何方法能够确保未来会完全像过去一样,因此这种方法和其他预测方法一样,尽管在根本上是有用的,但也有其局限性。

考虑到这一点,让尝试预测Infosys(NSE代码:INFY)的未来股价。让回顾一下线性回归的概念,选择一个任意的时间框架,获取过去的数据,应用这种方法,识别过去的趋势,并检查结果。

理解线性回归

最简单的回归方程形式,具有一个因变量和一个自变量,由以下公式定义:

y = m*x + c

其中y是估计的因变量,m是回归系数,或通常所说的斜率,x是自变量,c是一个常数。简而言之,当m、x和c作为输入时,y是输出。

线性回归确实试图预测趋势和未来值。它基本上,尽管不是精确到点,但可以回答如下问题:

  • Infosys在未来3个月的价格会是多少?
  • 黄金在未来6个月的价格会是多少?
  • 如果现有趋势持续到未来,市场会走向何方?

这就是未来股价或金融市场的情况。当然,它在金融市场之外也更有用,使用也更广泛。然而,对于本文,将检查其在预测股票趋势中的有用性。

分析过去的趋势

以2020年4月9日至2020年7月10日的INFY过去价格为例,总共60个交易日或大约3个日历月,按照以下程序,将得到Infosys过去60天的趋势。

Excel中获取过去60天的收盘价数据。仅展示3天的数据以示例。(数据来源:)

代码 日期 收盘价
INFY 2020-04-16 623.85
INFY 2020-04-17 628.75
INFY 2020-04-20 653.30

选择60个值的日期和收盘价列,插入如下的散点图。选择快速布局fx如下。

基于过去值,Excel计算出的斜率m=1.3312,这意味着在这段时间内,Infosys的股票平均每天增加1.33卢比。常数c的值是-57849。

让看看如果假设这种趋势持续到未来,预测值会是什么样子。以接下来的60天作为测试数据,以便将预测值与实际收盘日期进行比较。这将从2020年7月13日开始,一直持续到2020年10月5日(直到最近)。

预测值,y = 1.3312*x – 57489

将上述公式应用于Excel的所有行。记住,这里的x是日期,所以必须将结果转换为数字以获得正确的结果,如下所示。

接下来,将实际收盘价与预测值进行比较,并计算这些值之间的百分比差异。

不会深入统计预测的解释,现在只考虑预测值与实际值的对比,即实际收盘价减去预测值除以预测值。

一旦完成这个任务,会发现百分比差异从2020年7月14日的最低3%(好预测)到2020年7月31日的最高19%(不好的预测),并告诉线性趋势的性质,即一段时间内的比例变化。

局限性

未来被显示为线性增长,这不是真的,因为如果观察实际值,会看到价格的跳跃上升和下降。实际数据中有很多变异性,但预测值的标准增长是一致的。

这条线只朝一个方向走,这意味着如果过去在一段时间内平均增长,那么未来也将显示在下一个时期内的平均增长。实际上,总是存在趋势逆转的危险,而线性预测永远无法揭示这一点。

这些值本身与实际值的差异超过10%的大百分比,表明它不是那么准确的预测器。

它可以告诉平均来说,过去的趋势是什么,就像一开始提到的,如果未来趋势与过去趋势相同,那么使用简单的线性回归模型的预测将会相当准确,这并不需要很多工作。

使用百分比误差,可以推断出一个范围,可以预期未来值可能在这个范围内。

一旦可以计算出所有情况,就可以意识到如果趋势改善、恶化或保持不变,未来的值将会是什么,因此有一个可能的范围。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485