股市预测模型分析

预测股票未来价值是一项重要的工作,它能帮助投资者决定是否投资某只股票。为了成功预测股票的未来价值,从五个不同行业的历史数据中收集样本,每个行业包含四只股票,这些股票分布在大、中、小市值之间。收集了各种财务因素的数据,并运用回归分析、因子分析和对应分析等技术来构建模型。

抽样设计

由于印度股市上市股票众多,因此必须应用抽样技术以代表所有类型的公司。采用的是配额抽样方法。在配额抽样中,首先将数据划分为互不重叠的子群组,然后根据指定的比例,使用判断力从每个行业中选择股票。选取了IT、纺织、快速消费品(FMCG)、汽车配件和制药五个行业,这些行业是进攻型和防御型行业的混合。对于每个行业,选择的股票数量均衡地分布在大市值、中市值和小市值之间。

数据需求

被要求收集以下数据,这些数据涵盖了五个行业中选出的四只股票。从1996财年开始,提取了以下年度数据:历史市值、市盈率(P/E)、市净率(P/B)、最后价格、每股股息、净利润率、流动比率、资产回报率、普通股股东权益回报率和留存比率。这些数据将作为模型中价格的预测因子。通常来说,尽可能多地收集预测因子是一个好习惯,这样模型就有更高的概率拥有更好的预测因子集合。

数据分析

该模型用于计算各个行业公司股票的理论值。这个模型的主要作用是预测或确定股票的未来市场价格,或者一般而言的潜在市场价格,并帮助投资者从价格变动中获利,因为它决定了被判断为低估(与理论价值相比)的股票是否被购买,以及被判断为高估的股票是否被出售。预计被低估的股票将升值,而高估的股票通常会随着时间的推移而贬值。

方法论

1.因子分析:因子分析是一种统计方法,用于描述观察到的相关变量之间的变异性,用较少的未观察变量(称为因子)来表示。因子是由观察到的预测因子组合而成的潜在或未声明的预测因子。在SPSS中观察到的结果如下:行代表预测因子,列是因子。数值表示预测因子对因子的权重或负荷。每个预测因子的最高权重(以绿色突出显示)被分配到相应的因子。以下是每个因子的突出因子:

A) 因子1:资产回报率、普通股股东权益回报率和利润率是与此因子对应的变量。这个因子由盈利能力比率组成。 B) 因子2:市盈率、市净率和回报率。由价格比率组成。 C) 因子3:流动比率、留存比率。由效率比率组成。 D) 因子4:最后价格、每股股息。由公司发行的最新价格和股息组成。

这四个因子解释了数据中66.56%的变异性。应用一些测试:

KMO和Bartlett测试的假设 - 预测因子的协方差矩阵是单位矩阵(协方差矩阵是每个预测因子与其他每个预测因子之间的相关性矩阵) KMO>0.5的结果导致假设的拒绝 P

2.回归模型:这里关注的是因变量和一个或多个独立变量(或“预测因子”)之间的线性关系。需要估计一个称为回归函数的独立变量函数。采用逐步回归技术逐个添加预测因子。根据这个结果,模型4是最合适的选择。变量膨胀因子(VIF)值<4表明变量之间没有多重共线性。Durbin-Watson值接近2表示没有自相关(误差项之间的相关性)。

3. 对应分析:对应分析是一种统计技术,提供了交叉表(也称为交叉标签或列联表)的图形表示。当可能将事件放入两个或多个不同的类别集合中时,就会出现交叉表。对应分析是在市值与比率之间进行的,结果如下:大市值与低市盈率和高P边际相关。中市值与高资产回报率和中等市盈率相关。小市值与中等回报相关。对应分析为进一步改进模型提供了思路,并为小市值、中市值和大市值股票创建单独的模型。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485