目录
Methods
PCA
- 主成分分析和因子分析.
- 因子载荷旋转: 载荷矩阵进行旋转,可得到相应的特征向量。
- Kaiser-Meyer-Olkin抽样充分性测度:
也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数
与偏相关系数得到的。
- Kaiser-Meyer-Olkin抽样充分性测度: KMO越高,
表明变量的共性越强和SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适。
- SMC: 即一个变量与其他所有变量的复相关系数的平方,
也就是复回归方程的可决系数。SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适。
- 因子分析.
- 因子分析及代码.
- 因子分析原理.
- 因子分析(Factor Analysis FA) 是一种数据简化技术,通过研究众多变量之间的内部依赖关系
探求观测数据的基本结构,并利用少数几个假想变量(因子)来表示原始数据。
- 因子能够反映众多原始变量的主要信息。
- 因子的特点:
- 因子个数远远少于原始变量个数
- 因子并非原始变量的简单取舍,而是一种新的综合
- 因子之间没有线性关系
- 因子具有明确解释性,可以最大限度地发挥专业分析的作用
*
- 因子分析(factor analysis)是主成分分析的推广和发展,也是多元统计分析中降维分析的一种方法。
主成分分析通过线性组合将多个原始变量综合成若干主成分。在多变量分析中,
某些变量间往往存在相关性。那么,是什么原因使变量间有关联呢?
是否存在不能直接观测到的,但影响可观测变量变化的公共因子?
- 因子分析就是寻找这些公共因子的分析方法,
它是在综合原始变量信息的基础上构筑若干意义较为明确的公因子,
以它们为框架分解原始变量,以此考察原始变量间的联系与区别。
- 注意,主成分分析是因子分析的一个特例。通常情况下可采用主成分法估算出因子个数,
- 二者区别和联系主要体现在如下几个方面:
- 因子分析是把原始变量表示成各因子的线性组合,而主成分分析则是
把主成分表示成各原始变量的线性组合。
- 主成分分析的重点在于解释原始变量的总方差,
而因子分析则把重点放在解释原始变量之间的协方差。
- 因子分析中的因子个数可根据研究者的需要而事先指定,指定因子数量不同可导致分析结果不同。
在主成分分析中,有几个变量就有几个主成分。
- 主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是唯一的;
而因子分析中因子是不唯一的,可以旋转得到不同的因子。
*
- 因子旋转
- 因子分析的目的不仅是找出因子,更重要的是知道每个因子的意义,以便对实际问题进行分析。
如果因子的典型代表变量不很突出,为了对公因子 F 能够更好地解释,还需要进行因子旋转,
通过适当的旋转得到比较满意的主因子。
即使得每个原始变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小。
- 进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,
使大的载荷更大,小的载荷更小。旋转的方法有很多,因子旋转过程中,按照旋转坐标轴的位置不同,
如果主轴相互正交,则称为正交旋转;如果主轴相互间不是正交的,则称为斜交旋转。
可供选择的因子旋转方法有:方差最大化法、四分位最大法、平衡法、正交旋转法等。
一般实际问题中常用方法是方差最大化、正交旋转法。
LASSO
统计检验