Reading - Some Methods, Theories, and New Findings

目录

Methods

PCA

  • 主成分分析和因子分析.
  • 因子载荷旋转: 载荷矩阵进行旋转,可得到相应的特征向量。
  • Kaiser-Meyer-Olkin抽样充分性测度: 也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数 与偏相关系数得到的
  • Kaiser-Meyer-Olkin抽样充分性测度: KMO越高, 表明变量的共性越强和SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适
  • SMC: 即一个变量与其他所有变量的复相关系数的平方, 也就是复回归方程的可决系数。SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适
  • 因子分析.
  • 因子分析及代码.
  • 因子分析原理.
  • 因子分析(Factor Analysis FA) 是一种数据简化技术,通过研究众多变量之间的内部依赖关系 探求观测数据的基本结构,并利用少数几个假想变量(因子)来表示原始数据。
  • 因子能够反映众多原始变量的主要信息。
  • 因子的特点:
    • 因子个数远远少于原始变量个数
    • 因子并非原始变量的简单取舍,而是一种新的综合
    • 因子之间没有线性关系
    • 因子具有明确解释性,可以最大限度地发挥专业分析的作用 *
  • 因子分析(factor analysis)是主成分分析的推广和发展,也是多元统计分析中降维分析的一种方法。 主成分分析通过线性组合将多个原始变量综合成若干主成分。在多变量分析中, 某些变量间往往存在相关性。那么,是什么原因使变量间有关联呢? 是否存在不能直接观测到的,但影响可观测变量变化的公共因子
  • 因子分析就是寻找这些公共因子的分析方法, 它是在综合原始变量信息的基础上构筑若干意义较为明确的公因子, 以它们为框架分解原始变量,以此考察原始变量间的联系与区别
  • 注意,主成分分析是因子分析的一个特例。通常情况下可采用主成分法估算出因子个数
    • 二者区别和联系主要体现在如下几个方面:
    • 因子分析是把原始变量表示成各因子的线性组合,而主成分分析则是 把主成分表示成各原始变量的线性组合
    • 主成分分析的重点在于解释原始变量的总方差, 而因子分析则把重点放在解释原始变量之间的协方差
    • 因子分析中的因子个数可根据研究者的需要而事先指定,指定因子数量不同可导致分析结果不同。 在主成分分析中,有几个变量就有几个主成分。
    • 主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,主成分一般是唯一的; 而因子分析中因子是不唯一的,可以旋转得到不同的因子。 *
  • 因子旋转
    • 因子分析的目的不仅是找出因子,更重要的是知道每个因子的意义,以便对实际问题进行分析。 如果因子的典型代表变量不很突出,为了对公因子 F 能够更好地解释,还需要进行因子旋转, 通过适当的旋转得到比较满意的主因子。 即使得每个原始变量仅在一个公因子上有较大的载荷,而在其余的公因子上的载荷比较小
    • 进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化, 使大的载荷更大,小的载荷更小。旋转的方法有很多,因子旋转过程中,按照旋转坐标轴的位置不同, 如果主轴相互正交,则称为正交旋转;如果主轴相互间不是正交的,则称为斜交旋转。 可供选择的因子旋转方法有:方差最大化法、四分位最大法、平衡法、正交旋转法等。 一般实际问题中常用方法是方差最大化、正交旋转法

LASSO

统计检验