时间:2025-08-11 13:59 / 来源:未知
提取主要数据特征量的一种方 法!怎么买布伦特FXCG原油期货量是雷同的。而可能注明C = X X 和C ∗ = X X 有不异的特色根, 但特色向量不 同。以是,通落伍空转换可能求X X 矩阵的特色根,进而筹划XX 矩阵的特色向 量。即有 C∗ × V ∗ = V ∗ × ∧ V ∗ 是C ∗ 的特色向量,∧是特色根对角矩阵。按照V ∗ 是可能求出C 的特色向量的, 最先筹划Va = X × V ∗ ;对Va 举行处罚取得C 的前n个特色向量Vk 1 Vk = √ Va (:, k ) λk 取得特色向量V 后,就可能筹划相应的主因素 PC = V T × X 前 面 计 算 得 到 的EOF 维 数 是m × m, 而 通 过 时 空 转 换 得 到 的EOF 维 数 只 有m × n。即只可取得前n个特色向量。不外本质行使中对结果影响并不大,由于 通俗咱们只亲切前几个最紧急的模态。 下面是一个纯洁例子,有一个矩阵X ,维数是5×2,先直接筹划矩阵XX 的5个 特色向量,然后再操纵时空转换举措筹划其前2个特色向量。
此中P C 中每行数据即是对应每个特色向量的功夫系数。第一行PC(1,:)即是 第一个EOF的功夫系数,其他类推。 上面是对数据矩阵X 举行筹划取得的EOF和主因素(PC),以是操纵EOF和PC也 可能统统复原正本的数据矩阵X ,即 X = EOF × P C 有时可能用前面最了得的几个EOF模态就可能拟合出矩阵X 的紧要特色。此
1 切磋对其举行时空转换。矩阵A = n XX 和B = XX 的特色根分别,然则特色向
一 般 将 特 征 根λ按 从 大 到 小 顺 序 排 列 , 即λ1 λ2 . . . λm 。 因 为 数 据X 是实正在的观测值,因而λ应当大于或者等于0。每个非0的特色根对应 42
(1)偏差 (2)原料的处罚。原始场,距平场,与模范化场 例子:我邦160站夏令降水量的EOF领悟(图A.17) (3)空间样本点。大鸿沟的空间数据,卓殊必要提神原料空间代外性。非匀称 场与匀称分散场;空间抽样;面积加权。 北半球1月SLP例子
有时空间样本m广大于功夫序列长度n,筹划m × m矩阵的特色根很麻烦,可能
一列特色向量值,也称EOF。如λ1 对应的特色向量值称第一个EOF模态, 也即是V 的第一列即EOF1 = V (:, 1);第λk 对应的特色向量是V 的第k 列, 即EOFk = V (:, k )。 • 筹划主因素。将EOF投影到原始原料矩阵X 上,就取得全数空间特色向量对 应的功夫系数(即主因素),即
体会正交函数领悟举措(empirical orthogonal function, 缩写为EOF),也称特色 向量领悟(eigenvector analysis),或者主因素领悟(principal component analysis,缩 写PCA),是一种领悟矩阵数据中的构造特色,提取紧要数据特色量的一种方 法。Lorenz正在1950年代初度将其引入景象和天气斟酌,现正在正在地学及其他学科中 取得了分外广大的行使。地学数据领悟中通俗特色向量对应的是空间样本,因而 也称空间特色向量或者空间模态;主因素对应的是功夫蜕化,也称功夫系数。因 此地学中也将EOF领悟称为时空理会。
间合联为0。E × E T = I 。I为对角单元矩阵,即对角线。这证明各个模态之间合联为0,是独立的。 由上面的筹划流程可能看出,EOF领悟的中央是筹划矩阵C 的特色根和特色向 量。筹划矩阵特色根和特色向量的举措良众,下面的确给出Matlab中举行EOF分 析的两种分别的举措。的确设施可参考下面两个框图中的实例。 举措1:移用[EOF,E]=eig(C),此中EOF为筹划取得的空间特色向量,E为特 征根。然后筹划主因素P C = EOF T × X 。必要指出的时,当数据量很大时,例 如领悟高离别率的原料(如1km离别率的NDVI原料),空间鸿沟很大维数m很容易 突出数万个点,则矩阵C 的维数是个强大量,必要占用豪爽内存,也会导致筹划 速率极度怠缓。并且很不妨跨越筹划机的筹划极限而死机。 举措2:直接对矩阵X 举行瑰异值理会 X=U 此中 系。 43 为瑰异值对交阵( VT
这证实矩阵X 的方差巨细可能纯洁的用特色根的巨细来吐露。λ越高证实其对应的 模态越紧急,对总方差的功劳越大。第k 个模态对总的方差注明率为 λk m i=1 λi × 100%
尽管是随机数或者子虚数据,放正在一块举行EOF领悟,也可能将其理会成一 系列的空间特色向量和主因素。以是,本质原料领悟中取得的空间模态是否是随 机的,必要举行统计搜检。North等(1982)的斟酌指出,正在95%置信度程度下的特 征根的偏差 2 N∗ λ是特色根,N ∗ 是数据的有用自正在度,这正在前面合联系数领悟中曾经有先容(睹4 ∆λ = λ 页合联实质)。将λ按挨次按次查验,标上偏差鸿沟。倘使前后两个λ之间偏差鸿沟 有重叠,那么他们之间没有明显差异。 图A.16是对1949 − 2002年北半球1月均匀海平面气压,做距平处罚处罚及面积 加权后举行EOF领悟的结果。从特色根偏差鸿沟看,第一和第二模态存正在明显差 别,第二和第三模态之间也存正在明显差异。然则第三特色根和第四及此后的特色 根之间没有明显的差异。倘使要领悟紧要的模态的话,最好只采选前三个举行分 析。 44
图 A.17: 我邦东部区域夏令降水量EOF领悟第一特色向量。(a)原始值,(b)距平 值,(c)距平百分率,(d)模范化值. 1951 − 2002原料.
• 选定要领悟的数据,举行数据预处罚,通俗处罚成距平的格式。取得一个数 据矩阵Xm×n • 筹划X 与其转置矩阵X T 的交叉积,取得方阵 Cm×m = 1 X × XT n
因为该举措是直接对矩阵X 举行理会,因而对内存的条件远小于举措1。筹划速率 很速。 两种举措比较操练。
通俗环境下,主因素是有单元的,即响应的是矩阵X 的单元,而空间特色向量是 无量纲的。不外本质行使中时时对EOF领悟取得的主因素和特色向量举行模范化 处罚取得新的P C ∗ 和EOF ∗ P C (k ) P C ∗ (k ) = √ λk EOF ∗ (k ) = EOF (k ) λk
或者是纯洁地将PC模范化,使得其均匀值为0,模范差为1。再将它与原始资 料矩阵X 举行回归领悟,如此就取得P C 蜕化一个单元时,变量X 对应的反响的 空间特色及其强度。如此取得的回归系数的空间分散与空间特色向量的分散特 征空间分散特色是好似的,然则回归系数可能看出相应的蜕化的数目巨细。如 图A.16(d)。 空间模态应当与主因素派合举行领悟。二者符号是相对应的。 领悟中保存的模态的数目,没有庄敬划定,还取决于领悟主意。平常取满 足North法则;或者有明晰物理意旨。
图 A.16: 北半球1月海平面气压EOF领悟的第一特色向量. (a)为特色根及95%信度 偏差,(b)第一特色向量,(c)第一主因素,(d)第一主因素偏强σ 时海平面气压的 蜕化量(hPa). 1949 − 2002,NCEP/NCAR再领悟原料