用于计算稀疏矩阵特征向量的 ARPACK 库接口
用法
arpack_defaults()
arpack(
func,
extra = NULL,
sym = FALSE,
options = arpack_defaults(),
env = parent.frame(),
complex = !sym
)
参数
- func
执行矩阵-向量乘法的函数。 ARPACK 需要用户执行这些操作。该函数将向量 \(x\) 作为第一个参数,并且应该返回 \(Ax\),其中 \(A\) 是“输入矩阵”。(输入矩阵永远不会被显式给出。)第二个参数是
extra
。- extra
要提供给
func
的额外参数。- sym
逻辑标量,输入矩阵是否对称。如果矩阵对称,请始终在此处提供
TRUE
,因为它可以加快计算速度。- options
ARPACK 的选项,一个命名列表,用于覆盖一些默认选项值。请参见下面的详细信息。
- env
将评估
func
的环境。- complex
是否将 ARPACK 返回的特征向量转换为 R 复向量。默认情况下,对于对称问题(这些问题只有实特征向量/值)不会这样做,而只会对非对称问题这样做。如果您有一个非对称问题,但您确定结果将是实数,那么请在此处提供
FALSE
。
值
一个包含以下成员的命名列表
- values
数值向量,所需的特征值。
- vectors
数值矩阵,所需的特征向量作为列。如果
complex=TRUE
(非对称问题的默认设置),则矩阵是复数。- options
一个命名列表,其中包含提供的
options
和一些关于执行的计算的信息,包括 ARPACK 退出代码。请参阅上面的详细信息。
详细信息
ARPACK 是一个用于解决大规模特征值问题的库。该软件包旨在计算一般 \(n\) 乘以 \(n\) 矩阵 \(A\) 的几个特征值和相应的特征向量。它最适合于大型稀疏或结构化矩阵 \(A\),其中结构化意味着矩阵-向量乘积 w <- Av
需要阶 \(n\) 而不是通常的阶 \(n^2\) 浮点运算。
此函数是 ARPACK 的接口。 igraph 不包含所有 ARPACK 例程,仅包含使用双精度实数处理对称和非对称特征值问题的例程。
ARPACK 中的特征值计算(在最简单的情况下)涉及计算 \(Av\) 乘积,其中 \(A\) 是我们使用的矩阵,\(v\) 是任意向量。在 fun
参数中提供的函数应执行此乘积。如果可以有效地完成乘积,例如,如果矩阵是稀疏的,那么 arpack()
通常能够非常快速地计算特征值。
options
参数指定要执行的计算类型。它是一个包含以下成员的列表,它们直接对应于 ARPACK 参数。在输入时,它具有以下字段
- bmat
字符常量,可能的值:‘
I
’,标准特征值问题,\(Ax=\lambda x\);和 ‘G
’,广义特征值问题,\(Ax=\lambda B x\)。目前仅支持 ‘I
’。- n
数值标量。特征值问题的维度。仅当您直接调用
arpack()
时才需要设置此参数。(即,对于eigen_centrality()
,page_rank()
等,不需要此参数。)- which
指定要计算的特征值/向量,包含正好两个字符的字符常量。对称输入矩阵的可能值
- "LA"
计算
nev
个最大(代数)特征值。- "SA"
计算
nev
个最小(代数)特征值。- "LM"
计算
nev
个最大(幅度)特征值。- "SM"
计算
nev
个最小(幅度)特征值。- "BE"
计算
nev
个特征值,每个端点一半。当nev
为奇数时,从高端计算的比从低端计算的多一个。
非对称输入矩阵的可能值
- "LM"
计算
nev
个最大幅度的特征值。- "SM"
计算
nev
个最小幅度的特征值。- "LR"
计算
nev
个最大实部的特征值。- "SR"
计算
nev
个最小实部的特征值。- "LI"
计算
nev
个最大虚部的特征值。- "SI"
计算
nev
个最小虚部的特征值。
此参数有时会被各种函数覆盖,例如,
page_rank()
始终设置为 ‘LM
’。- nev
数值标量。要计算的特征值的数量。
- tol
数值标量。停止准则:如果 Ritz 值的误差小于其估计值的
tol
倍,则认为其相对精度是可以接受的。如果将其设置为零,则使用机器精度。- ncv
要生成的 Lanczos 向量的数量。
- ldv
数值标量。在当前实现中,应将其设置为零。
- ishift
零或一。如果为零,则移位由用户通过反向通信提供。如果为一,则相对于缩减的三对角矩阵 \(T\) 的精确移位。请始终将其设置为一。
- maxiter
允许的最大 Arnoldi 更新迭代次数。
- nb
要在递归中使用的块大小。请始终将此值保留为默认值,即一。
- mode
要解决的特征值问题的类型。如果输入矩阵是对称的,则可能的值
- 1
\(Ax=\lambda x\),\(A\) 是对称的。
- 2
\(Ax=\lambda Mx\),\(A\) 是对称的,\(M\) 是对称正定的。
- 3
\(Kx=\lambda Mx\),\(K\) 是对称的,\(M\) 是对称正半定的。
- 4
\(Kx=\lambda KGx\),\(K\) 是对称正半定的,\(KG\) 是对称不定的。
- 5
\(Ax=\lambda Mx\),\(A\) 是对称的,\(M\) 是对称正半定的。(Cayley 变换模式。)
请注意,仅测试了
mode==1
,其他值可能无法正常工作。如果输入矩阵不对称,则可能的值- 1
\(Ax=\lambda x\)。
- 2
\(Ax=\lambda Mx\),\(M\) 是对称正定的。
- 3
\(Ax=\lambda Mx\),\(M\) 是对称半正定的。
- 4
\(Ax=\lambda Mx\),\(M\) 是对称半正定的。
请注意,仅测试了
mode==1
,其他值可能无法正常工作。- start
当前未使用。稍后将用于设置起始向量。
- sigma
当前未使用。
- sigmai
当前未使用。
:在输出时,添加以下附加字段
- info
ARPACK 的错误标志。可能的值
- 0
正常退出。
- 1
达到最大迭代次数。
- 3
在隐式重启的 Arnoldi 迭代循环中无法应用移位。一种可能性是相对于
nev
增加ncv
的大小。
ARPACK 可以返回比这些更多的错误条件,但它们会被转换为常规的 igraph 错误。
- iter
进行的 Arnoldi 迭代次数。
- nconv
“收敛”的 Ritz 值的数量。这表示满足收敛标准的 Ritz 值的数量。
- numop
矩阵-向量乘法的总数。
- numopb
当前未使用。
- numreo
重新正交化的总步数。
有关更多详细信息,请参见 ARPACK 文档。
参考文献
D.C. Sorensen, Implicit Application of Polynomial Filters in a k-Step Arnoldi Method. SIAM J. Matr. Anal. Apps., 13 (1992), pp 357-385.
R.B. Lehoucq, Analysis and Implementation of an Implicitly Restarted Arnoldi Iteration. Rice University Technical Report TR95-13, Department of Computational and Applied Mathematics.
B.N. Parlett & Y. Saad, Complex Shift and Invert Strategies for Real Matrices. Linear Algebra and its Applications, vol 88/89, pp 575-595, (1987).
参见
eigen_centrality()
、page_rank()
、hub_score()
、cluster_leading_eigen()
是 igraph 中一些使用 ARPACK 的函数。
作者
Rich Lehoucq、Kristi Maschhoff、Danny Sorensen、Chao Yang 为 ARPACK,Gabor Csardi csardi.gabor@gmail.com 为 R 接口。
示例
# Identity matrix
f <- function(x, extra = NULL) x
arpack(f, options = list(n = 10, nev = 2, ncv = 4), sym = TRUE)
#> $values
#> [1] 1 1
#>
#> $vectors
#> [,1] [,2]
#> [1,] 0.47899559 -0.22165241
#> [2,] 0.02563875 -0.05909943
#> [3,] 0.47539054 -0.19000747
#> [4,] -0.52783666 -0.67727036
#> [5,] -0.27844498 -0.21112117
#> [6,] 0.14568395 0.04884236
#> [7,] 0.07307229 0.02239947
#> [8,] -0.37430168 0.63030259
#> [9,] -0.02487496 0.05239496
#> [10,] 0.14311774 0.07136832
#>
#> $options
#> $options$bmat
#> [1] "I"
#>
#> $options$n
#> [1] 10
#>
#> $options$which
#> [1] "XX"
#>
#> $options$nev
#> [1] 2
#>
#> $options$tol
#> [1] 0
#>
#> $options$ncv
#> [1] 4
#>
#> $options$ldv
#> [1] 0
#>
#> $options$ishift
#> [1] 1
#>
#> $options$maxiter
#> [1] 3000
#>
#> $options$nb
#> [1] 1
#>
#> $options$mode
#> [1] 1
#>
#> $options$start
#> [1] 0
#>
#> $options$sigma
#> [1] 0
#>
#> $options$sigmai
#> [1] 0
#>
#> $options$info
#> [1] 0
#>
#> $options$iter
#> [1] 1
#>
#> $options$nconv
#> [1] 2
#>
#> $options$numop
#> [1] 4
#>
#> $options$numopb
#> [1] 0
#>
#> $options$numreo
#> [1] 4
#>
#>
# Graph laplacian of a star graph (undirected), n>=2
# Note that this is a linear operation
f <- function(x, extra = NULL) {
y <- x
y[1] <- (length(x) - 1) * x[1] - sum(x[-1])
for (i in 2:length(x)) {
y[i] <- x[i] - x[1]
}
y
}
arpack(f, options = list(n = 10, nev = 1, ncv = 3), sym = TRUE)
#> $values
#> [1] 10
#>
#> $vectors
#> [1] 0.9486833 -0.1054093 -0.1054093 -0.1054093 -0.1054093 -0.1054093
#> [7] -0.1054093 -0.1054093 -0.1054093 -0.1054093
#>
#> $options
#> $options$bmat
#> [1] "I"
#>
#> $options$n
#> [1] 10
#>
#> $options$which
#> [1] "XX"
#>
#> $options$nev
#> [1] 1
#>
#> $options$tol
#> [1] 0
#>
#> $options$ncv
#> [1] 3
#>
#> $options$ldv
#> [1] 0
#>
#> $options$ishift
#> [1] 1
#>
#> $options$maxiter
#> [1] 3000
#>
#> $options$nb
#> [1] 1
#>
#> $options$mode
#> [1] 1
#>
#> $options$start
#> [1] 0
#>
#> $options$sigma
#> [1] 0
#>
#> $options$sigmai
#> [1] 0
#>
#> $options$info
#> [1] 0
#>
#> $options$iter
#> [1] 1
#>
#> $options$nconv
#> [1] 1
#>
#> $options$numop
#> [1] 3
#>
#> $options$numopb
#> [1] 0
#>
#> $options$numreo
#> [1] 2
#>
#>
# double check
eigen(laplacian_matrix(make_star(10, mode = "undirected")))
#> eigen() decomposition
#> $values
#> [1] 1.000000e+01 1.000000e+00 1.000000e+00 1.000000e+00 1.000000e+00
#> [6] 1.000000e+00 1.000000e+00 1.000000e+00 1.000000e+00 3.552714e-15
#>
#> $vectors
#> [,1] [,2] [,3] [,4] [,5]
#> [1,] 0.9486833 0.000000e+00 0.000000e+00 0.00000000 0.000000e+00
#> [2,] -0.1054093 -3.700743e-17 -3.700743e-17 0.00000000 -3.700743e-17
#> [3,] -0.1054093 -3.768958e-02 1.005977e-01 0.02684135 4.687454e-02
#> [4,] -0.1054093 3.537753e-01 -1.012990e-01 -0.08701190 -6.664397e-02
#> [5,] -0.1054093 -4.526060e-01 -4.556778e-01 -0.51370736 -3.394283e-01
#> [6,] -0.1054093 -3.384853e-01 -1.777216e-03 0.02479089 8.481572e-01
#> [7,] -0.1054093 -8.057222e-02 -1.154307e-02 0.01661573 -1.545983e-01
#> [8,] -0.1054093 5.759880e-01 -4.900096e-01 0.30166795 6.743751e-02
#> [9,] -0.1054093 3.180750e-01 6.685471e-01 -0.43654213 -4.340406e-02
#> [10,] -0.1054093 -3.384853e-01 2.911619e-01 0.66734547 -3.583947e-01
#> [,6] [,7] [,8] [,9] [,10]
#> [1,] 0.000000e+00 0.000000e+00 0.000000e+00 0.0000000 -0.3162278
#> [2,] 3.238150e-17 7.401487e-17 3.700743e-17 0.9428090 -0.3162278
#> [3,] -1.979763e-02 9.262957e-01 4.611153e-02 -0.1178511 -0.3162278
#> [4,] 8.482088e-01 -8.673487e-02 2.424907e-02 -0.1178511 -0.3162278
#> [5,] -1.084886e-01 -8.673487e-02 2.531916e-01 -0.1178511 -0.3162278
#> [6,] 4.196770e-02 -1.931187e-01 3.719095e-02 -0.1178511 -0.3162278
#> [7,] -1.084886e-01 -8.673487e-02 -9.082431e-01 -0.1178511 -0.3162278
#> [8,] -4.229128e-01 -8.673487e-02 1.455981e-01 -0.1178511 -0.3162278
#> [9,] -2.724565e-01 -1.931187e-01 1.513033e-01 -0.1178511 -0.3162278
#> [10,] 4.196770e-02 -1.931187e-01 2.505985e-01 -0.1178511 -0.3162278
#>
## First three eigenvalues of the adjacency matrix of a graph
## We need the 'Matrix' package for this
library("Matrix")
set.seed(42)
g <- sample_gnp(1000, 5 / 1000)
M <- as_adjacency_matrix(g, sparse = TRUE)
f2 <- function(x, extra = NULL) {
cat(".")
as.vector(M %*% x)
}
baev <- arpack(
f2,
sym = TRUE,
options = list(
n = vcount(g),
nev = 3,
ncv = 8,
which = "LM",
maxiter = 2000
)
)
