跳到内容

分区 A 和 B 之间的分裂-连接距离是 A 到 B 的投影距离和 B 到 A 的投影距离的总和。投影距离是一种非对称度量,其定义如下

用法

split_join_distance(comm1, comm2)

参数

comm1

第一个社群结构。

comm2

第二个社群结构。

两个整数,详见下文。

详细信息

首先,分区 A 中的每个集合与分区 B 中的所有集合进行评估。对于分区 A 中的每个集合,找到分区 B 中最佳匹配的集合,并计算重叠大小。(匹配通过两个集合之间的重叠大小来量化)。然后,将 A 中每个集合的最大重叠大小加在一起,并从 A 中的元素数量中减去。

分裂-连接距离将作为两个数字返回,第一个是第一个分区到第二个分区的投影距离,而第二个数字是第二个分区到第一个分区的投影距离。这使得更容易检测一个分区是否是另一个分区的子分区,因为在这种情况下,相应的距离将为零。

参考文献

van Dongen S:图聚类和马尔可夫聚类实验的性能标准。荷兰国家数学和计算机科学研究所技术报告 INS-R0012,阿姆斯特丹,2000 年 5 月。