第20章 网络数据
20.1 网络的基本概念
所谓网络,即是对具有联系的事物的抽象。“网络”是对这类事物及其间关系的总和的形象概括。想象日常生活中的蜘蛛网,上有若干长长的蛛丝,而每根蛛丝交界的地方就是一个点。而在“网络”概念中,那些可能有联系的事物的集合就是网络中的节点集合,而事物间的联系就是网络的边。
在马尔可夫链中,各个状态即可被视为网络中的节点,而状态间的转移,即是状态的联系,也就是网络中的边。
网络的数学表示
网络的数学表示有两种,一种是图,一种是矩阵。
图是数学分支图论中的核心概念,读者不必知道太多关于图的理论。只需知道,使用图来表示状态间的“网络”,其目的在于计算图论中关于图的一些特征,以计算马尔可夫链的特征。
相较于“图”,矩阵则更加便于计算。事实上,图和矩阵是可以相互转换的。一般而言,图向矩阵转换时,当点\(i\)与点\(j\)间有联系时,则记\(a_{ij}=a_{ji}=1\)。而当矩阵向图转换时,则反之。
使用矩阵的目的则是利用线性代数运算的便利性。例如,当矩阵\(A\)与矩阵\(B\)相乘时,记生成的矩阵为\(C\),则\(c_{ij}\)表示\(A\)中的第\(i\)行和\(B\)中的第\(j\)列中的元素依次相乘并累加。那么,当矩阵\(A\)与矩阵\(B\)表示的是同一组对象(节点)间的关系\(R_A\)和\(R_B\)的存在时,则\(c_{ij}\)表示对象\(i\)和对象\(j\)通过1次关系\(R_A\)和1次关系\(R_B\)后能够产生关联的唯一路径数。特别地,如果矩阵\(A\)与矩阵\(B\)表示同一种关系,则\(c_{ij}\)表示对象\(i\)和对象\(j\)间距离为2的路径的总数。
注意,上述例子中的运算结果解释适用于01网络(Binary Network)。对于权重网络(Weighed Network),如果权重恒正时,则可以通过元\(c_{ij}\)是否大于0,来判断对象\(i\)和对象\(j\)是否有距离为2的路径。若权重有正有负,则该运算不能做上述解读。
网络的类型
网络的分类主要基于图的分类,主要有以下维度:
- 边包含的节点数:
- 二元网络:边连接2个点。
- 超网络:边连接3个及以上点。
- 边的方向性:
- 有向网络:例如出口贸易,\(i\)到\(j\)有出口,不代表\(j\)到\(i\)有出口。
- 无向网络:例如贸易,若\(i\)与\(j\)有贸易往来,一定有\(j\)与\(i\)有贸易往来。
- 边是否同质:
- 01网络:只考虑有没有。
- 权重网络:例如路网,从\(i\)到\(j\)有路,从\(j\)到\(k\)有路,但距离不一定相等。
一般而言,我们讨论的都是二元网络,超网络较为复杂。