社会网络分析法——笔记01
2014-04-24 08:16阅读:
社会网络基本概念:
1) 度数。在社会网络图中, 如果两个点由一条线相连,
则称这两个点为“相邻的”。与某点相邻的那些点称为该点的“邻点”, 一个点ni的邻点的个数称为该点的“度数” (Nodal
Gegree) , 记做d ( ni ) , 也叫关联度。
在无向网络中, 一个点的度数就是与该点相连的线的条数。在有向网络中, 点的度数分为点入度和点出度。一个
点的点出度是网络中以该点为起点的有向边的数目, 点入度是网络中以该点为终点的有向边的数目。
2) 密度。密度(Density) 是社会网络分析最常用的一种测度,
是图论中一个得到广泛应用的概念。密度是网络中实际存在的关系数目与可能存在的最多关系数目之比。如果一个网络的密度为1,
则意味着该网络中的每个点都和其他点相连, 反之, 若该网络的密度为0, 则意味着该网络中任何点都不相连
。密度表达的是网络中点之间关系的紧密程度。对一个规模确定的网络来说, 点之间的连线越多, 则该图的密度越大。
3) 捷径。捷径(Geodesics, 也译为测地线) 即两点之间最短的途径。在图1 中, a—f—b,
a—f—e—b, a—f—e—d—c—b都是途径。a—f—b经过了2条线, a—f—e—b经过了3条线,
而a—f—e—d—c—b则经过了5
条线, 因此a—f—b为从a到b的捷径。
4)
距离。两点之间的捷径的长度叫做两点之间的距离。因此图1中a和b之间的距离为2。如果两点之间不存在途径,
即两点之间不存在直接关系, 也不能通过其他点建立其联系, 则称两者之间的距离是无限的。
5) 关联图。如果在一个网络图中, 在任何一对节点之间都存在途径使之相连,
则此图是关联图(Conn
ected Graph) 。图1就是一个关联图。如果一个图不是关联的, 则称之为“不关联图” (Dis2connected
Graph) 。
2 社会网络分析法的分析角度
社会网络分析法可以从多个不同角度对社会网络进行分析, 包括中心性分析、凝聚子群分析、核心—边缘结构分析以及结构对等性分析等,
这里仅介绍前3种。
2.1 中心性分析
“中心性”是社会网络分析的重点之一。个人或组织在其社会网络中具有怎样的权力,
或者说居于怎样的中心地位, 这一思想是社会网络分析者最早探讨的内容之一。个体的中心度(Centrality)
测量个体处于网络中心
的程度, 反映了该点在网络中的重要性程度。因此一个网络中有多少个行动者/节点, 就有多少个个体的中心度。
除了计算网络中个体的中心度外, 还可以计算整个网络的集中趋势(可简称为中心势) (Centralization)
。与个体中心度刻画的是个体特性不同, 网络中心势刻画的是整个网络中各个点的差异性程度,
因此一个网络只有一个中心势。根据计算方法的不同, 中心度和中心势都可以分为3种: 点度中心度/点度中心势, 中间中心度/中间中心势,
接近中心度/接近中心势。
2.1.1 点度中心性
在一个社会网络中, 如果一个行动者与其他行动者之间存在直接联系, 那么该行动者就居于中心地位,
在该网络中拥有较大的“权力”。在这种思路的指导下, 网络中一个点的点度中心度, 就可以网络中与该点之间有联系的点的数目来衡量,
这就是点度中心度。
网络中心势指的是网络中点的集中趋势, 它是根据以下思想进行计算的: 首先找到图中的最大中心度数值; 然
后计算该值与任何其他点的中心度的差, 从而得出多个“差值”; 再计算这些“差值”的总和; 最后用这个总和
除以各个“差值”总和的最大可能值。
2.1.2 中间中心性
在网络中, 如果一个行动者处于许多其他两点之间的路径上, 可以认为该行动者居于重要地位,
因为他具有控制其他两个行动者之间的交往能力。根据这种思想来刻画行动者个体中心度的指标是中间中心度,
它测量的是行动者对资源控制的程度。一个行动者在网络中占据这样的位置越多, 就越代表它具有很高的中间中心性,
就有越多的行动者需要通过它才能发生联系。
中间中心势也是分析网络整体结构的一个指数,
其含义是网络中中间中心性最高的节点的中间中心性与其他节点的中间中心性的差距。该节点与别的节点的差距越大,则网络的中间中心势越高,
表示该网络中的节点可能分为
多个小团体而且过于依赖某一个节点传递关系, 该节点在网络中处于极其重要的地位。
2.1.3 接近中心性
点度中心度刻画的是局部的中心指数, 衡量的是网络中行动者与他人联系的多少,
没有考虑到行动者能否控制他人。而中间中心度测量的是一个行动者“控制”他人行动的能力。有时还要研究网络中的行动者不受他人“控制”的能力,
这种能力就用接近中心性来描述。在计算接近中心度的时候, 我们关注的是捷径,
而不是直接关系。如果一个点通过比较短的路径与许多其他点相连, 我们就说该点具有较高的接近中心性。
对一个社会网络来说, 接近中心势越高, 表明网络中节点的差异性越大, 反之, 则表明网络中节点间的差异越小。
2.2 凝聚子群分析
当网络中某些行动者之间的关系特别紧密,
以至于结合成一个次级团体时, 这样的团体在社会网络分析中被称为凝聚子群。分析网络中存在多少个这样的子群, 子群内部成员之间关系的特点,
子群之间关系特点, 一个子群的
成员与另一个子群成员之间的关系特点等就是凝聚子群分析。由于凝聚子群成员之间的关系十分紧密,
因此有的学者也将凝聚子群分析形象地称为“小团体分析”。
2.2.1 凝聚子群
根据理论思想和计算方法的不同, 存在不同类型的凝聚子群定义及分析方法。
1) 派系(Cliques) 。在一个无向网络图中,
“派系”指的是至少包含3个点的最大完备子图。这个概念包含3层含义: ①一个派系至少包含三个点。②派系是完备的,根据完备图的定义,
派系中任何两点之间都存在直接系。③派系是“最大”的, 即向这个子图中增加任何一点,
将改变其“完备”的性质。有向网络中派系的概念
十分严格, 这里不再介绍。
2) n2派系( n2Cliques) 。对于一个总图来说,
如果其中的一个子图满足如下条件, 就称之为n2派系: 在该子图
中, 任何两点之间在总图中的距离(即捷径的长度) 最大不超过n。从形式化角度说, 令d ( i, j)
代表两点ni和nj在总图中的距离, 那么一个n2派系的形式化定义就是一个满足如下条件的拥有点集N s的子图, 即: d (
i,j)≤n, 对于所有的ni , nj ∈Ns 来说, 在总图中不存在与子图中的任何点的距离不超过n的点。
3) n2宗派( n2Clan) 。所谓n2宗派( n2Clan)
是指满足以下条件的n2派系, 即其中任何两点之间的捷径的距离
都不超过n。可见, 所有的n2宗派都是n2派系。
4) k2丛( k2Plex) 。一个k2丛就是满足下列条件的一个凝聚子群, 即在这样一个子群中, 每个点都至少与除了
k个点之外的其他点直接相连。也就是说, 当这个凝聚子群的规模为n时, 其中每个点至少都与该凝聚子群中n -
k个点有直接联系, 即每个点的度数都至少为n - k。
2.2.2 凝聚子群密度
凝聚子群的密度( External2Inter2nal Index, E2I Index)
主要用来衡量一个大的网络中小团体现象是否十分严重。这在分析组织管理等问题时十分有用。最糟糕的情形是大团体很散漫,
核心小团体却有高度内聚力。另外一种情况就是大团体中有许多内聚力很高的小团体, 很可能就会出现小团体间相互斗争的现象。
凝聚子群密度的取值范围为[ - 1, + 1 ]。该值越向1靠近, 意味着派系林立的程度越大; 该值越接近- 1,
意味着派系林立的程度越小; 该值越接近0, 表明关系越趋向于随机分布, 看不出派系林立的情形[ 5 ]。
E2I Index可以说是企业管理者的一个重要的危机指数。当一个企业的E2I Index过高时,
就表示该企业中的小团体有可能结合紧密而开始图谋小团体私利, 从而伤害到整个企业的利益。其实E2I
Index不仅仅可以应用到企业管理领域, 也可以应用到其他领域, 比如用来研究某一学科领域学者之间的关系。如果该网络存在凝聚子群,
并
且凝聚子群的密度较高, 说明处于这个凝聚子群内部的这部分学者之间联系紧密, 在信息分享和科研合作方面交往频繁,
而处于子群外部的成员则不能得到足够的信息和科研合作机会。从一定程度上来说, 这种情况也是不利于该学科领域发展的。
2.3 核心—边缘结构分析
核心—边缘(Core2Periphery)
结构分析的目的是研究社会网络中哪些节点处于核心地位, 哪些节点处于边缘地
位。核心边缘结构分析具有较广的应用性,
可用于分析精英网络、科学引文关系网络以及组织关系网络等多种社会现象中的核心—边缘结构。
根据关系数据的类型(定类数据和定比数据) , 核心—边缘结构有不同的形式。定类数据和定比数据是统计学中的基本概念, 一般来说,
定类数据是用类别来表示的,通常用数字表示这些类别, 但是这些数值不能用来进行数
学计算; 而定比数据是用数值来表示的, 可以用来进行数学计算[ 6 ]。如果数据是定类数据, 可以构建离散的核心—边缘模型;
如果数据是定比数据, 可以构建连续的核心—边缘模型。而离散的核心—边缘模型根据核心成员和边缘成员之间关系的有无及关系的紧密程度,
又可分为3种:①核心—边缘全关联模型; ②核心—边缘局部关联模型;③核心—边缘关系缺失模型。
如果把核心和边缘之间的关系看成是缺失值,
就构成了核心—边缘关系缺失模型。这里介绍适用于定类数据的4种离散的核心—边缘模型。
1) 核心—边缘全关联模型。网络中的所有节点分为两组,
其中一组的成员之间联系紧密, 可以看成是一个凝聚子群(核心) , 另外一组的成员之间没有联系,
但是,该组成员与核心组的所有成员之间都存在关系。
2) 核心—边缘无关模型。网络中的所有节点分为两组,
其中一组的成员之间联系紧密, 可以看成是一个凝聚子群(核心) , 而另外一组成员之间则没有任何联系,
并且同核心组成员之间也没有联系。
3) 核心—边缘局部关联模型。网络中的所有节点分为两组,
其中一组的成员之间联系紧密, 可以看成是一个凝聚子群(核心) , 而另外一组成员之间则没有任何联系,
但是它们同核心组的部分成员之间存在联系。
4) 核心—边缘关系缺失模型。网络中的所有节点分为两组,
其中一组的成员之间的密度达到最大值, 可以看成是一个凝聚子群(核心) , 另外一组成员之间的密度达到最小值,
但是并不考虑这两组成员之间关系密度, 而是把它看作缺失值。