《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > 通话社交网络社团结构实证研究
通话社交网络社团结构实证研究
来源:微型机与应用2013年第4期
王 林,童昭维
(西安理工大学 自动化与信息工程学院,陕西 西安710048)
摘要: 以社交网络中备受关注的通话社交网络为研究对象,对其社团结构进行分析。提出一种基于模糊综合评判分析通话社交网络权重的方法,并改进CNM算法进行社团划分。初步演示了通话社交网络的演化规律,为深入研究通话社交网络打下了坚实基础。
Abstract:
Key words :

摘  要: 以社交网络中备受关注的通话社交网络为研究对象,对其社团结构进行分析。提出一种基于模糊综合评判分析通话社交网络权重的方法,并改进CNM算法进行社团划分。初步演示了通话社交网络的演化规律,为深入研究通话社交网络打下了坚实基础。
关键词: 通话社交网络;加权网络模糊综合评判方法;社团结构;改进的CNM算法

    虽然现实世界的复杂系统形式、功能各不相同,但其对应的网络结构却有很大的相似性。从个体层面的度、聚集系数,到整体层面的度分布、整体聚集系数等,处于中间的描述就是社团结构描述。借助复杂网络理论分析方法,科学家们成功地研究了社交网络。Onnela[1-2]从工作、家庭、休闲等方面分析了社交网络的结构,由此发现相互连接的强度和网络局域结构的关系。Szabo和Barabasi[2]研究表明由不同的通话网络发现两个不同地区的同一社交网络具有或强或弱的社团隔离效应的共性。Palla、Barasi和Vicsek[3-4]通过通话数据研究社会群体的演变发现。利用复杂网络理论分析社交网络拓扑性质并进行社团分解为进一步揭示通话社交网络的演化规律打下了基础。
    社团结构划分算法的研究发展至今取得了很大的进展。早期的研究包括Kernighan-Lin算法、谱平分法和分级聚类方法等[5]。但在大规模及超大规模的网络社团结构分析中,算法时间复杂度和精确度的矛盾一直未能解决。目前,事先在不知道社团数目的情况下,最快算法的时间复杂度为O(nlog2n)[6]。通话社交网络属于大规模加权网络,其中权重的分布是研究该网络的重要因素之一。本文提出一种基于模糊综合评判的方法来评价通话网络的权重,同时改进CNM算法使其适用于加权网络,并对现实加权通话社交网络进行实证研究。
1 通话社交网络建模
    随机抽取某月某地发生通话行为的号码对。通话网络本身是一个有向网络,但若将此网络视为信息网络用作信息交流时,可把它当作无向网络。将通话加权网络中的用户抽象为图的节点,只要两个节点间有一次通话,就用一条边相连(即图的边)。考虑实验机器的运行速度,抽取某运营商2011年1月某地通话数据,其中包含的节点数为344 522,边数为697 489。通过计算通话数据中的通话时长、次数、频度等特性以建立加权通话网络模型。该加权通话网络反应某地区特定时间内基于各种社会关系进行过信息交流的状态。
    构建的通话社交网络抽象为由点集N和边集M组成的图G=(V,E),其中节点数N=|V|=344 522,边数M=|E|=697 489。由于网络规模较大,考虑到相关工具的局限性,取部分节点与边建立模型,如图1所示。

    由于从某运营商所获得的大量实验数据中包含外网的用户,故在建立移动通信关系网时不能较好地描述用户间通话关系。建立移动通信关系网络时,应滤掉外网联系记录,只保留网内通话联系记录,确保网络社团的正确性,避免其偶然性。为反映用户真实的通话行为,排除电话销售和错误拨号的行为。同时去除每次通话时长小于3 s的记录和服务号码。当然这些做法会造成一些负面影响,但由于研究的时间跨度相对较长,所以造成的影响是有限的。
2 基于模糊综合评判的通话社交网络权重计算
2.1 加权网络权重定义

    加权网络中每条边都具有度量连接强弱度的数值,为复杂网络节点间的关系和互相作用提供精确的描述方式。
    目前加权网络有两种表示权重的方式:相似权和相异权[7]。相似权的权重表示权重越大,节点间的关系越紧密,两节点之间的距离就越小。相异权则相反,权重越大,两点间的关系越疏远;权重越小则关系越紧密。通常权重定义方式有以下3种[8-9]。
    (1)常数权重
    若加权采用常数权重分布,即网络中的每条边权重均相等且为常数。由此可知,二元网络是一种特殊的加权网络。
    (2)服从指数分布的边权重
    假设边的权重服从指数分布,即φ(θ)=θe-θx,其中θ>0。服从指数分布的样本值均大于零,它与实际网络中边权重均大于零的情形一致。
    (3)节点度乘积函数的边权重
    设节点i与节点j的度分别为ki和kj,则连接这两个节点的边权重定义为:wij=(ki kj)α,其中α可有效地调节节点的强度大小。
2.2 通话社交网络权重
    本文研究的通话社交网络相似权wij范围为[0,∞),也可归一化到[0,1]。由于该网络的权值由通话频度、通话时长、通话次数等几方面共同决定,以上方法难以准确描述其权重,下面提出一种基于模糊综合评判的方法[10]对其权重进行定义。首先介绍模糊综合评判方法的思想。
    模糊综合评判是对多种因素影响的事物做出全面评价的一种有效的多因素决策方法。设U={u1,u2,…,un}为n种因素(或指标),V={v1,v2,…,vm}为m种评判(或等级)。

 



    图3所示为3种算法在时间复杂度方面的对比。GN

    本文基于某地的通话数据记录建立了一个大型的社交网络,并将模糊综合评判方法合理地应用于所构建的通话社交网络边权计算及评价中。为进一步分析社会网络的演化打下坚实的基础。
参考文献
[1] ONNELA J P,SARAMAKI J,HYVONEN J,et al.Analysis of a large-scale weighted network of one-to-one human  communication[J].New Journal of Physics,2007,9(6):179-184.
[2] ONNELA J P,SARAM KI J,HYVONEN J,et al.Structure  and tie strengths in mobile communication networks[J]. PNAS,2007,104(18):7332-7336.
[3] SZABG,BARABSI A.Preprint physics[S].2006.
[4] PALLA G,BARABASI A L,VICSEK T.Quantifying social  groupe volution[J].Nature,2007(446):664-667.
[5] 解,汪小帆.复杂网络中的社团结构分解算法研究综述[J].复杂系统与复杂性科学,2005(3):12.
[6] 骆志刚,丁凡,蒋小舟,等.复杂网络社团发现算法研究新进展[J].国防科技大学学报,2011,33(1):47-52.
[7] 田柳,迪增加,姚虹.权重分布对加权网络效率的影响[J]. 物理学报,2011,60(2):1-5.
[8] 姚尊强,尚可可,许小可.加权网络常用统计量[J].上海理工大学学报,2012,34(1):18-26.
[9] 覃森,戴冠中,王林,等.不同权重定义下的静态与动态加权网络的比较分析[J].西北工业大学学报,2007,25(5):672-676.
[10] 杨永萍,李宝栋,常文春.基于模糊综合评判方法的研究及应用[J].兰州工业高等专业学报,2006,13(3):49-52.

此内容为AET网站原创,未经授权禁止转载。