数据库复杂网络构造算法及特征分析

第34卷第11期电子与信息学报 Vol.34No.11 2012年11月 Journal of Electronics & Information Technology Nov. 2012

数据库复杂网络构造算法及特征分析

李春芳*①③刘连忠②刘振国③

①(北京航空航天大学自动化科学与电气工程学院北京 100191)

②(北京航空航天大学计算机学院北京 100191)

③(河北体育学院网络中心石家庄 050041)

摘要:数据库复杂网络是对管理信息系统软件复杂性的一种度量,提供了一种精简的可视化业务逻辑描述,为软件增量设计提供了自说明文档。为抽取数据库复杂网络,提出了两种算法:(1)基于数据表主外键关联的网络构造算法;(2)基于隐性语义关联的构造算法及扩展算法。通过对9个软件数据库的分析,研究了该类网络的统计特性,发现其无标度特性入度分布比出度分布更不均匀,入度大的节点是系统的骨干节点。为精准构造直接辅助软件工程的数据库复杂网络,提出了针对语义隐性关联的一组命名规范。

关键词:管理信息系统;复杂网络;软件网络;数据库网络

中图分类号:TP311 文献标识码:A 文章编号:1009-5896(2012)11-2700-07 DOI: 10.3724/SP.J.1146.2012.00491

Algorithms and Features Analysis of Database Complex Networks

Li Chun-fang①③ Liu Lian-zhong② Liu Zhen-guo③

①(School of Automation Science and Electrical Engineering, Beihang University, Beijing 100191, China)

②(School of Computer Science and Engineering, Beihang University, Beijing 100191, China)

③(Network Center, Hebei Institute of Physical Education, Shijiazhuang 050041, China)

Abstract: DataBase Complex Networks (DBCN) is a kind of metric for management information systems, which provides a simplified and visualized description of business logic and a self-introduced documentary. To extract DBCNs, two algorithms are proposed: (1) based on the primary and foreign key associations of database tables algorithm; (2) based on the hidden semanteme associations algorithm and its extension. Through the analysis on 9 software databases, the statistical features of DBCN are investigated and found that in-degree distribution is more disperse than that of out-degree, and tables with greater in-degree are the backbone nodes. In order to accurately construct DBCN to facilitate the software engineering, a group of naming criteria is proposed for hidden semanteme associations.

Key words: Management Information System (MIS); Complex networks; Software networks; Database networks

1引言

数据库是各类管理信息系统(Management Information System, MIS)的数据核心。随着软件规模扩大,数据库的规模和关联复杂性相应增加。软件网络是软件复杂系统的骨架,而数据库复杂网络是业务系统内部关联性的骨架。在顶层设计中,主要是将业务内部的关联性映射为数据表之间的关联性,尽管业务系统的功能不可能全部在数据库设计中实现,但是显而易见,优化的数据库关联设计,能尽可能多地覆盖业务逻辑,减少系统实现的复杂

2012-04-26收到,2012-09-03改回

国家863计划项目(2005AA113040)和河北省高校自然科学基金(Z2010279)资助课题

*通信作者:李春芳 LCF1974@https://www.360docs.net/doc/411149508.html, 性和代码量。由于在数据表的基本字段确定后,非主键和非外键字段的添加和删除,不会影响其他的关联性,因此通过主键和外键建立数据表之间的复杂网络,作为对MIS系统宏观层面的描述是合理的。

从文献看,复杂网络的解释为,从实际复杂系统抽取的网络结构,具有明显的“无标度”和“小世界”特性,其网络特征介于随机网络和规则网络之间,即不是完全随机,也不完全规则。软件是一类人工复杂系统,复杂网络理论引入软件工程来描述和度量软件的复杂性,形成了软件网络[1]。软件网络主要探索了软件包级[2]、类级 、方法级 的网络构造和统计特征,以及软件的动态运行环境网络[7],从复杂网络角度探索了软件的宏观结构和软件度量[8,9]以及软件网络的应用 ,然而对软件网络的分支数据库复杂网络的研究较少。何克清

相关文档
最新文档