摘 要: 空间联机分析处理技术将GIS与联机分析处理技术OLAP相结合,提供在空间维度上进行不同尺度钻取的解决方案——SOLAP。在SOLAP的基础上,进一步考虑时间维度,设计了雪花模式的案事件时空数据立方体,通过对目标数据的切片、旋转、钻取等操作,分别基于案发地空间维度、案发时间维度和时空多个维度进行分析,探索案事件在时空上的分布规律,并结合二维颜色矩阵图、二维等值区域图、雷达图等图表对分析结果进行可视化展示,为公安机关犯罪预防、警力配置等决策提供技术支持。
关键词: OLAP;数据立方体;数据仓库;案事件时空分析
研究表明,犯罪在地理时空分布并不均匀,而是表现出一定的时空聚集特性,这种聚集性常用“犯罪热点”来表述[1]。通常犯罪现象高度集中的时段或区域就是犯罪热点。随着我国经济的发展和社会的转型,犯罪急剧增加,治安形势日益严峻[2],如何有效地找到犯罪热点,科学地配置警力资源,提高警务工作效率是一个值得研究的课题。
早在18世纪中期,就有国外学者将地理学与犯罪研究相结合。犯罪地理学从诞生到现在一共经历了4个发展时期:地理环境决定论、环境决定论、芝加哥犯罪学派、犯罪行为学派。20世纪90年代,地理信息系统GIS(Geographic Information System)被引入到犯罪地理学的研究中[3-4]。GIS的聚类分析、邻近分析等空间统计分析方法在犯罪地理学的研究中发挥了重大的作用,为犯罪地理学提供了新的技术方法[4-5]。
联机分析处理OLAP(Online Analytical Processing)是在数据仓库的基础上实现快速多维分析的商务智能技术[6]。空间联机分析处理技术SOLAP(Spatial OLAP)将GIS与OLAP相结合,提供一个进行空间维度上不同尺度的自动钻取的解决方案,实现各类空间联机分析,为用户提供更加全面灵活的空间决策支持[7-9]。本文在SOLAP的基础上进一步考虑时间维度,设计适合案事件时空分析的时空数据立方体及数据模型,通过对目标数据的切片、旋转、钻取等OLAP操作分析案事件的时空分布规律,并且以一种直观易懂的形式将分析的结果进行可视化展现,为公安机关打击和预防犯罪提供决策支持,为警力配置提供依据。
1 案事件时空数据立方体
为了满足用户从多角度进行数据查询分析的需求,需要建立一个基于事实和维的数据库模型——多维数据模型。常见的多维数据模型有星型模型和雪花模型。星型模型的维度表是非规范化的,往往会造成数据冗余,使事实表变得臃肿。通过对星型模型的进一步层次化可以得到雪花模型。公安案事件数据层级结构较为复杂,且属性数据间多对多关系比较多,例如,不同类型的案件可能发生在不同的警区,不同警区需要处理不同类型的案件。为了减少数据冗余,提高查询性能,本文选择雪花模型来组织公安案事件的数据,如图所示。
基于多维数据模型,进行案事件时空数据立方体的维度和度量的设计。维度指观察对象的角度,比如案发时间、案发地、案件类别等;度量是与多个维度交叉的测度,如案事件数量。可以用一组视图表示维度和度量的多种组合,
2 案事件时空分析
基于上述案事件时空数据雪花模型和数据立方体,建立案事件时空数据仓库,通过上卷、下钻、切片、切块等操作及其组合和各种可视化形式,即可进行基本的犯罪时空分析。
2.1 基于案发地空间维度的分析
利用案发地维度的上卷、下钻操作,可以直接获得不同空间维度的各类案事件数量。还可以根据案发地的地理坐标,将其“撒点”到行政区划地图或警务辖区地图,分析案事件的空间分布情况,得到不同空间维度的案事件分布“撒点图”,如图所示。
2.2 基于案发时间维度的分析
利用案发时间维度的上卷、下钻操作,可以直接获得不同时间维度的各类案事件数量。
也可以通过二维颜色矩阵图、二维等值区域图(二者皆用颜色的饱和度大小表示案事件数量的多少),或者用雷达图(用从圆心到曲线的距离大小表示案件数量的多少)分析案事件的高发时段。
根据案发时间和“撒点图”,还可以通过时间轴的形式分析案事件的空间分布随时间(如不同年份、不同月份、不同季度、周一到周日、一天中的不同时段等)的变化;也可以通过上卷、下钻操作得到不同时间维度的犯罪分布状况。如图8所示,可以通过基于犯罪年历的时间选择进行“年—月—日”的下钻操作,分别得到某年、某月直至某天的案事件分布“撒点图”。
2.3 基于时空多个维度的分析
例如,如果需要获得某时刻各个区域案事件的数量,可以按照时间维度进行切片操作。行政区划维度选择“县(市、区)”字段,时间维度选择“时”字段,用从红色到绿色的双色渐变方式表示案事件数量从多到少,形成如图所示的二维颜色矩阵,从中可以发现各县(市、区)案事件的高发时段。
公安案事件数据量非常大,用手工方式或传统的基于数据库的查询方式分析起来比较复杂。本文提出基于OLAP的犯罪时空分析,可以从时间、空间等多维角度对案事件数据进行查询分析,辅之以地图和图表对结果进行可视化展现,为公安机关打击和预防犯罪、科学配置警力等决策提供技术支持。
参考文献
[1] 陆娟,汤国安,张宏,等.犯罪热点时空分布研究方法综述[J].地理科学进展,2012,31(4):419-425.
[2] 姜博,任亚丁.警力资源配置问题浅析[J].北京人民警察学院学报,2004,16(3):59-62.
[3] 孙峰华,毛爱华.犯罪地理学的理论研究[J].人文地理,2003,18(5):70-74.
[4] 孙峰华,魏晓.犯罪地理学研究的新进展[J].人文地理,2004,19(5):60-63.
[5] 刘大千,修春亮.国内外犯罪地理学研究进展评析[J].人文地理,2012,27(2):38-44.
[6] 杨光,张雷,艾波.数据仓库及联机分析处理技术[J].计算机工程与科学,2000,22(1):39-42.
[7] RIVEST S, BEDARD Y, MARCHAND P. Toward better support for spatial decision making: defining the characteristics of spatial on-line analytical processing (SOLAP)[J]. GEOMATICA-OTTAWA-,2001,55(4): 539-555.
[8] RIVEST S, B?魪DARD Y, PROULX M J, et al. SOLAP technology: merging business intelligence with geospatial technology for interactive spatio-temporal exploration and analysis of data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2005, 60(1): 17-33.
[9] MIK?譒OVSK?譭 P, KOUBA Z. GOLAP-geographical online analytical processing[C]. Database and Expert Systems Applica-tions, Springer Berlin Heidelberg, 2001: 442-449.