Summary
甲套件时空处理方法以分析人类的轨迹数据,如建模行人的空间 - 时间活动的目的,使用GPS设备收集。
Abstract
众所周知,人体运动的空间和时间维度,直接影响疾病传播的1-3。通常是通过感染者和易感个体重叠的活动空间之间的接触传播的传染病。因此,每日行动不便的活动信息可以用来作为一个指标来测量暴露感染危险因素。然而,一个主要的困难,因此产生的原因缺乏传染病传播的研究在微观尺度上缺乏详细的个人移动数据。此前在运输和旅游研究的详细时间的活动空间往往依赖于时间,空间日记的技术,它需要的主题,积极记录他们的活动在时间和空间上的数据。这是要求很高的从参与者参与者和协作极大地影响数据4的质量。
现代如GPS和移动通信的技术提供了可能的轨迹数据的自动采集。收集的数据,然而,这不是理想的模拟人类的空间 - 时间的活动,限制由现有设备的精度。也没有现成的工具是人类行为研究的数据的高效处理。在这里,我们提出了一套方法和一个集成的ArcGIS的轨迹数据的前处理和时空分析的基于桌面的可视化界面。我们提供的例子,这样的处理可以用来模拟人类的空间活动,特别是丰富的错误行人轨迹数据,这可能是有用的公共健康研究,如传染性疾病的传播模型。
程序包括前处理,轨迹分割,活动空间特征密度估计和可视化,和其他一些探索性的分析方法。前处理者g是喧闹的原始轨迹数据的清洗。我们引入交互式可视化前处理接口,以及一个自动的模块。弹道分割5涉及的室内和室外部分,从处理前的空间-时间轨迹的识别。同样的原因,交互式可视化分割和自动分割的支持。分段的时空轨迹进行分析,然后得出一个人的活动空间,如活动半径等密度估计和可视化的特点,是用来检查大量的轨迹数据模型的热点和互动。我们演示这两种密度的表面映射6和密度容积再现7。我们还包括一些其他的探索性数据分析(EDA)和可视化工具,如谷歌地球的动画支持和关联分析。一套分析以及视觉本文提出的方法可以适用于任何轨迹数据的s步伐活性的研究。
Protocol
1。获取数据
- 手持GPS装置,GPS功能的智能手机跟踪应用程序,以及A-GPS(辅助GPS)设备,如我们的研究中,一个商业儿童跟踪器轨迹数据可以被收集。
- 轨道数据通常保存在的时间,经纬度记录。所需的时间间隔应根据应用的需要。通常情况下,最频繁的时间间隔是需要时间的活动空间研究。
- 将数据转换为以逗号分隔的值,或单独记录的id列。csv文件,经度,纬度,时间,分别。然后转换。CSV文件导入到常用的地理信息系统(GIS)文件格式( 如 ESRI的shapefile 8)。
- 加载在shapefile中的建筑物多边形的轨迹分析仪的研究领域的边界。正确设置“挤出”的建筑的3D二张开,并设置“挤出”和“透明度”的边界层适当地显示空间-时间立方体6,9的x,y尺寸代表空间和z维度表示时间。
2。前处理
- 有两个选项可用于前处理嘈杂的原始轨迹数据。人们可以从下拉列表中的前处理菜单中进行选择。
- 如果选择“互动”,创建的二维投影的三维轨迹,便于查看和选择。操纵3D显示在空间和时间来检查原始轨迹。确定基于轨道段的形状,速度和/或拓扑的数据中的错误。通常不切实际的高速度或突然改变方向的轨道点(顶点)表示错误。选择并删除它们从原来的轨迹。选择并删除它们的三维轨迹或二维投影。
- 集群中的沙尖的轨迹点PES( 图1)空间和持续时间很长的时间表示,最有可能造成的室内GPS信号的地方是弱的错误。如果这些点的一组被选择时,该程序可以计算出的时空的选定点的质心和调整的轨道去通过质心。
- 另外,如果选择“自动”的前处理菜单,设置的输入和输出的位置,以及经验参数确定的异常高的速度和突然转弯点。程序加载的轨迹数据的搜索算法,模拟的视觉误差检测方法的基础上并自动运行。
3。轨迹分割的活动空间特征
- 的轨迹分割需要建立层,确保建筑形状文件被加载。
- 在工具栏上单击分割工具启动功能。设置的输入和输出,并位于文件作为参考层的建筑物形状。使用的的楼宇名称标签的分段轨迹。该算法识别的基础上设置或默认的标准,如速度,时间,轨迹点等 ,以及空间拓扑结构的建筑物的室内段。
- 单击活动空间总结工具加载在分段的轨迹,并计算选定的的摘要属性表征的一个人的活动空间,如总的活动半径,半径在一定的时间期间,花费的总时间在室内与室外的比,和等。
- 该属性可以被导出到电子表格定量建模使用。
4。密度表面映射
- 密度表面的活动空间与时间维的密度崩溃。有三个选项,从下拉列表中的密度表面映射菜单。
- 如果选择了“轨道点密度”选项,填写对话框中的输入和输出信息,并选择3D或2D显示。从该轨迹数据的所有顶点被用来计算内核密度的点, 图2示出了密度表面。
- 如果“轨道路径密度'被选择时,该算法计算并显示单个路径行驶( 图3)的密度。
- 如果'重新采样点的密度“选项被选择时,重新采样算法使用设定的时间间隔,和地图上的点的密度均匀地撒布在时间的轨迹数据。此选项被设计为,在不规则的时间间隔中,由于不同灵敏度的不同物理条件下的装置或分段轨迹收集跟踪点的跟踪设备, 图4示出了2D和3D的密度分段轨迹表面。
- 如果'时空聚焦'被选择用于纽约州的上述认股权,时空聚焦10可以在不同的时间段进行检查的活动模式。例如,在不同的时间在一天的活动密度表面可能是可视化的,便于识别跨越时间的热点( 图5)。
5。密度蓄积量估测,容积再现
- 密度体积可视化使用空间 - 时间立方体中的轨迹的可视化的概念。这种可视化的核心是分列的空间体素11。我们的可视化密度量的估计方法计数的时空轨道相交的体素数个人体素的密度量。此步骤可以点击“密度体积计算”下的密度体积可视化菜单。
- 相同的三个选项可用于密度体积可视化密度表面可视化。
- 下一步点击“音量渲染”推出的三维体积的可视化界面的交互式立体渲染12。通过设置沿每个轴的分割数,可以检查集群在不同的尺度。的Z-系数是用来设置垂直夸大,以便更好地观察。可以被加载的参考层,如建筑物,可视化以及帮助。的体绘制的结果,可以交互调整通过操纵控制映射的传递函数,从密度的颜色。 ( 图6)。
6。探索性数据分析(EDA)和可视化
- 过程是要显示在谷歌地球,可用于创建动画系列。在“其他”,点击“导出为KML为EDA访问此程序。它创建了一个KML 13在谷歌地球中打开的文件,互动式动画的轨迹。
- 一个可以遵循的轨迹,下移动在谷歌地球沿时间线滚动升的环境。
- 过程是可视化的地方利益之间的连接通过关联分析。例如,在大学校园的建筑物之间的连接是从分割的轨迹数据收集学生( 图7)。
- 根据上派生的连接,如楼宇最出站或入站流量和连接的枢纽,最繁忙的地方可能的热点。
Subscription Required. Please recommend JoVE to your librarian.
Representative Results
轨迹数据收集志愿本科学生肯恩大学(NJ,USA)在2010年春季。其目的是研究谁抓住了流感(医生诊断或自我诊断)相比,那些谁没有学生的活动模式。为了说明本文提出的方法和程序,我们把收集的轨迹在郊区的校园面积,产生具有代表性的结果。校园内的区域大多是行人的运动轨迹轨迹,只有一小部分驾驶之间的各种停车场和校园外的。
参照大学校园的建筑物的轨迹的空间-时间立方体表示在图1中示出图1A中是学生记录1天他的活动在校园使用AGPS的移动设备(商业的子跟踪器所收集的原始数据) 。这是OB,vious,一些室内停留的时间长导致在嘈杂的数据(所指示的轨道的高低不平部)。在行人的轨迹数据,这是很常见, 图1B示出的预加工和分段轨迹, 图1C示出了带有颜色编码的室内和室外部分中的空间-时间立方体处理前和分段轨迹。
图2至4示出了一组轨迹的密度表面映射, 图2示出了涉及到执行“轨迹点密度映射选项”( 图2A),所得到的密度图( 图2B)的原始跟踪点。不是映射跟踪点的密度, 图3的地图的行驶路径的密度。密度映射分析是特别有用的,当大量的轨迹图4A显示共470轨迹。图4B和4C示出了在2D(左)(右)和3D表示使用来自这些轨迹的重新采样点的密度表面。
在除了在空间-时间的多维数据集的时间维度的交互显示,时间变量可以通过时间聚焦检查空间模式在不同的时间段进行处理, 图5示出了这样的分析的例子,使用的样本数据集,其中包含轨迹数据收集学生在流感季节。很明显,他们的活动都围绕在一天的不同位置,最终导致复合活动密度图的底部。
密度体绘制的一个例子示出在图6中, 图6A示出,它是很难检测到的模式,如果所有的空间-时间的轨道是可视化在空间-时间立方体,因为对于UAL密集杂波图6B示出了相应的密度体积渲染结果。四个插图代表我们的密度渲染程序的传递函数的不同的设置,从而突出显示在不同的频率范围内的密度的卷。
另一种方式是通过关联分析,发现热点。 图7给出了这样的分析结果与我们的样本数据集。 图7显示了在校园内的所有建筑物之间的直线连接。突出的建筑是最高的出站通信量。 图7B显示了相同的连接,最繁忙的连接突出。
图1。预加工和节段 tation的轨迹数据。 答 :二维视图的背景校舍原始轨迹; B:预加工轨迹; C:空间-时间立方体代表的分割的轨迹。 点击这里查看大图 。
图2。密度表面映射A:原始轨迹点的轨迹数据集B:来自轨迹点的密度表面。
图3。密度表面的轨迹路径。
130fig4.jpg“ALT =”图4“FO:内容宽度=”4英寸“的FO:src =”/ files/ftp_upload/50130/50130fig4highres.jpg“/>
图4。彩色密度表面映射。A:共470轨迹B:在2D中的彩色密度表面C:在三维表面的彩色密度。 点击此处查看大图 。
图5。时间聚焦密度映射:校园学生活动密度在不同的时间段。
图6。密度体绘制和visualizat离子。A:视觉杂波的导致从原材料轨迹; 乙 :,时空所强调的可视化密度量在不同频率范围的群集。 点击此处查看大图 。
图7。连接的分析结果。A:来自轨迹数据,访问量最大的建筑突出在大学校园里的所有建筑物的直线之间的连接; B:最繁忙的校园建筑物之间的连接。 点击此处查看大图 。
图8。段的学生的活动日记记录。
图9所示。两组学生的活动密度模式。A:活动:活动密度密度模式的学生有轻度流感症状的流感季节期间,B模式学生流感症状更为显着。
图10。根据学生的轨迹数据的关联分析结果了显着的流感症状的流感季节期间。 答 :访问量最大的建筑突出建筑与直线之间的连接; B:学生有流感所采取的最繁忙的连接。 点击此处查看大图 。
Subscription Required. Please recommend JoVE to your librarian.
Discussion
我们使用附加的机制的ArcGIS开发的接口。所有的交互操作,使用C + +。使用Python开发的自动处理和分析功能。
AGPS数据,或行人所收集的GPS数据的预处理,提出了独特的挑战,,由于邻接建筑物和频繁的室内站的错误可能是巨大的。此外,预处理的重点不应该是数据通常是车辆GPS轨迹数据由于稀缺的跟踪点已经明显减少。最明显的错误行人轨迹数据的模式,但是,提供独特的解决方案进行预处理。而不是使用标准的预处理算法14,我们开发了启发式方法人工视觉误差检测方法中提到的2.2)(2.3),模仿和清理的轨迹数据中的错误。具体而言,它计算属性(速度和二rection)每个轨迹点的轨迹第一。不切实际的高的速度和/或方向的变化的跟踪点被删除。然后,它重新计算为每个其它的跟踪点的属性(持续时间和方向的变化),并检测高低不平的形状(方向突然变化的一系列轨迹点)的跟踪点的群集。最后,每个群集的时空质心计算和减少和调整要经过的质心的轨迹。
使用传统的活动日志数据的自动处理和轨迹分割算法进行了评估。 10位学生被招携带AGPS收集的轨迹数据,并在同一时间被要求积极地记录他们的停止和运动。在图8中示出一个典型的活动日志的部分的。为期三天的实验产生的轨迹。处理前和分段的轨迹相比日志数据。结果表明:1)加工轨迹捕获大部分的室内活动; 2)记录的轨迹数据的时间更准确,经常写日记考生粗略估计的时间; 3)轨道数据捕获所有的细节的走道路径,而直线连接可以从日志数据,4)一些活动从日记中的数据丢失,参与者往往跳过记录的负担。但是,我们的方法的一个限制是,分段轨迹数据有时误标室内段在一个错误的建筑,特别是当两个建筑物连接到对方,这是在我们的实验中的建筑物的情况下的一些。关于这方面的算法的改进是必要的。
密度表面映射探索活动模式是一种有效的工具,尤其是当涉及大量的轨迹数据。 图4表明,大民BER的轨迹明显的视觉上的混乱,如果在其原来的形式显示,而密度映射揭示了有趣的图案。这个简单的应用程序使用的数据收集在2010年的流感季节肯恩大学校园进行。学生得了流感和学生谁也不会产生两套轨迹。学生进行了采访,他们的症状的严重程度。 图9显示了两个组的学生,一个表示只有轻微症状( 图9A),另一个显示出更为显着( 图9B)的活动密度模式。值得注意的是,真正的患病学生的活动空间往往围绕一个特定的建筑群。进行进一步调查,以确定这种分组的原因。这个实验表明,该方法有可能在轨道数据,揭示隐藏的图案。
以上nsity表面的地图,然而,塌陷的时间维度。密度体积可视化使用空间的立方体的概念,代表空间和时间维度。 图6表明,这种可视化,有效地处理视觉杂乱的问题。一旦交互式的,它允许一个操纵渲染,以突出显示不同的频率范围中的数据,来检测模式。一个限制,但是,我们目前的做法是,所呈现的量似乎并不完全顺利。我们在提高密度估计算法来处理这个问题的过程中,。要考虑的一个因素是,内核密度估计可改善视觉效果,但运算时间会变得更长。顺序的内核密度估计可能是另一种选择,我们将进行调查。
除了检测活动在时间和空间上的集群(热点),米ethod我们介绍,在7.2检测到另一个热点,是关系到地方之间的连接。再次,根据我们的数据收集学生的流感季节期间,进行关联分析,以识别那些强有力的校园建筑之间的连接基础上的所有轨道数据( 图7),以及那些代表学生表现出显着的流感症状( 图10)。比较这两个数字,我们看到一个连接之间的大学中心的建设和另一个叫CAS建设似乎是一个强大的连接一般( 图7),但缺少一套紧密的联系,为患病学生( 图10)。两个强大的连接保持,后者是一个大学中心和科技大厦和另一间科技大厦,亨宁斯厅和Hutchinson厅之间。了解这些校园建筑指标工商业污水附加费,大学中心是最繁忙的停在校园内一间自助餐厅和娱乐室里面。这可能是一个潜在的高风险中心在流感季节时,师生互动与每一个在很长一段时间在一个拥挤的空间。还了解到,在第二个连接的建筑物室内的途径都连接到对方。这些建筑有教室,学生可以花很多时间在室内上课,而不必到外面去的建设。这些建筑都与老人的通风系统,可以提高呼吸系统疾病传播的风险也相对较老的建筑。 CAS的建筑,出现在图7中的连接,但在图10中,另一方面,是一座崭新的建筑,并表示自己在大的开放空间。良好的通风和学生活动涉及户外的时间段上课时,在别处Ë都可能会导致较低的风险。这些,当然猜测,但证明这种分析,如本文中介绍的其他方法,可以是一个有益的探索性分析工具,揭示隐藏的图案。这个包,但绝不包括所有可能有用的轨迹数据分析的方法。我们保持我们未来的努力发展,并把更多的分析以及可视化功能集成到我们的系统。
Subscription Required. Please recommend JoVE to your librarian.
Disclosures
没有利益冲突的声明。
Acknowledgments
这项工作的经费由美国国立卫生研究院授予1R03AI090465。
Materials
Name | Company | Catalog Number | Comments |
WorldTracker GPRS | Tracking The World | ||
A personal computer for running the analysis | |||
ArcGIS software | ESRI | ||
Trajectory Analyzer Extension |
References
- Stoddard, S. T., Morrison, A. C., et al. The role of human movement in the transmission of vector-borne pathogens. PLoS Negl. Trop. Dis. 3 (7), e10 (2009).
- Morens, D. M., Folkers, G. K., et al. The challenge of emerging and re-emerging infectious diseases. Nature. 430, 242-249 (2004).
- Viboud, C., Bjornstad, O. N., et al. Synchrony, waves, and spatial hierarchies in the spread of influenza. Science. 312, 447-451 (2006).
- Shoval, N., Isaacson, M. The Application of tracking technologies to the study of pedestrian spatial behaviour. The Professional Geographer. 58 (2), 172-183 (2006).
- Yu, H. Spatio-temporal GIS design for exploring interactions of human activities. Cartography and Geographic Information Science. 33 (1), 3-19 (2006).
- Kwan, M. Interactive geovisualization of activity-travel patterns using three-dimensional geographical information systems: a methodological exploration with a large data set. Transportation Research Part C. 8, 185-203 (2000).
- Demšar, U., Virrantaus, K. Space-time density of trajectories: exploring spatio-temporal patterns in movement data. International Journal of Geographical Information Science. 24 (10), 1527-1542 (2010).
- ESRI Shapefile Technical Description [Internet]. , Environmental Systems Research Institute, Inc. Available from: http://www.esri.com/library/whitepapers/pdfs/shapefile.pdf (1998).
- Kraak, M., Koussoulakous, A. A visualization environment for the space-time cube. Fisher, P. Proceedings of 11th International Conference on Developments in Spatial Data Handling, Berlin, , Springer. 189-200 (2004).
- Visualizing spatial relationships among health, environmental, and demographic statistics: interface design issues. MacEachren, A. M., Polsky, C., et al. Proceedings of 18th International Cartographic Conference, , 880-887 (1997).
- Levory, M. Display of surfaces from volume data. IEEE Computer Graphics and Application. 8 (5), 29-37 (1998).
- Drebin, R. A., Carpenter, L., et al. Volume Rendering. Computer Graphics. , (1998).
- KML | OGC(R) [Internet]. , Open Geospatial Consortium, Inc. Available from: http://www.opengeospatial.org/standards/kml/ (2012).
- Lee, W., Krumm, J. Trajectory preprocessing. Computing with Spatial Trajectories. Zheng, Y., Zhou, X. , Springer, Bucher. 3-34 (2011).
- Han, B., Comaniciu, D., et al. Sequential kernel density approximation and its application to real-time visual tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence. , (2007).