DB5201-T 137-2024 基于移动通信数据的居民出行调查技术规范_第1页
DB5201-T 137-2024 基于移动通信数据的居民出行调查技术规范_第2页
DB5201-T 137-2024 基于移动通信数据的居民出行调查技术规范_第3页
DB5201-T 137-2024 基于移动通信数据的居民出行调查技术规范_第4页
DB5201-T 137-2024 基于移动通信数据的居民出行调查技术规范_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

93.080.30CCS

Q

845201 DB5201/T

137—2024基于移动通信数据的居民出行调查技术规范

specification

for

resident

trip

surveys

based

on

mobilecommunication

data

发布

实施贵阳市市场监督管理局 发

布DB5201/T

—2024前言

.................................................................................

II1

...............................................................................

12

规范性引用文件

.....................................................................

13

术语和定义

.........................................................................

14

...........................................................................

25

数据采集与处理

.....................................................................

36

.............................................................

47

扩样和校核

.........................................................................

78

...........................................................................

7附录

数据类型格式与数据文件存储格式.......................................

8附录

基于空间单元的关键过程数据表格.......................................

9参考文献

.............................................................................

11DB5201/T

—2024本文件按照GB/T

1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由贵阳市交通委员会提出并归口。公司。甜、廖强、郑和标、李衡。IIDB5201/T

—2024规范1范围与统计、扩样与校核、调查成果等。本文件适用于城市综合交通调查中基于移动通信数据的居民出行调查。2 规范性引用文件文件。GB/T

35273 信息安全技术

个人信息安全规范3 术语和定义3.1

下列术语和定义适用于本文件。居民出行调查

resident

trip

发到终止过程的全面情况进行调查。3.2手机信令mobile

移动通信系统中,用来传输用户信息和保障正常通信所需的设备与网络之间的协议控制信号。3.3手机信令数据 mobile

data息交换所产生的数据。3.4基站 base

station电收发电台。3.5加密移动用户识别码 encrypted

mobile

identification基于手机信令的数据处理及服务中经脱敏处理的唯一标识信令所属移动用户的识别码。3.6静止冗余数据 static

data在连续一段时间内,同一持卡人的多个相邻时间戳对应的基站编号以及基站经纬度均相同的手机信令数据。DB5201/T

—20243.7乒乓切换数据ping-pong

switching

个基站间来回切换(乒乓效应),所产生的手机信令数据。3.8基站漂移数据base

drift

data的基站,一段时间后又切换回邻近基站,在此过程中产生的手机信令数据。3.9驻留 one

stop移动通信用户在满足空间限制的某一区域内连续停留超过最小停留时长。3.10驻留点

point限制时,这些基站位置的质心。3.11驻留空间 stop

space移动通信用户驻留时间内与其发生信号交互的多个基站所覆盖的区域可合并为一个驻留的空间区域。3.12驻留时长 stop

移动通信用户在某一驻留区域从驻留开始时间到驻留结束时间的时间长度。3.13驻留人数stop

number给定统计时段,在某一空间范围内累计驻留时长超出给定阈值的不计重移动通信用户数量。3.14出行 trip移动通信用户按照时间的先后顺序,从一个驻留点(O点)移动到另一个驻留点(D点)的过程。3.15核查线 screen

屏障(铁路、河流等)设置。4总体要求4.1 街道或组团、交通小区、空间栅格的层级方式,并说明不同尺度空间单元的从属关系。4.2 应采集调查区域内至少连续

1

4.3 基于移动通信数据进行居民出行调查分析工作应遵守国家有关法律法规。DB5201/T

—20245 数据采集与处理5.1数据采集5.1.1

移动通信数据源应选择一家及以上移动通信运营商在调查周期内的完整数据。5.1.2

同时采集多家移动通信运营商的数据时,宜采用相互比较、相互校核的方式提高数据结果的可靠性。5.1.3

采集的移动通信数据的数据类型格式与数据文件存储格式见附录

5.1.4

基站数据宜包括以下内容:a)

基站编号;b)

基站所属运营商标识;c)

基站所在位置的省份标识;d)

基站所在位置的城市标识;e)

基站类型,包括普通基站、地铁基站、铁路专用基站、地上基站与地下基站等;f)

基站地理位置的经度数值;g)

基站地理位置的纬度数值。5.1.5

手机信令数据宜包括以下内容:a)

加密移动用户识别码;b)

信令时间戳;c)

信令事件类型,包括开关机、语音呼叫、短信、周期性位置更新、切换基站等;d)

当前所在基站的地理位置的经度数值;e)

当前所在基站的地理位置的纬度数值。5.1.6

用户基本特征数据宜包括以下内容:a)

加密移动用户识别码;b)

用户年龄范围区间;c)

用户性别;d)

号码归属地。5.2 数据处理5.2.1 应进行数据质量检查,内容包括信令日变和时变、基站位置坐标及不同类型区域中基站的布局密度等。5.2.2 应根据物联网特殊号段及从移动用户识别码获取的设备类型识别并剔除物联网卡等非人号卡产生的信令记录。5.2.3 当条件满足时,应进行一人多卡去重,可通过计算多个加密移动用户识别码的轨迹重合度进行处理。5.2.4 数据清洗处理流程包括但不限于:a)

当手机信令记录的缺失值为非关键字段时,可采用插补方法对缺失值进行处理;b)

重复数据处理:当手机信令原始数据存在数据字段内容完全相同的记录时,应合并去重;c)

静止冗余数据处理:应对信令记录中的静止冗余数据进行合并删除,保留连续在同一位置的第一条和最后一次信令交互数据;d)

乒乓切换数据处理:在手机信令记录中,宜以用户在“乒乓效应”发生期间连接次数最多的基站为主基站,剔除“乒乓效应”期间产生的除主基站外的记录;DB5201/T

—2024e)

基站漂移数据处理:应根据同一用户每条信令记录的驻留时间、驻留位置及其下一条记录的驻留时间、驻留位置,计算每次移动的速度,通过设定速度阈值,剔除短时间内发生大位移的信令记录。5.3 数据安全5.3.1 个人信息安全应符合

35273

5.3.2 基于移动通信数据的居民出行特征应为聚合统计后的指标结果,且保证无法识别特定个人。6 居民出行特征识别与统计6.1 基本要求6.1.1应建立基站位置与基本空间单元之间的对应关系,基本空间单元宜采用空间栅格或交通小区。6.1.2 基本空间单元的大小应结合基站密度合理确定,当采用空间栅格形式划分空间单元时,宜在中心城区划分为

m

m

的栅格,外围区可根据基站密度适当扩大。6.2 居民出行特征识别6.2.1 驻留与出行识别6.2.1.1 驻留状态识别应确定合理的最小驻留时长和空间限制取值,最小驻留时长和空间限制的取值宜考虑具体应用场景。6.2.1.2 出行状态识别应根据驻留状态的识别结果进行判断,可通过移动通信用户两次相邻驻留状态之间的空间移动过程进行识别。6.2.1.3 通过对用户驻留状态期间记录的手机信令数据的基站位置综合加权以确定移动通信用户的驻留点。6.2.1.4 夜间时段内当用户在某一位置驻留时间不少于连续

6

个小时,将该位置标记为用户的单日夜间驻留地,夜间时段可取

21:00

至次日

7:00。夜间时段在目标区域存在单日夜间驻留地的不计重的移动通信用户数量记为单日夜间驻留人数。6.2.1.5 日间时段内当用户在某一位置累计驻留时间不少于

6

个小时,将该位置标记为用户的单日日

10:00

信用户数量记为单日日间驻留人数。6.2.1.6 6.2.2 人口与岗位识别6.2.2.1 居住地识别6.2.2.1.1 统计单个移动通信用户在整个统计周期内所有单日夜间驻留地出现的频次,可采用频率最高的单日夜间驻留地作为该用户的居住地。必要时,可进一步区分第一居住地和第二居住地。6.2.2.1.2 用户居住地识别过程中应设置有效性判断规则,被识别为居住地的单日夜间驻留地在整个统计周期中重复出现的频次宜不少于调查周期天数的

50%。6.2.2.1.3 可根据调查目的和数据统计周期长度结合单日夜间驻留地累计时长、单日夜间驻留地重复率加权取值进行判断。DB5201/T

—20246.2.2.2 就业地识别6.2.2.2.1 统计单个移动通信用户在整个统计周期中所有工作日单日日间驻留地出现的频次,可采用频率最高的工作日单日日间驻留地作为该用户的就业地。6.2.2.2.2 用户就业地识别过程中应设置有效性判断规则,被识别为就业地的工作日单日日间驻留地应在整个统计周期中重复出现的频次宜不少于调查周期天数的

50%。6.2.2.2.3 可根据调查目的和数据统计周期长度结合工作日单日日间驻留地累计时长、工作日单日日间驻留地重复率加权取值进行判断。6.2.2.3 常住人口识别宜筛选出目标区域夜间驻留天数大于调查周期天数50%的用户作为该区域的常住人口。6.2.2.4 短期驻留人口识别6.2.2.4.1 用户在该城市范围内单日连续驻留

3

小时以上且不属于该城市常住人口的,计入该城市的当日短期驻留人口计算对象,一个用户按城市纳入不计重。6.2.2.4.2 不在同

1

30

日内逐日计算符合短期驻留规则的人数,计算日平均值作为所在区域的短期驻留人口。6.2.3 出行目的识别6.2.3.1 通勤出行识别可结合工作日和节假日具体分析。6.2.3.2 非通勤出行识别程度和数据时空精确程度细分。6.3居民出行特征统计6.3.1 出行量与出行率6.3.1.1 出行量6.3.1.1.1

统计不同尺度空间单元的分时段和日均出行量。6.3.1.1.2

筛选工作日早、晚高峰时段的数据进行高峰小时出行量统计和分析。6.3.1.1.3

根据出行目的类型,分别统计出行量。6.3.1.1.4

根据常住人口和短期驻留人口类型,分别统计出行量。6.3.1.2出行率6.3.1.2.1

统计不同尺度空间单元内全部人口的出行率。6.3.1.2.2

统计不同尺度空间单元内有出行用户的出行率。6.3.1.2.3

根据出行目的类型,分别统计出行率。6.3.1.2.4

根据常住人口和短期驻留人口类型,分别统计出行率。DB5201/T

—20246.3.2 出行时耗与出行距离6.3.2.1 出行时耗6.3.2.1.1 统计不同尺度空间单元内居民出行时耗分布。6.3.2.1.2 根据出行目的,分别统计平均出行时耗。6.3.2.1.3 根据常住人口和短期驻留人口类型,分别统计平均出行时耗。6.3.2.2 出行距离6.3.2.2.1

统计不同尺度空间单元内居民出行距离分布。6.3.2.2.2

根据出行的总人数,计算有出行用户的平均单日出行距离和平均单次出行距离。6.3.2.2.3

根据出行目的类型,分别统计平均单日出行距离、平均单次出行距离。6.3.2.2.4

根据常住人口和短期驻留人口类型,分别统计单次出行距离分布。6.3.3 出发时间分布与出行空间分布6.3.3.1 出发时间分布6.3.3.1.1 分别统计工作日与非工作日出发时间分布。6.3.3.1.2 根据不同尺度空间单元,分别统计各时段的出发时间分布。6.3.3.1.3 根据出行目的类型,分别统计各时段的出发时间分布。6.3.3.2 出行空间分布度绘制出行OD期望线并进行分析。6.3.4通勤出行特征6.3.4.1 6.3.4.2 职住空间分布宜提供不同尺度空间单元人口与就业岗位的数据和密度分布,并在获得数据许可的情况下,宜针对不同性别、年龄段及移动通信用户的归属地分别进行统计分析。6.3.5 其它出行特征6.3.5.1 基于移动通信数据获取城市出行联系应在人口与岗位识别结果的基础上进行测算,测算时段不宜小于

1

个月。6.3.5.2 对于调查区域与其他城市之间的出行联系宜包括人群分类、主要出行路径、出行时间段(工作日、周末和节假日)、出行目的、出行方式等。6.3.5.3 6.3.5.4 移动通信系统中,位于城市轨道交通系统中的车站、隧道等地下空间的基站具有特定的类型编码,可用于识别使用城市轨道交通作为交通方式的出行。DB5201/T

—20247 扩样和校核7.1 扩样7.1.1 在进行扩样前,应收集和准备以下材料:a)

调查区域的街道常住人口、户均人口数量、年龄段人口分布、性别人口分布、收入人口分布情况等;b)

调查区域街道面积、边界等。7.1.2 扩样方法宜包括以下步骤:a)

结合移动通信运营商在当地的电信市场占有率,获得调查区域内全部移动通信用户的不计重总体数量。电信市场占有率的测算宜采用移动通信运营商长期记录的话单数据估算,或结合活跃用户的规模占比进行估计;b)

结合调查区域手机普及率,确定不同居民群体的调整系数,获得调查区域实际居民的总体数量。调整系数的测算可采用手机普及率问卷调查方式,并考虑当地人口的年龄和性别结构及允许获取的移动通信用户个体信息进行综合测算。7.2 校核7.2.1应对基于移动通信数据进行居民出行特征识别与统计获得的结果进行校核。7.2.2 数据校核宜采用定性与定量相结合的方法,将基于移动通信数据进行居民出行特征识别与统计流量调查数据进行对比分析,验证分析结果的准确性。8 调查成果8.1 调查分析报告8.1.1 居民出行调查分析报告内容应包括数据采集与处理、居民出行信息提取方法、居民出行特征的识别与统计及相关参数取值。8.1.2 居民出行调查分析报告中数据分析部分应结合图形或图表形式展示。8.2关键过程数据8.2.1 关键过程数据应包括行政区(县)、街道或组团和所采用基本空间单元层级的相关统计数据,数据格式包括但不限于以表格文件(.xls

格式)等形式进行存储,并应提供关系、从属关系。8.2.2 基于多种尺度空间单元的关键过程数据应至少包含以下内容:a)

基于空间单元的出行量统计;b)

基于空间单元的通勤出行量统计;c)

基于空间单元的职住关系统计;d)

基于空间单元的常住人口数量统计;e)

基于空间单元的短期驻留人口数量统计。8.2.3 基于空间单元的关键过程数据表格见附录

B。(string)Cm

C5

C..0C..0

表示一个长度不确定的字符,一般多为C..C1..10

10

型格式;C..6Nm

N8

N..m

N..4

N..p,q

N..8,2

(Date)DT

YYYYMMDDhhmmss(24

20060612235959

YYYYMMDD20060612逻辑型(bool)

0或1DB5201/T

—2024

附录 A(规范性)数据类型格式与数据文件存储格式A.1 数据类型格式数据类型格式见表A.1。表A.1

数据类型格式表A.1

数据类型格式A.2 数据文件存储格式用“,”分隔。csv格式要求如下:a)

开头不留空,以行为单位;b)

可含或不含列名,含列名则居文件第一行;c)

一行数据不跨行,无空行;d)

以半角逗号(即,)作分隔符,列为空也应表达其存在;e)

字段值包含起来;f)

文件读写时引号,逗号操作规则互逆;g)

内码格式不限,可为

ASCII、Unicode

h)

不支持数字和特殊字符。ITEMCELL_HOMECELL_WORKCOV_HWITEM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论