T/CI 155-2023 基于多模态大模型的智慧交通出行技术规范

T/CI 155-2023 The technical specifications for intelligent transportation based on multi-modal large models

团体标准 中文(简体) 现行 页数:16页 | 格式:PDF

基本信息

标准号
T/CI 155-2023
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-09-28
实施日期
2023-09-28
发布单位/组织
-
归口单位
中国国际科技促进会
适用范围
主要技术内容:本文件确立了智慧交通出行技术的数据采样、数据预处理、多模态大模型流程逻辑,描述了智慧交通出行应用场景,并提出了性能评估指标要求。本文件适用于基于机器学习的智慧交通出行技术平台建设,以及多模态信息融合智慧交通大模型应用

发布历史

研制信息

起草单位:
南方科技大学、长春理工大学、中国第一汽车集团有限公司、北京大学、华为技术有限公司、浪潮通用软件有限公司、同济大学、中国检验认证集团深圳有限公司、中山大学、天津大学、上海理工大学、北京交通大学、重庆大学、北京嘀嘀无限科技发展有限公司、北京高科中创科学技术中心、深圳市骏嘉科技发展有限公司、深圳市铠硕达科技有限公司、深圳浑沌数字化实验室科技有限公司、深圳树米网络科技有限公司、汕头大学、吉林省卡思特科技有限公司、吉林省中云数讯股份有限公司、超智研发中心(深圳)有限公司、碳猎研发中心(深圳)有限公司、深圳安视信息技术有限公司、苏州奇盈半导体科技有限公司、维旭长电科技(深圳)有限公司
起草人:
宋 轩、陈纪元、王宏俊、杨华民、王兴山、赵卫东、朱金波、谢洪彬、张浩然、张家祺、冯德帆、宋 歌、张嘉晖、李昊洋、吴季泫、陈孙兵、陈天乐、张凌宇、由林麟、胡清华、刘振栋、金 一、李浥东、贾云健、吴国斌、王潇、梁舰、张 昕、宋小龙、刘 妍、周时莹、李长龙、孙宗姚、王中一、谢 奕、高 亮、陈 欣、陈 瑶、袁 飞
出版信息:
页数:16页 | 字数:- | 开本: -

内容描述

ICS35.240.99

CCSL73

团体标准

T/CI155—2023

基于多模态大模型的智慧交通出行技术规

Technicalspecificationsforintelligenttransportationbasedonmultimodallarge

models

2023-09-28发布2023-09-28实施

中国国际科技促进会发布

T/CI155—2023

目次

前言.................................................................................II

1范围...............................................................................1

2规范性引用文件.....................................................................1

3术语和定义.........................................................................1

4缩略语.............................................................................1

5基于多模态大模型的智慧交通出行技术框架.............................................2

6数据采样与建模融合.................................................................2

7多模态机器学习大模型...............................................................4

8基于机器学习的智慧出行多模态大模型应用场景........................................11

I

T/CI155—2023

前言

本文件按照GB/T1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定

起草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。

本文件由南方科技大学提出。

本文件由中国国际科技促进会归口。

本文件起草单位:南方科技大学、长春理工大学、中国第一汽车集团有限公司、北京大学、华为技

术有限公司、浪潮通用软件有限公司、同济大学、中国检验认证集团深圳有限公司、中山大学、天津大

学、上海理工大学、北京交通大学、重庆大学、北京嘀嘀无限科技发展有限公司、北京高科中创科学技

术中心、深圳市骏嘉科技发展有限公司、深圳市铠硕达科技有限公司、深圳浑沌数字化实验室科技有限

公司、深圳树米网络科技有限公司、汕头大学、吉林省卡思特科技有限公司、吉林省中云数讯股份有限

公司、超智研发中心(深圳)有限公司、碳猎研发中心(深圳)有限公司、深圳安视信息技术有限公司、

苏州奇盈半导体科技有限公司、维旭长电科技(深圳)有限公司。

本文件主要起草人:宋轩、陈纪元、王宏俊、杨华民、王兴山、赵卫东、朱金波、谢洪彬、张浩

然、张家祺、冯德帆、宋歌、张嘉晖、李昊洋、吴季泫、陈孙兵、陈天乐、张凌宇、由林麟、胡清华、

刘振栋、金一、李浥东、贾云健、吴国斌、王潇、梁舰、张昕、宋小龙、刘妍、周时莹、李长龙、

孙宗姚、王中一、谢奕、高亮、陈欣、陈瑶、袁飞。

II

T/CI155—2023

基于多模态大模型的智慧交通出行技术规范

1范围

本文件确立了智慧交通出行技术的数据采样、数据预处理、多模态大模型流程逻辑,描述了智慧交

通出行应用场景,并提出了性能评估指标要求。

本文件适用于基于机器学习的智慧交通出行技术平台建设,以及多模态信息融合智慧交通大模型应

用。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

GB/T5271.34-2006信息技术词汇第34部分:人工智能神经网络

GB/T34678-2017智慧城市技术参考模型

GB/T35295-2017信息技术大数据术语

GB/T37043-2018智慧城市术语

GB/T41867-2022信息技术人工智能术语

3术语和定义

GB/T5271.34-2006、GB/T34678-2017、GB/T35295-2017、GB/T37043-2018、GB/T41867-2022

界定的以及下列术语和定义适用于本文件。

3.1

邻接矩阵adjacentmatrix

用以表示交通图数据中不同节点的空间相关性权重的二维正方形矩阵。

3.2

欧式距离euclidean

符合现实物理世界定义的距离评判标准。

3.3

注意力机制attentionmechanism

通过额外的神经网络参数控制网络关注点的一种手段。

3.4

周期学习率cycliclearningrate

对神经网络学习率的一种调整手段。

3.5

随机失活dropout

对神经网络神经元进行随机失活的一种手段。

4缩略语

下列缩略语适用于本文件。

GPS:全球定位系统(GlobalPositioningSystem)

RNN:循环神经网络(RecurrentNeuralNetwork)

LSTM:长短期记忆网络(LongShort-TermMemory)

CNN:卷积神经网络(ConvolutionalNeuralNetwork)

RMSE:均方根误差(RootMeanSquareError)

1

T/CI155—2023

MAPE:平均绝对百分比误差(MeanAbsolutePercentageError)

GCN:图卷积网络(GraphConvolutionalNetwork)

5基于多模态大模型的智慧交通出行技术框架

以多模态大模型为基础的智慧出行技术规范中包含了数据采样层、数据预处理层和多模态机器学习

层,技术体系具体见图1。多模态大模型融合了多种数据来源,在知识掌握中有着更加全面的认识。该

规范符合现代技术的要求和常规流程,可以为与广大人民群众日常生活紧密相连的如规划行程路线,选

择交通方式,避开拥堵地段等等应用提供一个完整、统一、规范的标准,为智慧城市面临的挑战提供智

能化和科学化的支持。

图1基于多模态大模型的智慧交通出行技术体系

6数据采样与建模融合

6.1数据采样来源

6.1.1道路信息数据

包括路网结构,各种交通政策和规则,如道路限速、禁行规定、停车规定、高峰期限行规定等对于

交通模型的构建和优化都很重要的数据。

6.1.2土地使用模式数据

土地使用模式(比如住宅区、商业区、工业区的分布)可以影响人们的出行需求和路径选择,因此

也需要收集和分析这类数据。

6.1.3GPS追踪数据

汽车和移动设备的GPS数据可以用于实时交通流量监测和预测,路线规划,以及对共享出行服务的

需求预测。

2

T/CI155—2023

6.1.4公共交通数据

公共交通数据主要包括公交车、火车、电车等公共交通工具的时刻表和实时运营数据,可以用于优

化公共交通服务,改善出行体验。共享单车、共享汽车、拼车服务等提供商的数据,可以用于需求预测、

价格优化和服务改进。

6.1.5交通传感器数据

道路上的交通传感器可以提供实时的交通流量、车辆速度、交通灯状态等信息,用于交通管理和预

测。

6.1.6遥感数据

卫星遥感图像可以提供大范围的地表覆盖情况和道路网络信息(如山丘、河流、湖泊、桥梁等,可

能会影响交通路线的选择和交通条件),也可以用于监测交通流量和拥堵情况。

6.1.7新闻数据

与交通有关的新闻(广播)数据可以提供各路段的拥堵以及事故情况,可以帮助大模型实时修正预

测结果。

6.1.8社交媒体数据

社交媒体如微博数据可以提供各处民众对于交通情况的实时观测,可以帮助大模型实时修正预测结

果。

6.1.9移动应用数据

像高德地图和滴滴打车这样的移动应用生成的数据,如用户的搜索和出行记录,可以提供用户个性

化的丰富的出行行为信息。

6.1.10物联网数据

如车载传感器、智能信号灯、智能停车场等IoT设备生成的数据,可以提供实时的交通状态信息。

6.1.11天气数据

天气条件可以影响人们的出行模式和需求,因此天气数据也是一个重要的数据来源。

6.1.12空气质量数据

空气质量数据也可以用于智能路线规划。例如,智慧交通系统可以建议用户避开空气质量差的区域,

选择空气质量较好的路线。

6.2数据建模融合

6.2.1数据清洗

数据清洗主要是去除噪音和异常值,处理缺失值,纠正错误和不一致的数据。例如:

a)GPS数据可能存在定位错误的情况,需要去除错误的GPS定位点,如距离过远或速度异常的点;

b)交通传感器数据也需要除去传感器故障导致的异常值;

c)对于土地使用模式数据我们需要去除无效或不一致的数据,比如土地分类错误的区域;

d)对于图像数据我们可以删除质量低的图像,例如模糊的图像;

e)对于文本数据,删除不需要的字符(如特殊字符,数字等),将文本转换为小写,处理缩写

等则是常用的数据清洗手段。

6.2.2数据聚合

数据聚合主要服务于轨迹数据,如基于时间和/或空间将GPS点聚合到更高级别的单元,如路段或网

格。这方面的常用方法是FMM(FastMapMatching),FMM可以在不同精度条件下将稀疏的GPS点聚合到

路网上。

3

T/CI155—2023

6.2.3数据编码

为了方便机器学习模型进行处理,我们通常要对数据进行编码处理。如将土地使用类型编码为数值,

以便于机器学习模型处理。比如,住宅区编码为1,商业区编码为2,工业区编码为3等。常用的编码方

法有标签编码(LabelEncoding)和独热编码(One-HotEncoding)。

a)标签编码(LabelEncoding)是一种常见的特征处理方法,它将分类变量(Categorical

Variables)转换为数字,从而方便机器学习算法处理。具体来说,标签编码将每个不同的分

类值赋予一个唯一的整数标签。标签编码的优点是简单易实现,适用于一些算法的输入要求

为数字的情况;

b)独热编码(One-HotEncoding)是一种常见的特征处理方法,用于将分类变量(Categorical

Variables)转换为数字,以便机器学习算法处理。独热编码的优点是可以处理分类变量,并

且不会引入任何顺序偏差。此外,在某些机器学习算法中,独热编码也可以改善模型的性能。

6.2.4特征工程

特征工程是机器学习中的重要步骤,它涉及到从原始数据中提取有用的信息,将这些信息转化为对

机器学习模型有用的特征。对于交通数据来说,原始的GPS数据可能包含了位置、时间等信息。然而,

这些原始数据对于机器学习模型来说并不直接可用。因此,我们需要通过特征工程从中提取出对目标任

务有意义的特征,例如行驶速度和行驶方向。这样的特征可以通过计算两个相邻的GPS点之间的距离和

角度得到。对于社交媒体数据,原始的文本数据也并不能直接用于机器学习模型。我们可以通过对文本

进行处理,如分词、词干化、词袋或TF-IDF转换等,将文本数据转化为机器可以理解的形式。此外,还

可以通过情感分析提取出文本的情感倾向,或者通过关键词提取找出文本的主题。图像数据同样也需要

进行特征工程。在智慧交通的背景下,我们可能需要从图像中提取出车辆和行人的位置,以及他们的行

为。这可以通过图像识别和目标检测等技术实现。

6.2.5数据归一化

数据归一化是一种预处理技术,主要用于改变数据的尺度,使其落入一个小的、特定的区间(如[0,1]

或[-1,1])。在机器学习和数据挖掘中,数据归一化的主要目的和作用有:消除量纲影响,加快学习

速度,提高模型精度,使数据更接近正态分布,提高模型的泛化能力。常用的数据归一化算法有如下两

种。

a)z-score均值化是一种常见的特征缩放方法,也叫标准化(Standardization),它将原始数

据进行线性变换,使得变换后的数据满足均值为0,标准差为

定制服务

    推荐标准

    相似标准推荐

    更多>