T/CESA 1291-2023 信息技术 开源 元数据通用要求

T/CESA 1291-2023

团体标准 中文(简体) 现行 页数:69页 | 格式:PDF

基本信息

标准号
T/CESA 1291-2023
标准类型
团体标准
标准状态
现行
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2023-09-28
实施日期
2023-09-28
发布单位/组织
-
归口单位
中国电子工业标准化技术协会
适用范围
范围:本文件规定了开源元数据的通用要求,包括:描述规则、元数据构成、元数据扩展的类型与规则、 代码表等通用格式要求。 本文件适用于指导参与开源活动的各方进行开源数据的收集、整理、维护、存储、交换与输出; 主要技术内容:本文件规定了开源元数据的通用要求,包括:描述规则、元数据构成、元数据扩展的类型与规则、代码表等通用格式要求。本文件适用于指导参与开源活动的各方进行开源数据的收集、整理、维护、存储、交换与输出

发布历史

研制信息

起草单位:
中国电子技术标准化研究院、华为技术有限公司、浪潮电子信息产业股份有限公 司、浙江九州未来信息科技有限公司、阿里云计算有限公司、蚂蚁科技集团股份有限公司、中移(苏州) 软件技术有限公司、上海计算机软件技术开发中心、北京百度网讯科技有限公司、东软集团股份有限公 司、中国软件评测中心(工业和信息化部软件与集成电路促进中心)、苏州棱镜七彩信息科技有限公司、 上海交通大学、浪潮云信息技术股份公司、杭州谐云科技有限公司、中移系统集成有限公司
起草人:
杨丽蕴、庄表伟、于秀明、李成双、章津楠、张百林、龚斌、郭智慧、钱岭、 周兆明、周楠、马红伟、赵赫、袁薇、但吉兵、金耀辉、吴涛、黄先芝、李智琪、于昕、林科、杨佳丽、 邸贺亮、边思康、王旭、杨静、孙福洲、葛建新、梁大功、彭晋、黄蕾宇、黄浩东、王媛媛、魏弋钧、田晓利、高家祺
出版信息:
页数:69页 | 字数:- | 开本: -

内容描述

ICS35.240

CCSL70

团体标准

T/CESA1291—2023

信息技术开源元数据通用要求

Informationtechnology—Opensource—Generalrequirementsformetadata

2023-09-28发布2023-09-28实施

中国电子工业标准化技术协会发布

版权保护文件

版权所有归属于该标准的发布机构,除非有其他规定,否则未经许可,此发行物及其章节不得以其

他形式或任何手段进行复制、再版或使用,包括电子版,影印件,或发布在互联网及内部网络等。使用

许可可于发布机构获取。

I

目  次

前  言...............................................................................V

1范围.................................................................................1

2规范性引用文件.......................................................................1

3术语和定义...........................................................................1

4缩略语...............................................................................2

5元数据描述...........................................................................2

5.1概述.............................................................................2

5.2中文名称.........................................................................2

5.3英文名称.........................................................................2

5.4短名.............................................................................2

5.5定义.............................................................................2

5.6值域.............................................................................2

5.7数据类型.........................................................................3

5.8约束/条件........................................................................3

5.9最大出现次数.....................................................................3

5.10子元素..........................................................................3

5.11扩展巴氏范式....................................................................3

5.12注解............................................................................3

5.13UML模型.........................................................................4

6开源元数据...........................................................................4

6.1开源元数据信息模型...............................................................4

6.2开源项目.........................................................................5

6.3个人.............................................................................9

6.4个人行为........................................................................12

6.5开源产品........................................................................14

6.6开源授权协议....................................................................16

6.7版权............................................................................18

6.8专利............................................................................19

6.9版本............................................................................21

6.10漏洞...........................................................................23

6.11议题...........................................................................27

6.12源代码仓库.....................................................................29

6.13分支...........................................................................31

6.14标签...........................................................................32

6.15制品...........................................................................34

6.16包管理工具.....................................................................37

III

6.17开发服务.......................................................................39

6.18镜像...........................................................................41

6.19开源社区.......................................................................42

6.20开源基金会.....................................................................45

6.21媒体平台.......................................................................48

6.22组织行为.......................................................................49

7代码表..............................................................................51

7.1个人类型代码....................................................................51

7.2个人行为代码....................................................................52

7.3个人角色代码....................................................................53

7.4产品类型代码....................................................................53

7.5操作系统代码....................................................................54

7.6程语言代码......................................................................55

7.7组织行为类型代码................................................................59

8元数据扩展的类型与规则..............................................................59

8.1元数据扩展的类型................................................................59

8.2元数据扩展的规则................................................................59

参考文献...........................................................................61

IV

前  言

本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起

草。

请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。

本文件由中国电子技术标准化研究院提出。

本文件由中国电子技术标准化研究院、中国电子工业标准化技术协会归口。

本文件起草单位:中国电子技术标准化研究院、华为技术有限公司、浪潮电子信息产业股份有限公

司、浙江九州未来信息科技有限公司、阿里云计算有限公司、蚂蚁科技集团股份有限公司、中移(苏州)

软件技术有限公司、上海计算机软件技术开发中心、北京百度网讯科技有限公司、东软集团股份有限公

司、中国软件评测中心(工业和信息化部软件与集成电路促进中心)、苏州棱镜七彩信息科技有限公司、

上海交通大学、浪潮云信息技术股份公司、杭州谐云科技有限公司、中移系统集成有限公司。

本文件主要起草人:杨丽蕴、庄表伟、于秀明、李成双、章津楠、张百林、龚斌、郭智慧、钱岭、

周兆明、周楠、马红伟、赵赫、袁薇、但吉兵、金耀辉、吴涛、黄先芝、李智琪、于昕、林科、杨佳丽、

邸贺亮、边思康、王旭、杨静、孙福洲、葛建新、梁大功、彭晋、黄蕾宇、黄浩东、王媛媛、魏弋钧、

田晓利、高家祺。

V

T/CESA1291—2023

信息技术开源元数据通用要求

1范围

本文件规定了开源元数据的通用要求,包括:描述规则、元数据构成、元数据扩展的类型与规则、

代码表等通用格式要求。

本文件适用于指导参与开源活动的各方进行开源数据的收集、整理、维护、存储、交换与输出。

2规范性引用文件

下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,

仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本

文件。

T/CESA1269-2023信息技术开源术语与综述

3术语和定义

T/CESA1269-2023界定的以及下列术语和定义适用于本文件。

3.1

开源数据opensourcedata

开源领域各项行为所产生的数据。

3.2

元数据metadata

定义和描述其他数据的数据。

[来源:GB/T18391.1-2009,3.2.16]

3.3

开源元数据opensourcemetadata

定义和描述开源数据的数据。

3.4

元数据元素metadataelement

元数据的基本单元。

注:元数据元素在元数据实体中是唯一的。

[来源:GB/T19710-2005,4.6]

3.5

元数据实体metadataentity

一组说明数据相同特性的元数据元素。

注:可以包含一个或一个以上元数据实体。

[来源:GB/T19710-2005,4.7]

1

T/CESA1291—2023

4缩略语

下列缩略语适用于本文件。

CLA:贡献者许可协议(ContributorLicenseAgreement)

CPE:通用枚举平台(CommonPlatformEnumeration)

CVE:通用漏洞披露(CommonVulnerabilities&Exposures)

DCO:开发者原创证书(DeveloperCertificateofOrigin)

UML:统一建模语言(UnifiedModelingLanguage)

URL:统一资源定位符(UniformResourceLocation)

URI:统一资源标识符(UniformResourceIdentifiers)

5元数据描述

5.1概述

本文件采用GB/T30522-2014规定的方式定义和描述元数据,包括:中文名称、英文名称、短名、定

义、数据类型、值域、约束/条件、最大出现次数、子元素、扩展巴氏范式、注解和UML模型来描述元数

据。

5.2中文名称

元数据的中文名称。

5.3英文名称

元数据的英文名称,通常使用英文全称。

5.4短名

元数据的英文缩写名称,具体缩写规则如下:

a)短名在本标准范围内应唯一;

b)对存在国际或行业领域惯用英文缩写的元数据实体或元数据元素,其短名应直接优先采用该

英文缩写;

c)对于根据英文名称形成的短名,在保持唯一性的前提下统一取每个单词前三个字母作为其短

名,当如此取词不能保证唯一性时应延展取词位数,通常仅增加一位,如此仍不能保证唯一

性时如前继续延长取词,直至保证唯一性为止;

d)元数据实体的短名的写法是,所有组成词汇的缩写为无缝连写,并且每个词汇缩写的首字母

大写;

e)元数据元素的短名的写法是,所有组成词汇的缩写为无缝连写,首词汇全部采用小写字母,

其余每个词汇缩写的首字母大写。

5.5定义

描述元数据的基本内容。

5.6值域

说明元数据元素取值范围。

2

T/CESA1291—2023

5.7数据类型

元数据的有效值域和允许对该值域内的值进行有效操作的规定。

示例:整型、实型、布尔型、字符串型、日期型等。

5.8约束/条件

说明元数据实体或元数据元素是否应选取的属性。包括以下两种属性:

a)必选(Must,简称M):该元数据实体或元数据元素应选择;

b)可选(Option,简称O):根据实际应用可选择的元数据实体或元数据元素。

可选元数据实体可以包含必选的元数据元素,仅当此可选元数据元素被选用时有效。若可选元数据

实体未被选用,则该元数据实体所包含的元数据元素(包括必选元数据元素)无效。

5.9最大出现次数

元数据实体或元数据元素可以具有的最大实例数目。只出现一次的用“1”表示,重复出现的用“n”

表示。

5.10子元素

用于通过一定的表示规则以确定一个元数据实体中包含的下一级的元数据实体或元数据元素。表示

规则为:“标识符=表达式”。表达式中各符号的含义见表1。

表1表达式的符号

符号含义

=由……替换、生成,由……组成

+与

|或(选择)——在由“|”分开的两项之中选择其一

表示{}中的元数据元素a为可选项/条件必选项,且出现最

0{a}1

大次数为1;若为条件必选项,约束/条件具体参见其注解

表示{}中的元数据元素a为可选项/条件必选项,且出现最

0{a}n

大次数为N;若为条件必选项,约束/条件具体参见其注解

A表示元数据元素A为必选项,且最大出现次数为1

1{a}n表示{}中的元数据元素a为必选项,且出现最大次数为N

在子元素表示中,{}中均使用元数据元素或实体的中文名称。

5.11扩展巴氏范式

用于更加规范化地表示一个元数据实体与其下一级的元数据实体或元数据元素之间的关系,便于系

统实现。与子元素的表示法不同的是,扩展巴氏范式用“,”代替子元素中的“+”表示“与”关系,

{}中均使用该元数据元素的短名,并以“;”作为表达式的结尾。

5.12注解

3

T/CESA1291—2023

对元数据的含义的进一步解释。

5.13UML模型

本文件采用UML描述元数据子集、元数据实体和元数据元素之间的关系。用UML中的包表示元数据子

集,类表示元数据实体,属性表示元数据元素,见图1。

(a)类为元数据实体

(b)类1依赖类2,类2被类1引用

图1UML符号及说明

6开源元数据

6.1开源元数据信息模型

4

T/CESA1291—2023

图2开源元数据信息模型

开源元数据信息模型见图2。模型以开源项目为核心,关系如下:

a)一个开源项目是由若干个人或组织参与开发的,个人与组织都会有各种分类,并发生各种行

为;

b)一个开源项目可能会衍生/派生出一个或多个产品;

c)一个开源项目会将源代码存放在某一个开源的代码仓库里;

d)一个开源项目会选择自己的授权协议(主要为DCO或CLA);

e)一个开源产品可发布多个版本,这些版本可以打包为制品,并被包管理工具所管理;

f)一个开源产品根据不同的版本,可选择自己的开源授权协议(主要是开源许可证),并声明

自己的版权,也可申请自己的专利或者用到一些专利;

g)开源产品的某些特定版本可能存在漏洞,需要被记录。

6.2开源项目

6.2.1数据结构

中文名称:开源项目

英文名称:OpenSourceProject

短名:openSourceProject

定义:开放源代码开发的项目

数据类型:复合型

约束/条件:M

最大出现次数:1

子元素:开源项目=名称+描述+网站地址+开源产品+开源社区+开源基金会+项目成

员+项目历史+开发服务平台+问题列表+维基+源代码+邮件列表+论坛

扩展巴氏范式:openSourceProject=name,description,website,product,community,

foundation,member,history,devService,bugTracker,wiki,source,mailingList,forum;

注解:开源项目是一个元数据实体

6.2.2名称

中文名称:名称

英文名称:Name

短名:name

定义:开源项目的名称

数据类型:字符串

值域:自由文本

约束条件:M

最大出现次数:1

注解:开源项目的名称为唯一

6.2.3描述

中文名称:描述

英文名称:Description

短名:description

5

T/CESA1291—2023

定义:开源项目的介绍文字

数据类型:字符串

值域:自由文本

约束条件:O

最大出现次数:1

注解:无

6.2.4网站地址

中文名称:网站地址

英文名称:Website

短名:website

定义:开源项目官方网站的地址,可能与源代码的地址相同

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.2.5开源产品

中文名称:开源产品

英文名称:OpenSourceProduct

短名:product

定义:该开源项目发布的开源产品

数据类型:开源产品

值域:开源产品定义

约束条件:O

最大出现次数:n

注解:无

6.2.6开源社区

中文名称:开源社区

英文名称:OpenSourceCommunity

短名:community

定义:开发该开源项目的开源社区

数据类型:开源社区

值域:开源社区定义

约束条件:O

最大出现次数:n

注解:开源项目与开源社区,可能为多对多的关系

6.2.7开源基金会

中文名称:开源基金会

英文名称:OpenSourceFoundation

6

T/CESA1291—2023

短名:foundation

定义:开源项目所属的开源基金会

数据类型:开源基金会

值域:开源基金会定义

约束条件:O

最大出现次数:1

注解:无

6.2.8项目成员

中文名称:项目成员

英文名称:Member

短名:member

定义:开源项目成员

数据类型:个人

值域:个人定义

约束条件:M

最大出现次数:n

注解:至少有一位项目创始人,需要定义每位成员在项目中的角色,参见个人角色类型

6.2.9项目历史

中文名称:项目历史

英文名称:History

短名:history

定义:一个开源项目发展历程中,一系列的关键事件与活动

数据类型:行为

值域:个人行为定义或组织行为定义

约束条件:O

最大出现次数:n

注解:无

6.2.10开发服务平台

中文名称:开发服务平台

英文名称:DevelopmentService

短名:devService

定义:一个开源项目在开发过程中使用到的各种服务

数据类型:开发服务

值域:开发服务定义

约束条件:O

最大出现次数:n

注解:无

6.2.11议题列表

中文名称:议题列表

7

T/CESA1291—2023

英文名称:IssueList

短名:issueList

定义:该开源项目用于追踪问题(议题)的列表(bug/issue/feature/plan等)

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:又名为issueTracker

6.2.12维基

中文名称:维基

英文名称:Wiki

短名:wiki

定义:开源项目的维基文档

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.2.13源代码

中文名称:源代码

英文名称:Source

短名:source

定义:开源项目的源代码地址

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.2.14邮件列表

中文名称:源代码

英文名称:MailingList

短名:mailingList

定义:开源项目的邮件列表地址

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.2.15论坛

8

T/CESA1291—2023

中文名称:论坛

英文名称:Forum

短名:forum

定义:开源项目的论坛地址

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.3个人

6.3.1数据结构

中文名称:个人

英文名称:People

短名:people

定义:参与各类开源活动的个人,包括机器人

数据类型:复合型

约束/条件:M

最大出现次数:1

子元素:个人=姓名+昵称+类型+邮箱+推特+脸书+微信+QQ+网站+博客+性

别+国家+城市+公司+开源社区+开源基金会+开发服务平台

扩展巴氏范式:people=name,nickname,type,email,twitter,facebook,weixin,QQ,

website,blog,sex,country,city,company,community,fundation,devService;

注解:个人是一个元数据实体

6.3.2姓名

中文名称:姓名

英文名称:Name

短名:name

定义:个人的姓名

数据类型:字符串

值域:自由文本

约束条件:M

最大出现次数:1

注解:可以出现重名

6.3.3昵称

中文名称:昵称

英文名称:Nickname

短名:nickname

定义:个人的昵称

数据类型:字符串

9

T/CESA1291—2023

值域:自由文本

约束条件:O

最大出现次数:1

注解:可以出现重名

6.3.4类型

中文名称:类型

英文名称:Type

短名:type

定义:个人类型

数据类型:字符串

值域:具体分类名称和代码见表3

约束条件:M

最大出现次数:1

注解:无

6.3.5邮箱

中文名称:邮箱

英文名称:Email

短名:email

定义:个人的电子邮件地址

数据类型:字符串

值域:自由文本@域名

约束条件:O

最大出现次数:n

注解:无

6.3.6网站

中文名称:网站

英文名称:Website

短名:website

定义:个人网站

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.3.7博客

中文名称:博客

英文名称:Blog

短名:blog

定义:个人博客

10

T/CESA1291—2023

数据类型:URL

值域:符合URL的规范

约束条件:O

最大出现次数:n

注解:无

6.3.8开源社区

中文名称:开源社区

英文名称:OpenSourceCommunity

短名:community

定义:个人所在的开源社区

数据类型:开源社区

值域:开源社区定义

约束条件:O

最大出现次数:n

注解:无

6.3.9基金会

中文名称:开源基金会

英文名称:OpenSourceFoundation

短名:foundation

定义:个人所在的开源基金会

数据类型:开源基金会

值域:开源基金会定义

约束条件:O

最大出现次数:n

注解:无

6.3.10开发服务平台

中文名称:开发服务平台

英文名称:DevelopmentService

短名:devService

定义:个人所使用的开发服务平台

数据类型:开发服务

值域:开源服务定义

约束条件:O

最大出现次数:n

注解:无

6.3.11其他信息

中文名称:其他信息

英文名称:ExtendInformation

短名:extInfo

11

T/CESA1291—2023

定义:其他个人信息

数据类型:JSON字符串

值域:符合JSON的规范

约束条件:O

最大出现次数:1

注解:无

6.4个人行为

6.4.1数据结构

中文名称:个人行为

英文名称:PeopleEvent

短名:peopleEvent

定义:在开源社区与开源项目中,个人发生的各种行为

数据类型:复合型

约束/条件:M

最大出现次数:1

子元素:个人行为=ID+类型+行为者+相关开源项目+相关开源社区+扩展信息+开发

服务平台

扩展巴氏范式:peopleEvent=id,type,actor,project,community,extInfo,devService;

注解:个人行为是一个元数据实体

6.4.2ID

中文名称:ID

英文名称:id

短名:id

定义:个人行为的唯一标识

数据类型:字符串

值域:自由文本

约束条件:M

最大出现次数:1

注解:无

6.4.3类型

中文名称:类型

英文名称:Type

短名:type

定义:个人行为的类型

数据类型:字符串

值域:具体分类名称和代码见表3

约束条件:M

最大出现次数:1

注解:无

12

T/CESA1291—2023

6.4.4行为者

中文名称:行为者

英文名称:Actor

短名:actor

定义:发起行为的个人

数据类型:个人

值域:个人定义

约束条件:M

最大出现次数:1

注解:无

6.4.5开源项目

中文名称:开源项目

英文名称:OpenSourceProject

短名:project

定义:个人行为发生所在的开源项目

数据类型:开源项目

值域:开源项目定义

约束条件:O

最大出现次数:n

注解:无

6.4.6开源社区

中文名称:开源社区

英文名称:OpenSourceCo

定制服务

    推荐标准

    相似标准推荐

    更多>