T/SAIAS 015-2024 语料库建设导则
T/SAIAS 015-2024 Corpus Construction Guidelines
团体标准
中文(简体)
现行
页数:0页
|
格式:PDF
基本信息
标准号
T/SAIAS 015-2024
标准类型
团体标准
标准状态
现行
发布日期
2024-07-02
实施日期
2024-08-01
发布单位/组织
-
归口单位
上海市人工智能行业协会
适用范围
主要技术内容:本标准主要涵盖了人工智能语料库建设的相关内容。规定了其一般要求和方法,适用于多种相关工作。在数据资源方面,要求数据规模大、覆盖广、具多样性,密级设置合规且质量高。对不同数据表征模式,如文本、图像、音频、视频数据的类别、语种等有详细规定。提供方式包括实体存储介质等,数据文件标识有命名规则。语料数据方面,通则有规范性要求,结构和内容分为多个区段并有特定说明,质量要具备规范性等,交付宜用实体存储介质。语料生产系统中,总体架构包含多个层次,语料库管理系统应具多种功能,工具链的标注工具需满足最低功能要求。语料生产过程涵盖资源数据检查,文本、图像、音频、视频语料的生产流程。语料的价值对齐需合法合规,具有正确价值导向且持续进行。数据安全方面,提供方要实施多方面安全策略和措施,对全过程进行安全性评价,建立相关制度,配置软硬组件,参与人员要签署保密协议并建立安全团队
发布历史
-
2024年07月
文前页预览
当前资源暂不支持预览
研制信息
- 起草单位:
- 上海库帕思科技有限公司、上海人工智能创新中心、上海市人工智能行业协会、人民网股份有限公司上海分公司、上海信投数字科技有限公司、上海阶跃星辰智能科技有限公司、中国电信股份有限公司上海分公司、咪咕视讯科技有限公司、上海教育软件发展有限公司、北京星尘纪元智能科技有限公司、华为技术公司、商汤集团有限公司、上海稀宇科技有限公司、上海谷羽网络科技有限责任公司、上海流程智造科技创新研究院有限公司、汇纳科技股份有限公司、上海新兴信息通信技术应用研究院、中国联合网络通信集团有限公司上海市分公司、上海报业集团、上海智慧城市发展研究院
- 起草人:
- 山栋明、黄海清、贺仁驹、尹浩、王宇、李薇、陈芳、随志浩、郭俊波、金煜纯、薛佳嵩、刘红、龚旺海、陈浩、李璟、陈巧慧、吴其玲、杨文恺、傅伊浩、郭汉杰、苏彤、赵鹏宇、胡永祎、钟俊浩、陈曦、党赞、徐琦、沈涛、陈望都、欧如峰、郭永进、章磊、刘鹏宇、葛丁菱、郑茂宽、胡琼方、贺仁龙、陈雪晖、刘嵘、刘泽雷、黄杨、林晔、王海涛、廖慧霞、李秋蓉
- 出版信息:
- 页数:- | 字数:- | 开本: -
内容描述
暂无内容
定制服务
推荐标准
- T/CACM 016-2017 上火的诊断和治疗指南 2017-11-14
- T/CACM 1021.56-2018 中药材商品规格等级 苍术 2018-12-03
- T/ZZB 0542-2018 一次性高频手术电极(电凝切割器) 2018-09-14
- T/GDNAS 021-2022 急性冠脉综合征介入治疗术后心脏康复护理 2022-12-14
- T/CAAM 013-2015 循证针灸临床实践指南:肩周炎 2018-10-01
- T/SZKJKH 015-2023 肛肠病门诊智慧医疗诊疗规范 2023-08-11
- T/LXLY 0003-2020 老年人营养不良风险快速评估指南 2020-07-30
- T/HENANPA 011-2023 医疗机构钙通道阻滞剂类药品评价指标体系 2023-08-11
- T/ZZB 1892-2020 麻醉深度监测仪 2020-11-20
- T/SZCHA 022-2023 烧创伤专科数据集:热压烧伤 2023-12-12