原文:多模态-中文数据集

华为悟空 悟空,华为,https: wukong dataset.github.io wukong dataset The dataset contains Million lt image, text gt pairs FLICKR的中文版 flickr k cn flickr k cn https: github.com weiyuk fluent cap COCO中文版 https: gi ...

2022-03-09 09:20 0 1121 推荐指数:

查看详情

数据集中文关系抽取数据集 DuIE 2.0

数据集来源:2020语言与智能技术竞赛:关系抽取任务:https://aistudio.baidu.com/aistudio/competition/detail/31?isFromCcf=true 该数据集有48个已定义好的schema,43个简单知识schema,5个复杂知识的schema ...

Sat Feb 20 00:12:00 CST 2021 0 1595
中文识别数据集生成脚本

概述 该脚本能够将用户指定的字符输出为不同字体的图像文件,用于训练文字识别的机器学习模型或用于其他文字识别OCR项目 详细 代码下 ...

Tue Sep 04 17:17:00 CST 2018 0 895
整理了一下NLP中文数据集

个人理解: 句子相似性判断、情感分析、实体识别、智能问答,本质基本上都是分类任务。 阅读理解(抽取式、回答式、完形填空)是逐个候选项的分类问题处理。 参考 https://gi ...

Sat Jan 04 05:41:00 CST 2020 0 3367
数据集的划分

在机器学习算法中,我们通常将原始数据集划分为三个部分(划分要尽可能保持数据分布的一致性): (1)Training set(训练): 训练模型 (2)Validation set(验证): 选择模型 (3)Testing set(测试): 评估模型 其中Validation set ...

Fri Jun 07 08:13:00 CST 2019 0 2189
cityscapes数据集

原始精细标注数据集里面其实每张图片只对应四张标注文件: xxx_gtFine_color.png, : 标注的可视化图片 xxx_gtFine_instanceIds.png :是用来做实例分割训练用的 xxx_gtFine_labelsIds.png :是语义分割训练需要 ...

Sun Dec 27 22:50:00 CST 2020 1 1333
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM