近年来,情感识别技术因其在心理学、人机交互和市场营销等多个领域的应用而受到广泛关注。构建有效的情感检测系统的核心是带有情感标签的高质量数据集。本文深入探讨了情感检测领域中可用的顶级数据集,分析了它们的特点、优势以及对推进情感理解和解释研究的贡献。
关键因素
在选择情感识别数据集时,有几个关键因素需要考虑:
数据质量:确保准确可靠的标注。
情感多样性:代表广泛的情绪和表情。
数据量:为模型训练提供足够的样本。
上下文信息:包含相关上下文以实现细微理解。
基准地位:在研究社区中的认可度,用于基准测试。
可访问性:对研究人员和实践者的可用性和可访问性。
情感识别领域顶级数据集
以下是情感识别领域可用的顶级数据集列表:
FER2023是一个包含灰度人脸图像的数据集。每张图像的尺寸为48×48像素,标注了七种基本情绪之一:愤怒、厌恶、恐惧、快乐、悲伤、惊讶或中性。它包含了35000多张图像,成为情感识别研究和应用的重要资源。FER2023最初是为了2013年的Kaggle面部表情识别挑战赛而策划的。自那以后,这个数据集已成为该领域的标准基准。
AffectNet是一个包含超过一百万张面部照片的数据集,这些照片标注了七种基本情绪:愤怒、厌恶、恐惧、愉悦、悲伤、惊讶和中性。该数据集通过涵盖包括年龄、性别和种族在内的广泛人群,确保了情感表现的多样性和包容性。每张图像都精确标注了其情感状态,提供了用于训练和评估的真实标注。
CK+(扩展Cohn-Kanade)是Cohn-Kanade数据集的扩展,专门为涉及情感识别和面部表情分析的任务而创建。它包含了在实验室环境下严格指导下拍摄的各种面部表情。情感识别算法可以从CK+提供的价值数据中受益,因为它专注于自发表情。CK+也是情感计算学术界和实践者的重要资源,提供了包括情感标签和面部地标位置在内的全面标注。