M-ABSA数据集：首个涵盖21种语言和7个领域的多语言平行面向方面的情感分析数据集

2025-02-14，由广东省量子工程与量子材料重点实验室、华南师范大学电子科学与技术学院（微电子学院）等研究机构合作创建的多语言面向方面的情感分析（ABSA）数据集——M-ABSA。该数据集覆盖21种语言和7个不同领域，是目前最全面的多语言平行ABSA数据集。它为多语言情感分析研究提供了丰富的资源，能够支持跨语言、跨领域的模型评估和开发，推动多语言ABSA技术的发展。

一、研究背景

面向方面的情感分析（ABSA）是一种细粒度的情感分析任务，旨在从文本中识别出与特定方面相关的情感元素。近年来，ABSA在信息提取和情感分析领域受到了广泛关注。然而，现有的ABSA数据集大多以英语为中心，这限制了多语言情感分析研究的范围和深度。为了填补这一空白，研究者们需要构建一个高质量的多语言平行ABSA数据集，以支持跨语言和跨领域的研究。

目前遇到的困难和挑战：

1、多语言数据稀缺：现有的ABSA数据集大多集中在英语上，缺乏多语言覆盖，尤其是低资源语言。

2、跨语言对齐困难：不同语言之间的情感表达方式和语言结构差异较大，导致跨语言标注和对齐存在挑战。

3、多领域覆盖不足：现有数据集在领域多样性上存在不足，难以满足跨领域研究的需求。

数据集地址：M-ABSA|情感分析数据集|多语言处理数据集

二、让我们一起来看一下M-ABSA（Multilingual ABSA）

M-ABSA是一个覆盖21种语言和7个不同领域的多语言平行面向方面的情感分析数据集，旨在推动多语言情感分析研究。

M-ABSA数据集通过自动翻译和人工审核的方式构建，包含21种语言（包括英语、中文、德语、日语等）和7个不同领域的数据（如酒店、食品、课程等）。每个领域包含约2000个句子，数据集中的每个句子都标注了方面项、方面类别和情感极性。此外，数据集还包含了隐式方面项的标注，进一步丰富了数据的细粒度信息。

数据集构建：

1、数据收集：从现有的英语ABSA数据集中收集数据，并在新的领域（如在线课程评论）中手动标注数据。

2、翻译与标注投影：将英语数据自动翻译成其他20种语言，并通过特殊标记保留方面项的标注。

3、人工审核：对翻译后的数据进行人工审核，修正翻译错误和遗漏。

4、质量评估：通过一致性（aspect accuracy和chrF++）和保真度（BERTScore、SBERT和BLEU）评估翻译质量。

数据集特点：

多语言平行：包含21种语言，覆盖多种语言家族，支持跨语言研究。

多领域覆盖：涵盖7个不同领域，支持跨领域研究。

高质量标注：通过人工审核和质量评估，确保数据的准确性和可靠性。

细粒度信息：包含方面项、方面类别和情感极性的标注，支持细粒度的情感分析任务

基准测试：

跨语言迁移学习：使用mT5模型进行零样本跨语言迁移学习，评估模型在不同语言上的性能。

跨领域迁移学习：在不同领域之间进行迁移学习，评估模型的领域适应性。

多语言模型评估：使用多种多语言预训练模型（如Llama、Mistral等）进行零样本评估，比较不同模型的性能。

            M-ABSA数据集的构建过程

        英语ABSA数据集翻译前的统计情况

在将英语翻译为所有目标语言后，每个数据集中未翻译和遗漏的统计情况。

                翻译质量评估

在以英语为中心的零样本迁移方式下，mT5在TASD和UABSA任务中的主要结果。

针对餐厅领域的TASD任务的零样本微调。(a)：跨语言性能表现；(b)：在餐厅领域测试集中选定源语言的T-SNE可视化。

Avatar大型语言模型（LLM）在零样本学习（zero-shot）情况下与mT5微调（fine-tuning）结果的对比，针对TASD和UABSA任务的实验结果。这些结果在7个不同领域中进行了平均

    单源跨领域UABSA在M-ABSA（英文、中文）上的F1分数。

三、让我们一起来看一下M-ABSA应用场景

比如：在线旅游平台的情感分析

假设我们是一家在线旅游平台，叫“说走就走，人生不留遗憾”。我们的平台上既有酒店预订，也有餐厅推荐。用户会在平台上留下各种评论，比如对酒店的评价和对餐厅的评价。我们想通过情感分析来了解用户对酒店和餐厅的满意度，从而改进服务和推荐更受欢迎的地方。

以前是怎么工作的

数据收集

以前，我们要分别收集酒店评论和餐厅评论的数据。这可不是一件容易的事：

酒店评论：我们得从酒店预订系统里导出用户评论，还得手动筛选出有用的评论。

餐厅评论：同样，从餐厅推荐系统里导出评论，再筛选一遍。

数据标注

数据收集完后，还得找人标注情感倾向。这一步特别麻烦：

酒店评论标注：找标注员逐句读评论，标注“干净”是正面情感，“房间小”是负面情感。

餐厅评论标注：同样的流程，标注“味道好”是正面情感，“上菜慢”是负面情感。

标注员得分别熟悉酒店和餐厅的常见情感表达，标注过程不仅耗时，还容易出错。

模型训练

有了标注好的数据后，就得分别训练两个模型：

酒店评论模型：用酒店评论数据训练一个模型，让它学会判断“服务好”“房间舒适”等情感。

餐厅评论模型：用餐厅评论数据训练另一个模型，让它学会判断“菜品美味”“环境嘈杂”等情感。

每个模型都要单独调优，而且因为数据量有限，模型的泛化能力也不够强。

模型部署和维护

训练好的模型部署到平台上后，还得分别维护：

酒店评论模型：定期更新数据，重新训练。

餐厅评论模型：同样，定期更新数据，重新训练。

整个流程不仅复杂，而且成本很高，开发周期也很长。

哎，我给你讲啊，我们现在是怎么工作的

数据收集

现在有了M-ABSA数据集，我们直接从数据集中提取酒店和餐厅领域的评论数据。这些数据已经标注好了情感倾向，省去了自己收集和标注的麻烦。

模型训练

现在我们只需要训练一个模型，而不是两个：

统一模型：用M-ABSA数据集中的酒店和餐厅评论数据一起训练一个模型。这个模型可以同时学习酒店和餐厅领域的情感表达方式。

迁移学习：我们先在酒店领域训练模型，让它学会判断“服务好”“房间干净”等情感。然后，我们把这个模型迁移到餐厅领域，让它快速适应“菜品美味”“环境舒适”等情感表达。

模型优化

因为用的是同一个模型，我们可以统一优化它：

通用特征学习：模型可以学习到一些通用的情感表达方式，比如“好”“差”“满意”“不满意”等，这些在酒店和餐厅领域都适用。

领域适应：模型还可以学习到每个领域的特定情感表达，比如酒店领域的“床很软”，餐厅领域的“菜品新鲜”。

模型部署和维护

训练好的模型部署到平台上后，维护也更简单了：

统一更新：只需要定期更新一个模型，而不是两个。

性能提升：因为模型在多个领域上都有数据，它的泛化能力更强，表现也更好。

现在有了M-ABSA数据集，我们可以用一个模型处理多个领域的情感分析，开发周期缩短了一半，成本大幅降低，模型性能也更好了！这就是多领域情感分析带来的巨大好处！

更多开源的数据集，请打开遇见数据集：
数据集地址：遇见数据集

M-ABSA数据集：首个涵盖21种语言和7个领域的多语言平行面向方面的情感分析数据集

一、研究背景

目前遇到的困难和挑战：

二、让我们一起来看一下M-ABSA（Multilingual ABSA）

数据集构建：

数据集特点：

基准测试：

三、让我们一起来看一下M-ABSA应用场景

数据猎手小k

引用和评论

AMO数据集：解决运动模仿偏差的超灵巧人形机器人全身控制混合数据集。

Chinese SimpleQA：包含3000个高质量问题，用来评估大型语言模型中文事实性能力的基准测试.

最全糖尿病数据集（不定时更新）

DAPO-Math-17K：17000数学题整数答案数据集，为LLM强化学习设计，确保准确奖励信号。

NAVCON：首个大规模基于认知和语言对齐的视觉语言导航预料库

Git-10M :一个全球规模的遥感图像-文本对数据集，包含1000万图像-文本对，覆盖广泛的地理场景和丰富的地理空间元数据。

GS-Blur数据集：首个基于3D场景合成的156,209对多样化真实感模糊图像数据集。