2025-02-14,由广东省量子工程与量子材料重点实验室、华南师范大学电子科学与技术学院(微电子学院) 等研究机构合作创建的多语言面向方面的情感分析(ABSA)数据集——M-ABSA。该数据集覆盖21种语言和7个不同领域,是目前最全面的多语言平行ABSA数据集。它为多语言情感分析研究提供了丰富的资源,能够支持跨语言、跨领域的模型评估和开发,推动多语言ABSA技术的发展。

一、研究背景

面向方面的情感分析(ABSA)是一种细粒度的情感分析任务,旨在从文本中识别出与特定方面相关的情感元素。近年来,ABSA在信息提取和情感分析领域受到了广泛关注。然而,现有的ABSA数据集大多以英语为中心,这限制了多语言情感分析研究的范围和深度。为了填补这一空白,研究者们需要构建一个高质量的多语言平行ABSA数据集,以支持跨语言和跨领域的研究。

目前遇到的困难和挑战:

1、多语言数据稀缺:现有的ABSA数据集大多集中在英语上,缺乏多语言覆盖,尤其是低资源语言。

2、跨语言对齐困难:不同语言之间的情感表达方式和语言结构差异较大,导致跨语言标注和对齐存在挑战。

3、多领域覆盖不足:现有数据集在领域多样性上存在不足,难以满足跨领域研究的需求。

数据集地址:M-ABSA|情感分析数据集|多语言处理数据集

二、让我们一起来看一下M-ABSA(Multilingual ABSA)

M-ABSA是一个覆盖21种语言和7个不同领域的多语言平行面向方面的情感分析数据集,旨在推动多语言情感分析研究。

M-ABSA数据集通过自动翻译和人工审核的方式构建,包含21种语言(包括英语、中文、德语、日语等)和7个不同领域的数据(如酒店、食品、课程等)。每个领域包含约2000个句子,数据集中的每个句子都标注了方面项、方面类别和情感极性。此外,数据集还包含了隐式方面项的标注,进一步丰富了数据的细粒度信息。

数据集构建:

1、数据收集:从现有的英语ABSA数据集中收集数据,并在新的领域(如在线课程评论)中手动标注数据。

2、翻译与标注投影:将英语数据自动翻译成其他20种语言,并通过特殊标记保留方面项的标注。

3、人工审核:对翻译后的数据进行人工审核,修正翻译错误和遗漏。

4、质量评估:通过一致性(aspect accuracy和chrF++)和保真度(BERTScore、SBERT和BLEU)评估翻译质量。

数据集特点:

多语言平行:包含21种语言,覆盖多种语言家族,支持跨语言研究。

多领域覆盖:涵盖7个不同领域,支持跨领域研究。

高质量标注:通过人工审核和质量评估,确保数据的准确性和可靠性。

细粒度信息:包含方面项、方面类别和情感极性的标注,支持细粒度的情感分析任务

基准测试:

跨语言迁移学习:使用mT5模型进行零样本跨语言迁移学习,评估模型在不同语言上的性能。

跨领域迁移学习:在不同领域之间进行迁移学习,评估模型的领域适应性。

多语言模型评估:使用多种多语言预训练模型(如Llama、Mistral等)进行零样本评估,比较不同模型的性能。

图片

            M-ABSA数据集的构建过程

图片

        英语ABSA数据集翻译前的统计情况

图片
在将英语翻译为所有目标语言后,每个数据集中未翻译和遗漏的统计情况。
图片

                翻译质量评估

图片
在以英语为中心的零样本迁移方式下,mT5在TASD和UABSA任务中的主要结果。
图片
针对餐厅领域的TASD任务的零样本微调。(a):跨语言性能表现;(b):在餐厅领域测试集中选定源语言的T-SNE可视化。
图片
Avatar大型语言模型(LLM)在零样本学习(zero-shot)情况下与mT5微调(fine-tuning)结果的对比,针对TASD和UABSA任务的实验结果。这些结果在7个不同领域中进行了平均
图片

    单源跨领域UABSA在M-ABSA(英文、中文)上的F1分数。
    

三、让我们一起来看一下M-ABSA应用场景

比如:在线旅游平台的情感分析

假设我们是一家在线旅游平台,叫“说走就走,人生不留遗憾”。我们的平台上既有酒店预订,也有餐厅推荐。用户会在平台上留下各种评论,比如对酒店的评价和对餐厅的评价。我们想通过情感分析来了解用户对酒店和餐厅的满意度,从而改进服务和推荐更受欢迎的地方。

以前是怎么工作的

  1. 数据收集

以前,我们要分别收集酒店评论和餐厅评论的数据。这可不是一件容易的事:

酒店评论:我们得从酒店预订系统里导出用户评论,还得手动筛选出有用的评论。

餐厅评论:同样,从餐厅推荐系统里导出评论,再筛选一遍。

  1. 数据标注

数据收集完后,还得找人标注情感倾向。这一步特别麻烦:

酒店评论标注:找标注员逐句读评论,标注“干净”是正面情感,“房间小”是负面情感。

餐厅评论标注:同样的流程,标注“味道好”是正面情感,“上菜慢”是负面情感。

标注员得分别熟悉酒店和餐厅的常见情感表达,标注过程不仅耗时,还容易出错。

  1. 模型训练

有了标注好的数据后,就得分别训练两个模型:

酒店评论模型:用酒店评论数据训练一个模型,让它学会判断“服务好”“房间舒适”等情感。

餐厅评论模型:用餐厅评论数据训练另一个模型,让它学会判断“菜品美味”“环境嘈杂”等情感。

每个模型都要单独调优,而且因为数据量有限,模型的泛化能力也不够强。

  1. 模型部署和维护

训练好的模型部署到平台上后,还得分别维护:

酒店评论模型:定期更新数据,重新训练。

餐厅评论模型:同样,定期更新数据,重新训练。

整个流程不仅复杂,而且成本很高,开发周期也很长。

哎,我给你讲啊,我们现在是怎么工作的

  1. 数据收集

现在有了M-ABSA数据集,我们直接从数据集中提取酒店和餐厅领域的评论数据。这些数据已经标注好了情感倾向,省去了自己收集和标注的麻烦。

  1. 模型训练

现在我们只需要训练一个模型,而不是两个:

统一模型:用M-ABSA数据集中的酒店和餐厅评论数据一起训练一个模型。这个模型可以同时学习酒店和餐厅领域的情感表达方式。

迁移学习:我们先在酒店领域训练模型,让它学会判断“服务好”“房间干净”等情感。然后,我们把这个模型迁移到餐厅领域,让它快速适应“菜品美味”“环境舒适”等情感表达。

  1. 模型优化

因为用的是同一个模型,我们可以统一优化它:

通用特征学习:模型可以学习到一些通用的情感表达方式,比如“好”“差”“满意”“不满意”等,这些在酒店和餐厅领域都适用。

领域适应:模型还可以学习到每个领域的特定情感表达,比如酒店领域的“床很软”,餐厅领域的“菜品新鲜”。

  1. 模型部署和维护

训练好的模型部署到平台上后,维护也更简单了:

统一更新:只需要定期更新一个模型,而不是两个。

性能提升:因为模型在多个领域上都有数据,它的泛化能力更强,表现也更好。

现在有了M-ABSA数据集,我们可以用一个模型处理多个领域的情感分析,开发周期缩短了一半,成本大幅降低,模型性能也更好了!这就是多领域情感分析带来的巨大好处!

更多开源的数据集,请打开遇见数据集:
数据集地址:遇见数据集


数据猎手小k
1 声望0 粉丝

为你解读每一个数据集背后的故事。