2025-02-14,由广东省量子工程与量子材料重点实验室、华南师范大学电子科学与技术学院(微电子学院) 等研究机构合作创建的多语言面向方面的情感分析(ABSA)数据集——M-ABSA。该数据集覆盖21种语言和7个不同领域,是目前最全面的多语言平行ABSA数据集。它为多语言情感分析研究提供了丰富的资源,能够支持跨语言、跨领域的模型评估和开发,推动多语言ABSA技术的发展。
一、研究背景
面向方面的情感分析(ABSA)是一种细粒度的情感分析任务,旨在从文本中识别出与特定方面相关的情感元素。近年来,ABSA在信息提取和情感分析领域受到了广泛关注。然而,现有的ABSA数据集大多以英语为中心,这限制了多语言情感分析研究的范围和深度。为了填补这一空白,研究者们需要构建一个高质量的多语言平行ABSA数据集,以支持跨语言和跨领域的研究。
目前遇到的困难和挑战:
1、多语言数据稀缺:现有的ABSA数据集大多集中在英语上,缺乏多语言覆盖,尤其是低资源语言。
2、跨语言对齐困难:不同语言之间的情感表达方式和语言结构差异较大,导致跨语言标注和对齐存在挑战。
3、多领域覆盖不足:现有数据集在领域多样性上存在不足,难以满足跨领域研究的需求。
数据集地址:M-ABSA|情感分析数据集|多语言处理数据集
二、让我们一起来看一下M-ABSA(Multilingual ABSA)
M-ABSA是一个覆盖21种语言和7个不同领域的多语言平行面向方面的情感分析数据集,旨在推动多语言情感分析研究。
M-ABSA数据集通过自动翻译和人工审核的方式构建,包含21种语言(包括英语、中文、德语、日语等)和7个不同领域的数据(如酒店、食品、课程等)。每个领域包含约2000个句子,数据集中的每个句子都标注了方面项、方面类别和情感极性。此外,数据集还包含了隐式方面项的标注,进一步丰富了数据的细粒度信息。
数据集构建:
1、数据收集:从现有的英语ABSA数据集中收集数据,并在新的领域(如在线课程评论)中手动标注数据。
2、翻译与标注投影:将英语数据自动翻译成其他20种语言,并通过特殊标记保留方面项的标注。
3、人工审核:对翻译后的数据进行人工审核,修正翻译错误和遗漏。
4、质量评估:通过一致性(aspect accuracy和chrF++)和保真度(BERTScore、SBERT和BLEU)评估翻译质量。
数据集特点:
多语言平行:包含21种语言,覆盖多种语言家族,支持跨语言研究。
多领域覆盖:涵盖7个不同领域,支持跨领域研究。
高质量标注:通过人工审核和质量评估,确保数据的准确性和可靠性。
细粒度信息:包含方面项、方面类别和情感极性的标注,支持细粒度的情感分析任务
基准测试:
跨语言迁移学习:使用mT5模型进行零样本跨语言迁移学习,评估模型在不同语言上的性能。
跨领域迁移学习:在不同领域之间进行迁移学习,评估模型的领域适应性。
多语言模型评估:使用多种多语言预训练模型(如Llama、Mistral等)进行零样本评估,比较不同模型的性能。
M-ABSA数据集的构建过程
英语ABSA数据集翻译前的统计情况
在将英语翻译为所有目标语言后,每个数据集中未翻译和遗漏的统计情况。
翻译质量评估
在以英语为中心的零样本迁移方式下,mT5在TASD和UABSA任务中的主要结果。
针对餐厅领域的TASD任务的零样本微调。(a):跨语言性能表现;(b):在餐厅领域测试集中选定源语言的T-SNE可视化。
Avatar大型语言模型(LLM)在零样本学习(zero-shot)情况下与mT5微调(fine-tuning)结果的对比,针对TASD和UABSA任务的实验结果。这些结果在7个不同领域中进行了平均
单源跨领域UABSA在M-ABSA(英文、中文)上的F1分数。
三、让我们一起来看一下M-ABSA应用场景
比如:在线旅游平台的情感分析
假设我们是一家在线旅游平台,叫“说走就走,人生不留遗憾”。我们的平台上既有酒店预订,也有餐厅推荐。用户会在平台上留下各种评论,比如对酒店的评价和对餐厅的评价。我们想通过情感分析来了解用户对酒店和餐厅的满意度,从而改进服务和推荐更受欢迎的地方。
以前是怎么工作的
- 数据收集
以前,我们要分别收集酒店评论和餐厅评论的数据。这可不是一件容易的事:
酒店评论:我们得从酒店预订系统里导出用户评论,还得手动筛选出有用的评论。
餐厅评论:同样,从餐厅推荐系统里导出评论,再筛选一遍。
- 数据标注
数据收集完后,还得找人标注情感倾向。这一步特别麻烦:
酒店评论标注:找标注员逐句读评论,标注“干净”是正面情感,“房间小”是负面情感。
餐厅评论标注:同样的流程,标注“味道好”是正面情感,“上菜慢”是负面情感。
标注员得分别熟悉酒店和餐厅的常见情感表达,标注过程不仅耗时,还容易出错。
- 模型训练
有了标注好的数据后,就得分别训练两个模型:
酒店评论模型:用酒店评论数据训练一个模型,让它学会判断“服务好”“房间舒适”等情感。
餐厅评论模型:用餐厅评论数据训练另一个模型,让它学会判断“菜品美味”“环境嘈杂”等情感。
每个模型都要单独调优,而且因为数据量有限,模型的泛化能力也不够强。
- 模型部署和维护
训练好的模型部署到平台上后,还得分别维护:
酒店评论模型:定期更新数据,重新训练。
餐厅评论模型:同样,定期更新数据,重新训练。
整个流程不仅复杂,而且成本很高,开发周期也很长。
哎,我给你讲啊,我们现在是怎么工作的
- 数据收集
现在有了M-ABSA数据集,我们直接从数据集中提取酒店和餐厅领域的评论数据。这些数据已经标注好了情感倾向,省去了自己收集和标注的麻烦。
- 模型训练
现在我们只需要训练一个模型,而不是两个:
统一模型:用M-ABSA数据集中的酒店和餐厅评论数据一起训练一个模型。这个模型可以同时学习酒店和餐厅领域的情感表达方式。
迁移学习:我们先在酒店领域训练模型,让它学会判断“服务好”“房间干净”等情感。然后,我们把这个模型迁移到餐厅领域,让它快速适应“菜品美味”“环境舒适”等情感表达。
- 模型优化
因为用的是同一个模型,我们可以统一优化它:
通用特征学习:模型可以学习到一些通用的情感表达方式,比如“好”“差”“满意”“不满意”等,这些在酒店和餐厅领域都适用。
领域适应:模型还可以学习到每个领域的特定情感表达,比如酒店领域的“床很软”,餐厅领域的“菜品新鲜”。
- 模型部署和维护
训练好的模型部署到平台上后,维护也更简单了:
统一更新:只需要定期更新一个模型,而不是两个。
性能提升:因为模型在多个领域上都有数据,它的泛化能力更强,表现也更好。
现在有了M-ABSA数据集,我们可以用一个模型处理多个领域的情感分析,开发周期缩短了一半,成本大幅降低,模型性能也更好了!这就是多领域情感分析带来的巨大好处!
更多开源的数据集,请打开遇见数据集:
数据集地址:遇见数据集
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。