主要是想做命名实体识别的标注;
具体来说,有两个excel文件,称之为A(n行1列),B(n行1列)。
举例来说,A中每一行是一句描述性质的话,B中每一行都是一个实体名
请问该如何高效地实现类似以下的功能:
for index,row in A.iterrows():
要判断row['描述']这一句话是否包含了B中的一个或者多个实体,并在A中进行标注
求指点思路。
主要是想做命名实体识别的标注;
具体来说,有两个excel文件,称之为A(n行1列),B(n行1列)。
举例来说,A中每一行是一句描述性质的话,B中每一行都是一个实体名
请问该如何高效地实现类似以下的功能:
for index,row in A.iterrows():
要判断row['描述']这一句话是否包含了B中的一个或者多个实体,并在A中进行标注
求指点思路。
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
2 回答857 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
加入 A 和 B 都足够大的话可以把 B 的内容放在 AC 自动机里面,然后取用 A 的内容匹配)