我有一个名字列表,例如:
names = ['A', 'B', 'C', 'D']
和一份文件清单,在每份文件中都提到了其中一些名字。
document =[['A', 'B'], ['C', 'B', 'K'],['A', 'B', 'C', 'D', 'Z']]
我想得到一个输出作为共同出现的矩阵,比如:
A B C D
A 0 2 1 1
B 2 0 2 1
C 1 2 0 1
D 1 1 1 0
在 R 中有针对此问题的解决方案( 创建共现矩阵),但我无法在 Python 中完成。我正在考虑在 Pandas 中做这件事,但还没有进展!
原文由 mk_sch 发布,翻译遵循 CC BY-SA 4.0 许可协议
显然,这可以根据您的目的进行扩展,但它执行的是一般操作: