如何快速的计算两个向量的相似度啊

Dylan

3231081116

发布于
2018-06-01

线上200维向量使用余弦相似度计算耗时太长

请问有什么快速的计算方式吗

java的谢谢

自然语言处理

java

阅读 5.3k

1 个回答

得票最新

morriaty_the_murderer

36421218

发布于
2019-08-09

In [18]: a.shape
Out[18]: (200,)

In [19]: b.shape
Out[19]: (200,)

In [20]: timeit dot(a, b)/(norm(a)*norm(b))
8.56 µs ± 929 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)

我用numpy测试的耗时是8µs，java没理由比这慢的。难道你的系统要求耗时连µs都嫌慢？

要么就是你的问题没有描述清楚，是不是有大量的200维数组，然后找到其中和输入数组最相似的？

这种的话，就需要一定的前置筛选条件筛选出小范围的候选数组。

比如有十万篇文章，每篇文章都被向量化成200维数组，那每次应该先通过文章类别、发表时间等筛选出约100篇候选文章，然后再去算文章向量的相似度。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

如何快速的计算两个向量的相似度啊

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?

如何 快速的 计算两个向量 的 相似度啊

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

请问是否有什么方案实现不同用户之间本地数据库的同步呢？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

一个类实现接口并且继承父类 使用Spring aop 失效?

idea 中 有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性 有什么好的办法吗?

如何快速的计算两个向量的相似度啊

一个类实现接口并且继承父类使用Spring aop 失效?

idea 中有很多个 yml配置文件 , 如果想查找 a.b.c.d.e属性有什么好的办法吗?