我试图在计算服务器上下载/更新 python nltk
包,它返回了这个 [Errno 122] Disk quota exceeded:
错误。
具体来说:
[nltk_data] Downloading package stop words to /home/sh2264/nltk_data...
[nltk_data] Error downloading u'stopwords' from
[nltk_data] <https://raw.githubusercontent.com/nltk/nltk_data/gh-
[nltk_data] pages/packages/corpora/stopwords.zip>: [Errno 122]
[nltk_data] Disk quota exceeded:
[nltk_data] u'/home/sh2264/nltk_data/corpora/stopwords.zip
False
我如何更改 nltk
包的整个路径,以及我应该进行哪些其他更改以确保无错误地加载 nltk
?
原文由 shenglih 发布,翻译遵循 CC BY-SA 4.0 许可协议
这可以通过命令行(
nltk.download(..., download_dir=)
或通过 GUI 配置。奇怪的是 nltk 似乎完全忽略了它自己的环境变量NLTK_DATA
并将其下载目录默认为一组标准的五个路径,不管NLTK_DATA
是否被定义以及它指向哪里,也不管 nltk 的五个默认目录是否存在于机器或架构上(!)。其中一些记录在 安装 NLTK 数据 中,尽管它不完整并且有点掩埋;转载如下,格式更清晰:现在 关于 NLTK_DATA 应该使用什么推荐路径,nltk 并没有真正给出任何正确的指导,但它应该是一个通用的独立路径,不在任何安装树下(所以不在
<python-install-directory>/lib/site-packages
下)或任何用户目录。因此,/usr/local/share
,/opt/share
或类似的。在 MacOS 10.7+ 上,/usr
以及/usr/local/
这些天默认隐藏,所以/opt/share
可能是更好的选择。或者做chflags nohidden /usr/local/share
。