安装 nltk 支持包时出错:nltk.download()

新手上路,请多包涵

我已经安装了 nltk 包。之后,我尝试使用 nltk.download() 下载支持包,但出现错误:

[错误号 11001] 获取地址信息

我的机器/软件详细信息是:

操作系统:Windows 8.1 Python:3.3.4 NLTK 包:3.0

以下是在 python 中运行的命令:

 Python 3.3.4 (v3.3.4:7ff62415e426, Feb 10 2014, 18:13:51) [MSC v.1600 64 bit (AMD64)] on win32
Type "copyright", "credits" or "license()" for more information.

import nltk

nltk.download()
showing info http://nltk.github.com/nltk_data/
True

nltk.download("all")
[nltk_data] Error loading all: <urlopen error [Errno 11001]
[nltk_data]     getaddrinfo failed>
False

在此处输入图像描述

它看起来像是要去 http://nltk.github.com/nltk_data/ 而理想情况下它应该尝试从 http://www.nltk.org/nltk_data/ 获取数据。

在另一台机器上,当我们在浏览器中键入 http://nltk.github.com/nltk_data/ 时,它会重定向到 http://www.nltk.org/nltk_data/ 。我不明白为什么我的笔记本电脑上没有发生重定向。

我觉得这可能是问题所在。

请帮忙。

我添加了命令提示符屏幕截图。需要帮忙..

在此处输入图像描述

问候,邦森

原文由 Bonson 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.4k
2 个回答

得到了解决方案。我的问题是,当 NLTK 下载器启动时,它的服务器索引为 - http://nltk.github.com/nltk_data/

这需要更改为 - http://nltk.org/nltk_data/

您可以通过进入 NLTK 下载器窗口和文件 -> 更改服务器索引来更改它。

问候,邦森

原文由 Bonson 发布,翻译遵循 CC BY-SA 3.0 许可协议

试试下面的代码。它已按预期下载包

import nltk
import ssl

try:
    _create_unverified_https_context = ssl._create_unverified_context
except AttributeError:
    pass
else:
    ssl._create_default_https_context = _create_unverified_https_context

nltk.download()

在链接被破坏之前看起来已经被 ssl 修复了。

注意:- MAC 已被使用

原文由 Swarit Agarwal 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
logo
Stack Overflow 翻译
子站问答
访问
宣传栏