pywebcopy复制的网站是有什么解决办法吗?

python3.9

程序如下:

    from pywebcopy import save_webpage

save_webpage(


url='http://www.hippter.com/',
project_folder='D:/Python/script',
project_name='my_site3',
bypass_robots=True,#  调试
debug=True,
open_in_browser=True,# 在浏览器中打开
delay=None,# 延迟
threaded=False,# 线程

)

问题:

 如何显示中文,不出现乱码?
阅读 921
avatarAI BotBETA

可以使用以下代码来解决中文显示乱码的问题:

from pywebcopy import save_webpage

save_webpage(
    url='http://www.hippter.com/',
    project_folder='D:/Python/script',
    project_name='my_site3',
    bypass_robots=True,
    debug=True,
    open_in_browser=True,
    delay=None,
    threaded=False,
    encoding='utf-8' # 指定编码格式为utf-8
)

save_webpage函数的参数中,添加encoding='utf-8'这一行代码,指定编码格式为utf-8,就可以避免中文显示乱码的问题。

1 个回答

第三方库:

from bs4 import BeautifulSoup

with open('path/to/your/saved/html/file.html', 'r', encoding='utf-8') as file:
    soup = BeautifulSoup(file, 'html.parser')

if soup.meta:
    soup.meta['charset'] = 'utf-8'
else:
    soup.head.append(soup.new_tag('meta', charset='utf-8'))

with open('path/to/your/saved/html/file.html', 'w', encoding='utf-8') as file:
    file.write(str(soup))
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题