如何在 Selenium (Python) 中将打开的页面保存为 pdf

新手上路,请多包涵

已经尝试了我可以在 Internet 上找到的所有解决方案,以便能够在 Python 中打印在 Selenium 中打开的页面。然而,当打印弹出窗口出现时,一两秒钟后它就会消失,并且没有保存 PDF。

这是正在尝试的代码。基于此处的代码 - https://stackoverflow.com/a/43752129/3973491

使用 Mojave 10.14.5 在 Mac 上编码。

 from selenium import webdriver
from selenium.webdriver.support.select import Select
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.chrome.options import Options
from selenium.common.exceptions import WebDriverException
import time
import json

options = Options()
appState = {
    "recentDestinations": [
        {
            "id": "Save as PDF",
            "origin": "local"
        }
    ],
    "selectedDestinationId": "Save as PDF",
    "version": 2
}

profile = {'printing.print_preview_sticky_settings.appState': json.dumps(appState)}
# profile = {'printing.print_preview_sticky_settings.appState':json.dumps(appState),'savefile.default_directory':downloadPath}
options.add_experimental_option('prefs', profile)
options.add_argument('--kiosk-printing')
CHROMEDRIVER_PATH = '/usr/local/bin/chromedriver'

driver = webdriver.Chrome(options=options, executable_path=CHROMEDRIVER_PATH)
driver.implicitly_wait(5)
driver.get(url)
driver.execute_script('window.print();')

 $chromedriver --v
ChromeDriver 75.0.3770.90 (a6dcaf7e3ec6f70a194cc25e8149475c6590e025-refs/branch-heads/3770@{#1003})

关于如何将打开的 html 页面打印为 PDF 的任何提示或解决方案。花了几个小时试图使这项工作。谢谢!


2019-07-11 更新:

我的问题已被确定为重复问题,但 a) 另一个问题似乎使用了 javascript 代码,并且 b) 答案没有解决这个问题中提出的问题——它可能与更新的软件版本有关。使用的 Chrome 版本是 Version 75.0.3770.100 (Official Build) (64-bit),chromedriver 是 ChromeDriver 75.0.3770.90。在 Mac 操作系统 Mojave 上。脚本在 Python 3.7.3 上运行。

2019-07-11 更新:

将代码更改为

from selenium import webdriver
import json

chrome_options = webdriver.ChromeOptions()
settings = {
    "appState": {
        "recentDestinations": [{
            "id": "Save as PDF",
            "origin": "local",
            "account": "",
        }],
        "selectedDestinationId": "Save as PDF",
        "version": 2
    }
}
prefs = {'printing.print_preview_sticky_settings': json.dumps(settings)}
chrome_options.add_experimental_option('prefs', prefs)
chrome_options.add_argument('--kiosk-printing')
CHROMEDRIVER_PATH = '/usr/local/bin/chromedriver'
driver = webdriver.Chrome(chrome_options=chrome_options, executable_path=CHROMEDRIVER_PATH)
driver.get("https://google.com")
driver.execute_script('window.print();')
driver.quit()

而现在,什么也没有发生。 Chrome 启动,加载 url,出现打印对话框,但随后似乎什么也没有发生——默认打印机队列中没有任何内容,也没有 pdf——我什至通过在 Mac 上查找“最近的文件”来搜索 PDF 文件。

原文由 jim70 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 1.8k
1 个回答

当我的操作系统中没有任何其他打印机设置时, 此处 的答案有效。但是当我有另一台默认打印机时,这不起作用。

我不明白如何做,但以这种方式进行小改动似乎可行。

 from selenium import webdriver
import json

chrome_options = webdriver.ChromeOptions()
settings = {
       "recentDestinations": [{
            "id": "Save as PDF",
            "origin": "local",
            "account": "",
        }],
        "selectedDestinationId": "Save as PDF",
        "version": 2
    }
prefs = {'printing.print_preview_sticky_settings.appState': json.dumps(settings)}
chrome_options.add_experimental_option('prefs', prefs)
chrome_options.add_argument('--kiosk-printing')
CHROMEDRIVER_PATH = '/usr/local/bin/chromedriver'
driver = webdriver.Chrome(chrome_options=chrome_options, executable_path=CHROMEDRIVER_PATH)
driver.get("https://google.com")
driver.execute_script('window.print();')
driver.quit()

原文由 Kamal 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题