时间:2023-05-27 03:39:01 | 来源:网站运营
时间:2023-05-27 03:39:01 来源:网站运营
采用Selenium、ChormeDriver和pdfkit生成网页的pdf:scp wkhtmltox-0.12.6-1.centos7.x86_64.rpm tn@10.211.55.22:~/soft/
3)安装 sudo rpm -ivh wkhtmltox-0.12.6-1.centos7.x86_64.rpm
报错: 错误:依赖检测失败: xorg-x11-fonts-75dpi 被 wkhtmltox-1:0.12.6-1.centos7.x86_64 需要
安装xorg-x11-fonts-75dpi: sudo yum install xorg-x11-fonts-75dpi
再次安装: sudo rpm -ivh wkhtmltox-0.12.6-1.centos7.x86_64.rpm
4)在/usr/local/bin/目录下可以看到安装了wkhtmltoimage 和 wkhtmltopdf wkhtmltopdf http://www.baidu.com ~/test.pdf
执行成功后,打开test.pdf,看到下面效果,说明安装成功 conda create --name python3.6.6 python=3.6.6
进入Python 3.6.6环境(后续所有命令都是在此环境下操作):source activate python3.6.6
2)安装pdfkitpip install pdfkit
3)示例import pdfkitpdf_options = { 'page-size': 'A4',}url = 'https://www.baidu.com/'pdfkit.from_url(url, 'test.pdf', options=pdf_options)
打开test.pdf看到baidu页面,说明pdfkit安装成功scp ~/Downloads/chromedriver_linux64.zip tn@10.211.55.22:~/soft/
解压:unzip chromedriver_linux64.zip
移动:sudo mv chromedriver /usr/local/bin/chromedriver
查看chromedriver版本: chromedriver --version
显示版本:ChromeDriver 86.0.4240.22 pip install selenium
import pdfkit, time, pprintfrom selenium import webdriveroptions_chrome = webdriver.ChromeOptions()# 以最高权限运行options_chrome.add_argument('--no-sandbox')# 浏览器不提供可视化页面,linux下如果系统不支持可视化不加这条会启动失败options_chrome.add_argument('--headless')# executable_path为chromedriver的位置driver = webdriver.Chrome(executable_path='/usr/local/bin/chromedriver', chrome_options=options_chrome)# 浏览器全屏driver.fullscreen_window()url = 'http://www.tn666.com/test?id=1'driver.get(url)# sleep 1秒time.sleep(1)source_text = driver.page_sourceoptions_pdf = { 'page-size': 'A4'}result = pdfkit.from_string(source_text, 'test.pdf', options=options_pdf)driver.quit()
请将url换为您想转为pdf的url关键词:采用