Ubuntu20.0.4 使用php-webdriver 实现爬虫

2021/9/10 7:04:00

本文主要是介绍Ubuntu20.0.4 使用php-webdriver 实现爬虫,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

参考

  1. https://blog.csdn.net/xc_zhou/article/details/82427060
  2. https://www.cnblogs.com/php12-cn/p/12609647.html
  3. https://blog.csdn.net/xingtianyao/article/details/88695125 设置ubuntu桌面开关
  4. https://blog.csdn.net/post_mans/article/details/80966589 设置ubuntu分辨率(因为截图会截不全)

步骤

  1. 安装谷歌浏览器
wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
dpkg -i google-chrome-stable_current_amd64.deb
  1. 根据 谷歌浏览器版本下载对应的 chromedriver
wget https://npm.taobao.org/mirrors/chromedriver/xxxxx
  1. 安装桌面(不安装浏览器会乱码)
# 安装桌面
sudo apt install lightdm -y
# 关闭:在图形界面下 终端输入 
sudo service lightdm stop
# 开启:在命令行输入:
sudo service lightdm start
  1. 启动并监听4444 端口
sudo chmod 777 chromedriver
./chromedriver --port=4444
  1. 代码配置参数,沙盒模式
        # 设置分辨率
        $size = new WebDriverDimension(1280, 900);
        $driver->manage()->window()->setSize($size);

        $serverUrl = 'http://localhost:4444';
        $capabilities = DesiredCapabilities::chrome();
        $options = new ChromeOptions();
       // 浏览器参数配置
       // windows 下只需要--no-sandbox,linux需要'--headless','--no-sandbox'
        $options->addArguments(['--headless','--no-sandbox']); 
        $capabilities->setCapability(ChromeOptions::CAPABILITY, $options);

        $driver = RemoteWebDriver::create($serverUrl, $capabilities, 36000000, 36000000);


这篇关于Ubuntu20.0.4 使用php-webdriver 实现爬虫的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程