puppeteer截圖


puppeteer

puppeteer是谷歌官方出品的一個通過 DevTools 協議控制 headless Chrome 的Node庫。可以通過Puppeteer的提供的api直接控制Chrome模擬大部分用戶操作來進行UI Test或者作為爬蟲訪問頁面來收集數據。

安裝

直接運行安裝命令:

npm install puppeteer

如果出現無法安裝的問題,可以使用淘寶鏡像。

puppeteer實現滑動截圖

在我 puppeteer 使用截全屏的過程中發現有些圖片無法截取到,而實際上是因為有些圖片是懶加載的,如果你沒有滑動到圖片的位置,那么這個圖片是不會加載。

現在我的方式是采用模擬瀏覽器滾動條滑動的方式滑動底部來使圖片加載出來。

代碼如下:

const puppeteer = require('puppeteer');

(async () => {
    const browser = await puppeteer.launch({
        headless: false
    });
    const page = await browser.newPage();
    await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
    await page.setViewport({
        width: 1200,
        height: 800
    });

    await autoScroll(page);

    await page.screenshot({
        path: '1.png',
        fullPage: true
    });

    await browser.close();
})();


function autoScroll(page) {
    return page.evaluate(() => {
        return new Promise((resolve, reject) => {
            var totalHeight = 0;
            var distance = 100;
            var timer = setInterval(() => {
                var scrollHeight = document.body.scrollHeight;
                window.scrollBy(0, distance);
                totalHeight += distance;
                if (totalHeight >= scrollHeight) {
                    clearInterval(timer);
                    resolve();
                }
            }, 100);
        })
    });
}

動圖如下:

puppeteer-screenshot

puppeteer 實現 html element 截圖

在某些情況下我們只想要針對html的某個位置進行截圖而不是針對頁面截全屏。

puppeteer提供了ElementHandle.screenshot 方法,該方法參數和page.screenshot 一樣。而ElementHandle 對象是頁面內的Dom對象。可以幫助我對 html element進行截圖。這樣的話你想截取頁面的哪部分就截取頁面的哪部分。

代碼如下:

const puppeteer = require('puppeteer');

(async () => {
    const browser = await puppeteer.launch({
        headless: false
    });
    const page = await browser.newPage();
    await page.goto('https://www.cnblogs.com/morethink/p/6525216.html');
    await page.setViewport({
        width: 1200,
        height: 800
    });
    //獲取頁面Dom對象
    let body = await page.$('#cnblogs_post_body');
    //調用頁面內Dom對象的 screenshot 方法進行截圖
    await body.screenshot({
        path: '2.png'
    });
    await browser.close();
})();

參考文檔

  1. https://github.com/GoogleChrome/puppeteer/blob/v1.11.0/docs/api.md#elementhandlescreenshotoptions


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM