利用nodejs,request包 定時爬去 網站視頻ts接口,大概有1771個文件。
首先,獲取到網站的ts視頻分段配置文件,獲取到后,放入本地文件,方便下次使用。
然后,定時調用下載函數,進行下載,
爬去過程中會有下載失敗的,所有我在爬去完畢后,檢查下載失敗的,再次進行下載,
最后,exec包執行cmd命令 進行合成一個ts文件
const request = require("request"); const fs = require("fs"); const { exec } = require('child_process'); const emptyFile = []; const failDownload = []; function reload(results) { results.forEach(el => { let checkUrl = './download/' + el;
//檢查文件是否已經存在 if(fs.existsSync(checkUrl)) {
//獲取文件信息 const r = fs.statSync(checkUrl);
//如果大小為0,則是下載失敗的 if(r && r.size == 0) { emptyFile.push(el);
//刪除下載失敗的 const del = fs.unlinkSync(checkUrl); if(del) { throw '刪除ts文件異常' } else { console.log(el + '刪除成功') }
//重新下載 download(el) } } else { download(el) } }); }
//這個合成函數在編輯中運行會報錯,暫且復制到cmd中運行的 function composite() {
// "/b":表示按二進制合並;不加就默認按字符轉合並,會出問題 exec("copy /b H:\self-study\下載視頻流\download\*.ts H:\self-study\下載視頻流\download\冷血追擊.ts", (error, stdout, stderr) => { if (error) { console.error(`執行的錯誤: ${error}`); return; } console.log(`stdout: ${stdout}`); console.error(`stderr: ${stderr}`); }); } function download(url) { const baseUrl = 'https://youku.com-qq.net/20190502/181_7ffa42fa/1000k/hls/'; const downloadUrl = __dirname + '/download/' + url; request(baseUrl + url, (error, response, body) => { if(response) { failDownload.push(url); console.log(url + '下載成功') } if(error) { console.log(url + '下載失敗') } }) .pipe(fs.createWriteStream(downloadUrl))
//下載后,按流直接寫入本地文件 } const reg = /(\w+\.ts)/mg; function getList(cb) { const getListFile = './download/getlist.txt'; function doGetAgain () { //獲取ts分段配置文件 request.get('https://youku.com-qq.net/20190502/181_7ffa42fa/1000k/hls/index.m3u8',(error, response, body) => { if(typeof body == 'string') { let results = body.match(reg); console.log(results); fs.writeFileSync(getListFile, results.join(',')) cb && cb(results); console.log('從服務器獲取') return results; } }) } //檢車本地是否有該文件 if(fs.existsSync(getListFile)) { let data = fs.readFileSync(getListFile, 'utf-8'); if(data) { console.log('從本地獲取'); cb(data.split(',')); } else { return doGetAgain(cb); } } return doGetAgain(cb); }
function tickerGet(results) { const len = results.length -1; let i = 0; const ticker = setInterval(() => { if(i <= len) { download(results[i]); i++; } else { clearInterval(ticker); reload(results); } }, 3000) }
getList(r => { //定時獲取下載 tickerGet(r); //重新下載失敗的文件 reload(r) //合成 composite(); });