當前位置:首頁 » 網頁前端 » 前端js抓取html頁面
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

前端js抓取html頁面

發布時間: 2023-03-01 07:36:19

前端只有 js,動態載入 html 內容是什麼技術

AJAX,頁面無刷新(或頁面局部刷新),還有種情況就是你看著是HTML的靜態網頁,但是人家使用了URL重寫技術,將一個動態網站偽裝成一個靜態網站

Ⅱ Nodejs中怎麼獲取HTML中一個form下的所有POST數據

首先獲取http,並創建一個web服務,監聽本地埠1337,這個可以修改,任何未被佔用的埠都可以用,並堅挺data事件和end事件,整個文件保存為app.js


下面這里貼上測試代碼

////////////////app.js///////

var http = require('http');

var server = http.createServer(function(req,res){

if(req.url!=="/favicon.ico"){

req.on('data',function(data){

console.log("伺服器接收到的數據:"+decodeURIComponent(data));

});

req.on("end",function(){

console.log('客戶端請求數據全部接收完畢');

});

}

res.end();

}).listen(1337,"localhost",function(){

console.log("listened");

});

////////////////index.html///////

<!DOCTYPE html>

<html>

<head>

<meta charset="UTF-8">

<title>Nodejs的data事件與end事件的回調函數測試用頁面</title>

</head>

<body>

<form id= "form1" action = "http://localhost:1337/" method = "post">

姓名:<input type = 'text' name = "name" value ="dragon"><br/>

年齡:<input type = "number" name = "age" value ="25">

<input type = "submit" value =" 提交"/>

</form>

</body>

</html>

Ⅲ 前端js爬蟲

純粹前端的js 是不能 跨域 獲取 cookie的
xxx.com 的js 代碼 只能得到 xxx.com的cookie,拿不到 yyy.com
當然如果你有辦法 在 yyy.com 寫入受到自己控制的 html文件,你就可以寫代碼去拿到 對應的cookie,但看你的需求 應該你沒有yyy.com 的許可權
所以 要結合其他方案,推薦一下兩種:
使用 electron ,electron 你可以認為是受js控制的瀏覽器引擎,所以你可以用它訪問 yyy.com 拿到cookie,再接著做你的事情
或者 使用 puppeteer(Google 官方出品的 headless Chrome node 庫)
Puppeteer 提供了一系列的 API,可以在無 UI 的情況下調用 Chrome 的各種功能,適用於爬蟲、自動化處理等各種情景。