当前位置:首页 » 网页前端 » 前端js抓取html页面
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

前端js抓取html页面

发布时间: 2023-03-01 07:36:19

前端只有 js,动态加载 html 内容是什么技术

AJAX,页面无刷新(或页面局部刷新),还有种情况就是你看着是HTML的静态网页,但是人家使用了URL重写技术,将一个动态网站伪装成一个静态网站

Ⅱ Nodejs中怎么获取HTML中一个form下的所有POST数据

首先获取http,并创建一个web服务,监听本地端口1337,这个可以修改,任何未被占用的端口都可以用,并坚挺data事件和end事件,整个文件保存为app.js


下面这里贴上测试代码

////////////////app.js///////

var http = require('http');

var server = http.createServer(function(req,res){

if(req.url!=="/favicon.ico"){

req.on('data',function(data){

console.log("服务器接收到的数据:"+decodeURIComponent(data));

});

req.on("end",function(){

console.log('客户端请求数据全部接收完毕');

});

}

res.end();

}).listen(1337,"localhost",function(){

console.log("listened");

});

////////////////index.html///////

<!DOCTYPE html>

<html>

<head>

<meta charset="UTF-8">

<title>Nodejs的data事件与end事件的回调函数测试用页面</title>

</head>

<body>

<form id= "form1" action = "http://localhost:1337/" method = "post">

姓名:<input type = 'text' name = "name" value ="dragon"><br/>

年龄:<input type = "number" name = "age" value ="25">

<input type = "submit" value =" 提交"/>

</form>

</body>

</html>

Ⅲ 前端js爬虫

纯粹前端的js 是不能 跨域 获取 cookie的
xxx.com 的js 代码 只能得到 xxx.com的cookie,拿不到 yyy.com
当然如果你有办法 在 yyy.com 写入受到自己控制的 html文件,你就可以写代码去拿到 对应的cookie,但看你的需求 应该你没有yyy.com 的权限
所以 要结合其他方案,推荐一下两种:
使用 electron ,electron 你可以认为是受js控制的浏览器引擎,所以你可以用它访问 yyy.com 拿到cookie,再接着做你的事情
或者 使用 puppeteer(Google 官方出品的 headless Chrome node 库)
Puppeteer 提供了一系列的 API,可以在无 UI 的情况下调用 Chrome 的各种功能,适用于爬虫、自动化处理等各种情景。