浏览器使用js中ajax实现网页爬虫效果-BFW博客

浏览器使用js中ajax实现网页爬虫效果

抓取网页python中pyspider，scrapy，request-html等优秀的库，js中怎么爬取网页呢？

是的，ajax是不能跨域抓取网页，但是我们可以通过nodejs或者同域代理访问来实现网页抓取

1、nodejs实现

var request = require('request');
request('爬取的网页url', function (error, response, body) {
  if (!error&&response.statusCode == 200) {
    console.log(body) // 进行存储或下一步处理
  }
});

2、同域代理

同域代理就是在浏览器url的同一个域名下，前端浏览器js通过ajax将要爬取的网页url传给后端，后端采用php或java进行网页抓取，将爬取的结果返回给js，js进行下一步的处理

  $.get("/scrap.php?targeturl=爬取的网页url", function(result){
    console.log(result);//下一步处理
  });

后端php采用

<?php
$url = $_GET["targeturl"]; //前端传过来的网址
if($url!=""){
$ch ...

点击查看剩余70%

打赏博主×

浏览器使用js中ajax实现网页爬虫效果

网友评论0

GitHub上的17款开源项目推荐

分享6款文字语音生成驱动虚拟数字人说话的开源项目

html文件夹ajax上传（包含进度条）+php代码

python识别手势并控制智能家居

bfwsoa中如何自定义组合七层

揭秘国外网友ddos攻击俄罗斯的各种方式和源码

用Python识别假图片ps过的图片

python+php打造一个带鉴权的ai多模型统一api代理服务及html聊天对话代码

js如何将gif图片分解拆开变成静态图片

利用shell脚本实现异步处理http请求

{{item.title}}

何为BFWSOA框架

BFWSOA框架特性

BFWSOA框架程序流程图

MVCVPSCW七层架构

BFWSOA框架创建一个小应用

BFWSOA框架路由模式与Apache、Nginx配置

BFWSOA框架表单验证与提交

BFWSOA框架数据库操作

BFWSOA 缓存设置

BFWSOA模型简介

如何通过Ripper技术在浏览器中渲染的三维模型下载下来？

python有没有多张实拍照片合并成360度全景照片的代码怎么写？

glb三维模型如何转换成vrm模型？

有没有ai可以直接根据描述生成vrm格式的模型？

sketchfab上的vrm可预览模型如何破解下载？

哪有免费的大胸妹子vrm三维模型文件？

如何在浏览器中通过摄像头捕获身体姿势来实时驱动三维角色同步？

华为与Android安卓手机如何运行python代码？

ai文生图如何生成短剧的九宫格分镜头？

为什么主流大模型架构都在用MoE，而不是传统的Dense?