用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）-BFW博客

用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）

如果我们要抓取网页的话，php中的curl或file_get_content,或在file_get_html，很简单是不是

那么如果把一个企业的网站及各个子页面抓取保存到本地怎么弄呢，爬虫可以做，具体怎么做呢，今天我们来演示一下如何通过php把一个企业的网站整站爬取下载下来，包括里面的图片js、css的依赖文件

废话不多，先上代码

<?php
require 'simple_html_dom.php';
// Create DOM from URL or file
$str = 'http://effect.bfw.wiki/CodeBlock/View/id/15625645726477080017.html';
$html = file_get_html($str);
$fn = getfilename($str);

// 下载相关的script
foreach ($html->find('script') as $element) {
    echo $element->src . '<br>';
    downloadFile($element->src, getfilename($element->src));
    $element->src = getfilename($element->src);

}
...

点击查看剩余70%

打赏博主×

用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）

网友评论0

浏览器使用js中ajax实现网页爬虫效果

个人支付宝接入支付宝商家收款实现收款回调通知php demo

APP的ai变革来了，未来大部分的App应用只需要通过AI聊天完成

华为鸿蒙系统发布时间确定，安卓急了

andriod中使用retrofit进行网络请求【实战】

用js实现抖音字说的动画效果

flash不支持后webrtc如何替代rtmp？

何为BFWSOA框架

js视频加密解密防破解解决方案

教你实现在国内正常访问chatgpt接口

{{item.title}}

脑洞大开设想

为什么创立bfwstudio

bfwkit工具包特性

bfwsea特性

bfwsoa特性

bfwsoa中如何自定义组合七层

为啥要创建bfwui

五维码是什么

BFWSPIDER是什么

如何在c#winform中嵌入chrome浏览器内核

如果让开源ai大模型越狱回答任何违规问题？

如何把gemini网页端ai问答变成一个api进行python调用？

一个公网文件url如何做到只能打开一次下载？

Agnes AI的api真的能永久免费？

未来手机或电脑无应用，全部内置ai，ai实时生成ui界面帮你干活？

标准拉丁字母a与俄文西里尔a看上去一样却不相等？

CodeGraph与RTK(Rust Token Killer)有啥区别？

python如何将svg图标转换成png图片？

windows如何设置让多个人同时远程桌面连接同一台电脑同时可操作不被踢出？

什么是WebRCD技术？