用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）-BFW博客

用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）

如果我们要抓取网页的话，php中的curl或file_get_content,或在file_get_html，很简单是不是

那么如果把一个企业的网站及各个子页面抓取保存到本地怎么弄呢，爬虫可以做，具体怎么做呢，今天我们来演示一下如何通过php把一个企业的网站整站爬取下载下来，包括里面的图片js、css的依赖文件

废话不多，先上代码

<?php
require 'simple_html_dom.php';
// Create DOM from URL or file
$str = 'http://effect.bfw.wiki/CodeBlock/View/id/15625645726477080017.html';
$html = file_get_html($str);
$fn = getfilename($str);

// 下载相关的script
foreach ($html->find('script') as $element) {
    echo $element->src . '<br>';
    downloadFile($element->src, getfilename($element->src));
    $element->src = getfilename($element->src);

}
...

点击查看剩余70%

打赏博主×

用php抓取网站中网页并下载依赖的css及js图片等（网站下载到本地）

网友评论0

创业者：危机就是机遇

web网络摄像头实时识别人脸和性别年龄

机器学习中开发情感分析器的 4 种方法

带你接入支付宝蜻蜓f4刷脸支付iot小程序服务端

可编程的css背景属性CSS Paint API

html文件夹ajax上传（包含进度条）+php代码

国内大模型价格战拉响，各家api价格对比一览

科班与非科班程序员比较

js实现多人实时共享白板

Google关闭了中文搜索项目(Dragonfly)

{{item.title}}

脑洞大开设想

为什么创立bfwstudio

bfwkit工具包特性

bfwsea特性

bfwsoa特性

bfwsoa中如何自定义组合七层

为啥要创建bfwui

五维码是什么

BFWSPIDER是什么

如何在c#winform中嵌入chrome浏览器内核

RAG（检索增强生成）和 KG（知识图谱）有啥不同？

KVM硬件是啥？

ai大模型对于大型项目源码上下文不够是如何解决进行开发与修改功能的？

有没有开源虚拟浏览器在本地打开使用的是服务器上的网络？

有没有30-50元左右的2核2g内存的linux盒子？

html网页应用转apk ipa 安卓与ios的app方式有几种？

闲置手机如何安装linux系统变成服务器？

闲置老电脑如何变成家里的私有云nas？

什么是费曼学习法？

有没有免费让ai自动帮你接管操作电脑的mcp服务？