文章标签

HTML解析

Python 爬虫利器：解析 HTML 和 XML 文档的实战指南

Python 爬虫利器：解析 HTML 和 XML 文档的实战指南在当今互联网时代，数据无处不在。想要从浩瀚的网络中提取有价值的信息，爬虫技术必不可少。而 Python 作为一门简洁高效的编程语言，成为了爬虫开发的首选。其中，解析 ...

2024/8/5 0 412 0 0 0 Python 爬虫 HTML 解析
HTTP/2 服务器推送：真香还是鸡肋？场景与优化策略全解析

还记得以前为了优化网页加载速度，咱们绞尽脑汁把各种资源打包合并、压缩、雪碧图……累死累活的。现在有了HTTP/2，情况可大不一样了！其中一个亮眼的新特性就是服务器推送（Server Push）。今天咱们就来聊聊这个服务器推送，看看它...

2025/3/19 0 569 0 0 0 HTTP/2 服务器推送 Web性能优化
如何使用Python编程语言创建简单的Web爬虫

引言你是否曾经想过自动化获取网页上的信息，而不需要手动复制粘贴呢？今天，我们将学习如何用Python编程语言创建一个简单的Web爬虫。这篇文章将详细介绍所需工具和基本步骤，并提供示例代码。所需工具 Python解释器...

2024/8/12 0 471 0 0 0 Python Web爬虫网络技术
使用 html5lib 时，有哪些常见的陷阱和注意事项？

使用 html5lib 时，有哪些常见的陷阱和注意事项？ 1. html5lib 的基本概念 html5lib 是一个纯 Python 编写的库，用于解析 HTML 和 XHTML。它模仿了浏览器的行为，可以处理各种格式不规范的 ...

2024/7/8 0 295 0 0 0 html5lib 网页解析编程技巧
JavaScript 渲染的动态网站抓取：从入门到精通

JavaScript 渲染的动态网站抓取：从入门到精通在当今时代，大多数网站都使用 JavaScript 来动态渲染页面内容。这意味着传统的网页抓取方法可能无法获取到所有信息，因为这些信息是在页面加载后由 JavaScript 生成...

2024/8/18 0 456 0 0 0 网络抓取 JavaScript 动态网站
用 aiohttp 和 asyncio 构建高性能异步 Web 爬虫：一个实战案例

用 aiohttp 和 asyncio 构建高性能异步 Web 爬虫：一个实战案例在 Python 世界里，构建高性能的 Web 爬虫通常需要用到异步编程。 asyncio 是 Python 自带的异步编程库，而 aiohttp...

2024/12/27 0 737 0 0 0 aiohttp asyncio Python
XSS与SQL注入的攻防进化：静态分析工具的挑战与未来

网络安全领域中，跨站脚本（XSS）和SQL注入（SQLi）漏洞无疑是“常青树”级别的威胁。尽管它们的存在已久，但并非一成不变。攻击者持续进化其手法，这不仅考验着防御体系，也对传统的静态应用安全测试（SAST）工具提出了严峻挑战。本文将深入...

2025/10/25 0 186 0 0 0 网络安全漏洞分析 SAST
如何使用Python进行Web爬虫：从入门到实战

在现代互联网时代，Web爬虫已经成为数据采集的重要工具。通过使用Python编程语言，我们可以快速实现对各种网站内容的抓取，并将其用于数据分析或其他应用。本文将详细介绍如何从零开始使用Python进行Web爬虫，包括基础知识、实战案例以及...

2024/9/16 0 644 0 0 0 Python编程 Web爬虫数据抓取
后端工程师视角：前端资源优化策略与前后端协作指南

作为一名后端工程师，我们常常习惯于从服务端响应速度、数据库查询效率或接口数据量大小来分析页面加载缓慢的问题。这固然是重要的根源之一，但正如你所观察到的，前端的图片、JavaScript和CSS等静态资源加载耗时，同样是影响用户体验的关键因...

2025/10/4 0 274 0 0 0 前端优化性能优化前后端协作
后端工程师视角：前端资源加载优化清单与协作指南

你好，作为一名后端工程师，你遇到的困境很常见。API优化后页面加载速度提升不明显，这确实指向了前端资源加载的巨大潜力。理解前端的加载机制和优化手段，不仅能帮助你更全面地诊断问题，也能让你与前端团队的沟通更高效、更有建设性。下面是一份...

2025/10/4 0 235 0 0 0 前端优化性能加载团队协作

文章标签

HTML解析

Python 爬虫利器：解析 HTML 和 XML 文档的实战指南

HTTP/2 服务器推送：真香还是鸡肋？场景与优化策略全解析

如何使用Python编程语言创建简单的Web爬虫

使用 html5lib 时，有哪些常见的陷阱和注意事项？

JavaScript 渲染的动态网站抓取：从入门到精通

用 aiohttp 和 asyncio 构建高性能异步 Web 爬虫：一个实战案例

XSS与SQL注入的攻防进化：静态分析工具的挑战与未来

如何使用Python进行Web爬虫：从入门到实战

后端工程师视角：前端资源优化策略与前后端协作指南

后端工程师视角：前端资源加载优化清单与协作指南