沃梦达 / 编程技术 / 前端开发 / 正文

mysql – 解析网站HTML的最快/最简单的方法？

沃梦达教程前端开发

2023-10-26

我需要解析this网站的内容并将其存储在MySQL数据库中.我正在创建一个竞争者网站,因为创建者从未完全完成他的,但他有比我更新的游戏数据而且不会发布它,所以我需要手动收集它. Here是我需要解析的特定类型页面的示例....

我需要解析this网站的内容并将其存储在MySQL数据库中.我正在创建一个竞争者网站,因为创建者从未完全完成他的,但他有比我更新的游戏数据而且不会发布它,所以我需要手动收集它. Here是我需要解析的特定类型页面的示例.

我之前使用PHP和正则表达式进行了HTML解析,但这很麻烦,我宁愿不再麻烦.由于这个问题,我几个月来一直拖延完成我的数据库.是否有更快和/或更简单的方法来解决这个问题？大多数C风格的语言对我来说都很好(C,C,Perl,PHP,Python等,都很好,但不是C#,Java或Objective-C).

P.S.：我不关心脚本/程序有多脏,或者类似的东西,只要它完成工作.

解决方法:

您提到的任何语言都可以这样做,只要您使用正确的第三方库来帮助您.

您需要抓取网站的内容.实际上,这可能是一个完全不同的程序,只需将.html文件下载到您的计算机上,然后您就可以让解析器运行了.这样的机器人存在,考虑wget或curl – 它们都有蜘蛛选项.

你需要一个网站解析器.不要使用regexp来解析HTML,使用HTML或XML解析器(如Perl的HTML::Parser).然后,您必须将生成的数据结构转换为可用数据(例如,第一个表> tr> td是怪物名称,第二个td是竞赛等.

最后,您需要将这些内容存储到您的数据库中,以便以后可以为您的网站提供服务.

实际上,编写代码并不是最困难的事情,但是“页面上的哪个项目意味着什么,应该存储在哪里以及如何”的映射将是.

沃梦达教程

本文标题为：mysql – 解析网站HTML的最快/最简单的方法？

上一篇： php – 如何在MySQL数据库中保留HTML格式？

下一篇： php – 将HTML选择/下拉列表提交到MySQL数据库

基础教程推荐

学习Bootstrap5

猜你喜欢

php – Codeigniter在数据库中存储html无法正常工作 2023-10-26
vue-vuex-actions的基本使用 2023-10-08
使用HTML5推送状态URL为单页网站配置nginx 2023-10-25
JavaScript实现带音效的烟花特效 2023-08-12
vue - v-if和v-for不能用在同一个元素上 2023-10-08
Ajax对缓存的处理方法实例分析 2023-02-23
CSS hack用法案例详解 2022-11-20
第3天:定义语言编码 2022-11-04
jquery.qrcode.js生成二维码并转成图片格式 2022-10-29
从功能点计算PHP,MySQL,HTML Web应用程序的代码行估计 2023-10-26