cheerio和puppeteer的区别
Cheerio
它是nodejs模块,其实现是基于核心jquery的。它以一个非常简单和一致的DOM模型工作。Cheerio被广泛用于网络搜刮工作,有时也用于自动化任务。由于它是基于jquery的,所以它相当快速和迅速。Cheerio包裹着Parse5解析器,能够解析任何类型的HTML和XML文档。
Puppeteer
Puppeteer广泛用于自动化浏览器任务,只能在google chrome无头浏览器即chromium上工作。Puppeteer也可用于网络抓取任务,但另一方面,它的功能非常强大,充满了许多Cheerio模块所不具备的功能。
Cheerio和Puppeteer之间的区别 –
编号 | Cheerio | Puppeteer |
---|---|---|
1 | Cheerio是由CheerioJS开发和维护的。 | Puppeteer是由谷歌开发和维护的。 |
2 | Cheerio不能够解析Javascript。 | Puppeteer能够解析Javascript。 |
3 | 用react或angular建立的网站不能用Cheerio来搜刮。 | 用react或angular建立的网站可以用它来搜刮。 |
4 | Cheerio不提供截图和制作pdf等功能。 | 人们可以用puppeteer进行截图并保存 pdf 。 |
5 | 与puppeteer相比,Cheerio的速度更快。 | 与cheeriojs相比,Puppeteer的速度较慢。 |
6 | Cheerio只是一个DOM解析器,可以解析HTML和XML。 | puppeteer 带来了整个浏览器引擎。 |
7 | Cheerio非常适用于搜刮任务。 | Puppeteer主要用于浏览器自动化。 |
8 | Cheerio可以与chrome一起工作。 | Puppeteer 需要 chromium 来运行其脚本。默认情况下,chromium是无头的。 |
9 | Cheerio只能处理原始HTML数据。 | Puppeteer支持原始HTML、XML,并能够执行JavaScript。 |