Java Servlet 读取网页教程向您展示了如何使用 Servlet 在 Java Web 应用中读取网页。
Java Servlet
Servlet 是响应网络请求的 Java 类。 Java servlet 用于构建 Web 应用。 它们在 servlet 容器(例如 Tomcat 或 Jetty)中运行。 现代 Java Web 开发使用的框架是在 Servlet 之上构建的,包括 Spring 和 Vaadin。
Apache Commons Validator 是用于验证数据的 Java 库。 我们使用此库来验证正确的 URL 值。
Java Servlet 读取网页示例
在下面的示例中,我们读取带有InputStream
的网页,并向客户端显示该页面的 HTML 代码。 网页的名称是从 HTML 表单的input
标签发送的。
这是项目结构。
我们需要这两个 Maven 依赖项。 javax.servlet-api
工件用于 servlet。 commons-validator
依赖性用于数据验证。
context.xml
在 Tomcat context.xml
文件中,我们定义了上下文路径。 它是 Web 应用的名称。
ReadWebPage.java
ReadWebPage
Servlet 读取给定网页的内容,并将文本发送给客户端。
响应为纯文本,文本编码为 UTF-8。
我们使用getParameter()
从 request 参数获取网页的名称。
WebPageReader
用于获取网页的内容。
我们通过ServletOutputStream
将数据发送给客户端。
WebPageReader.java
WebPageReader
读取网页的内容。
在阅读网页之前,我们使用 Apache Commons Validator 库中的UrlValidator
验证 URL。
通过InputStream
读取网页。 数据被加载到String
中。 或者,我们可以使用 JSoup 库。
index.html
主页包含表单,该表单将要阅读的网页发送到应用。 请注意,必须以完整的http(s)://www.example.com
格式输入网页。
在屏幕截图中,我们可以看到一个简单网页的内容。
在本教程中,我们创建了一个 Java Servlet 应用,该应用读取所选网页的内容,并将 HTML 以纯文本格式发送回客户端。
您可能也对以下相关教程感兴趣: Java Servlet 读取网页, Java Servlet 上传文件, Java Log4j 教程, Java Servlet RESTful 客户端,Java servlet 图像教程或 Java 教程。