C++ 网页编程
什么是CGI
- 通用网关接口(CGI)是一组定义了如何在 Web 服务器和自定义脚本之间交换信息的标准。
-
CGI 规范目前由NCSA维护,NCSA将CGI定义如下:
-
通用网关接口(CGI)是一种用于外部网关程序与诸如HTTP服务器等信息服务器进行接口的标准。
-
当前版本是CGI/1.1,CGI/1.2正在进行中。
Web浏览
为了理解CGI的概念,让我们看看当我们点击超链接浏览特定网页或URL时会发生什么。
- 您的浏览器联系HTTP web服务器并要求URL,即文件名。
-
Web服务器会解析URL并查找文件名。如果找到请求的文件,则Web服务器将该文件发送回浏览器,否则发送一个错误消息,指示您请求了一个错误的文件。
-
Web浏览器接收到来自Web服务器的响应,并根据接收到的响应显示要么接收的文件要么错误消息。
然而,可以将HTTP服务器设置成,每当请求某个目录中的文件时,不会将该文件发送回去;而是将其作为程序执行,并将程序产生的输出发送回您的浏览器进行显示。
通用网关接口(CGI)是一种为应用程序(称为CGI程序或CGI脚本)与Web服务器和客户端进行交互的标准协议。这些CGI程序可以用Python、PERL、Shell、C或C++等编写。
CGI架构图
下面的简单程序显示了CGI的简单架构 −
Web服务器配置
在进行CGI编程之前,请确保您的Web服务器支持CGI,并且已经配置好处理CGI程序。所有要由HTTP服务器执行的CGI程序都存放在一个预配置的目录中。这个目录称为CGI目录,按照惯例命名为/var/www/cgi-bin。按照惯例,CGI文件扩展名为 .cgi ,尽管它们是C++可执行文件。
默认情况下,Apache Web服务器配置为在 /var/www/cgi-bin 中运行CGI程序。如果您想要指定其他目录来运行您的CGI脚本,您可以修改httpd.conf文件中的以下部分:
<Directory "/var/www/cgi-bin">
AllowOverride None
Options ExecCGI
Order allow,deny
Allow from all
</Directory>
<Directory "/var/www/cgi-bin">
Options All
</Directory>
在这里,我假设您已经成功搭建并运行了Web服务器,并且能够运行其他CGI程序,如Perl或Shell等。
第一个CGI程序
考虑以下C++程序内容-
#include <iostream>
using namespace std;
int main () {
cout << "Content-type:text/html\r\n\r\n";
cout << "<html>\n";
cout << "<head>\n";
cout << "<title>Hello World - First CGI Program</title>\n";
cout << "</head>\n";
cout << "<body>\n";
cout << "<h2>Hello World! This is my first CGI program</h2>\n";
cout << "</body>\n";
cout << "</html>\n";
return 0;
}
将上述代码编译并命名可执行文件为cplusplus.cgi。此文件被保存在/var/www/cgi-bin目录中,并包含以下内容。在运行CGI程序之前,请确保使用UNIX命令 chmod 755 cplusplus.cgi 更改文件的模式,使其可执行。
我的第一个CGI程序
上面的C++程序是一个简单的程序,它将其输出写入STDOUT文件,即屏幕。有一个重要的额外特性可用,即第一行打印 Content-type:text/html\r\n\r\n 。这一行将被发送回浏览器,并指定要在浏览器屏幕上显示的内容类型。现在你应该已经理解了CGI的基本概念,并且可以使用Python编写许多复杂的CGI程序。C++ CGI程序可以与任何其他外部系统交互,例如RDBMS,以交换信息。
HTTP标题
行 Content-type:text/html\r\n\r\n 是HTTP标题的一部分,它被发送到浏览器以理解内容。所有的HTTP标题将采用以下形式−
HTTP Field Name: Field Content
For Example
Content-type: text/html\r\n\r\n
在CGI编程中,还有一些其他重要的HTTP标头,您会经常使用。
密切关注 | 标头和描述 |
---|---|
1 | 内容类型: 定义返回文件的格式的MIME字符串。示例:Content-type:text/html。 |
2 | 过期时间:日期 信息变得无效的日期。浏览器应使用此日期来决定页面何时需要刷新。有效日期字符串应采用格式:01 Jan 1998 12:00:00 GMT。 |
3 | 位置:URL 应返回的URL,而不是请求的URL。您可以使用此字段将请求重定向到任何文件。 |
4 | 上次修改:日期 资源的最后修改日期。 |
5 | 内容长度:N 返回数据的长度(以字节为单位)。浏览器使用此值报告文件的预估下载时间。 |
6 | 设置Cookie:字符串 设置通过字符串传递的Cookie。 |
CGI环境变量
所有CGI程序将有访问以下环境变量的权限。这些变量在编写任何CGI程序时发挥着重要作用。
编号 | 变量名与描述 |
---|---|
1 | CONTENT_TYPE 内容的数据类型,当客户端向服务器发送附加内容(如文件上传等)时使用。 |
2 | CONTENT_LENGTH 查询信息的长度,仅对POST请求有效。 |
3 | HTTP_COOKIE 返回以键值对形式表示的cookie集合。 |
4 | HTTP_USER_AGENT User-Agent请求头字段包含有关发起请求的用户代理的信息。它是 Web 浏览器的名称。 |
5 | PATH_INFO CGI脚本的路径。 |
6 | QUERY_STRING 使用GET方法请求时发送的 URL 编码信息。 |
7 | REMOTE_ADDR 发起请求的远程主机的 IP 地址。这对于日志记录或身份验证很有用。 |
8 | REMOTE_HOST 发起请求的主机的全限定名称。如果此信息不可用,则可以使用REMOTE_ADDR获取IR地址。 |
9 | REQUEST_METHOD 用于发起请求的方法。最常见的方法是GET和POST。 |
10 | SCRIPT_FILENAME CGI脚本的完整路径。 |
11 | SCRIPT_NAME CGI脚本的名称。 |
12 | SERVER_NAME 服务器的主机名或IP地址。 |
13 | SERVER_SOFTWARE 服务器运行的软件名称和版本。 |
这是一个小的CGI程序,用于列出所有的CGI变量。
#include <iostream>
#include <stdlib.h>
using namespace std;
const string ENV[ 24 ] = {
"COMSPEC", "DOCUMENT_ROOT", "GATEWAY_INTERFACE",
"HTTP_ACCEPT", "HTTP_ACCEPT_ENCODING",
"HTTP_ACCEPT_LANGUAGE", "HTTP_CONNECTION",
"HTTP_HOST", "HTTP_USER_AGENT", "PATH",
"QUERY_STRING", "REMOTE_ADDR", "REMOTE_PORT",
"REQUEST_METHOD", "REQUEST_URI", "SCRIPT_FILENAME",
"SCRIPT_NAME", "SERVER_ADDR", "SERVER_ADMIN",
"SERVER_NAME","SERVER_PORT","SERVER_PROTOCOL",
"SERVER_SIGNATURE","SERVER_SOFTWARE" };
int main () {
cout << "Content-type:text/html\r\n\r\n";
cout << "<html>\n";
cout << "<head>\n";
cout << "<title>CGI Environment Variables</title>\n";
cout << "</head>\n";
cout << "<body>\n";
cout << "<table border = \"0\" cellspacing = \"2\">";
for ( int i = 0; i < 24; i++ ) {
cout << "<tr><td>" << ENV[ i ] << "</td><td>";
// attempt to retrieve value of environment variable
char *value = getenv( ENV[ i ].c_str() );
if ( value != 0 ) {
cout << value;
} else {
cout << "Environment variable does not exist.";
}
cout << "</td></tr>\n";
}
cout << "</table><\n";
cout << "</body>\n";
cout << "</html>\n";
return 0;
}
C++ CGI库
对于真实的示例,您需要通过CGI程序进行很多操作。有一个专为C++程序编写的CGI库可供下载,您可以从ftp://ftp.gnu.org/gnu/cgicc/下载并按照以下步骤安装该库:
$tar xzf cgicc-X.X.X.tar.gz
$cd cgicc-X.X.X/
$./configure --prefix=/usr
$make
$make install
您可以在以下链接中查看相关文档:‘C++ CGI Lib 文档。
GET 和 POST 方法
在许多情况下,您需要将一些信息从您的浏览器传递到 Web 服务器,最终传递到您的 CGI 程序。浏览器通常使用两种方法将此信息传递给 Web 服务器。这些方法是 GET 方法和 POST 方法。
使用 GET 方法传递信息
GET 方法将编码的用户信息附加到页面请求中。页面和编码的信息之间用 ? 字符分隔,如下所示:
http://www.test.com/cgi-bin/cpp.cgi?key1=value1&key2=value2
GET方法是从浏览器向Web服务器传递信息的默认方法,它会生成一个长字符串,出现在浏览器的Location:框中。如果您需要传递密码或其他敏感信息给服务器,请不要使用GET方法。GET方法有大小限制,您可以在请求字符串中传递最多1024个字符。
使用GET方法时,信息通过QUERY_STRING http头传递,并通过QUERY_STRING环境变量在CGI程序中访问。
您可以通过简单地将键值对与任何URL连接在一起来传递信息,或者您可以使用HTML的