杂记 | 我看 CGI

写点旧东西,最近一直再看 django 源代码,发现对运行机制还是蛮感兴趣的(太懒了,这块一直没有深入研究过),因为扯到了 wsgi 规范,就想到了原始的 cgi 接口规范, 这里就先写写我对 cgi 接口规范 的认知,同时也为了下次组内分享预留个开头。

1 远古时代

1991年8月6日,这是个伟大的日子,web 页面首次在因特网上登场,回去早期,web 服务器主要是用来共享静态数据,只是简单的响应浏览器发来的 http 请求,并将存储在服务器上的静态文件返给浏览器。所以早期的 web 服务器的结构如下:

图片描述

因为早期的用户只有高大上的科学家,这样的架构无可厚非,毕竟只是为了共享自己的一些资料,方便交流。

2 CGI 时代

随着时间的推移,互联网逐渐平民化,技术在进化,网站越来越复杂,远古时代的架构已经不能满足用户的需求。针对用户强烈的动态交互需求,另外一方面,服务器自己并不能运行类似 python 脚本文件,既然服务器没法做,只能联合第三方一起搞,此时与第三方通信还是需要有个约定的,服务器给第三方参数,第三方返回给服务器结果,最后服务器把结果返回给客户端,此后名扬江湖的 CGI(Common Gateway Interface) 诞生了。

CGI 定义了 Web服务器 与外部应用程序之间的通信接口标准,因此 Web服务器 可以通过 CGI 执行外部程序,让外部程序根据Web请求内容生成动态的内容。Perl 因为跨操作系统和易于修改的特性成为 CGI 的主要编写语言。当然,CGI 可以用任何支持标准输入输出和环境变量的语言编写,比如 Shell 脚本, C/C++ 语言,只要符合接口标准即可。比如你用C 语言编写 CGI 程序,你把希望返回的 HTML 内容通过 printf 输出就可以发送给Web服务器,进而返回给用户。

图片描述

CGI 脚本与服务器通信

服务器与 CGI 脚本通信是通过标准的输入输出和环境变量完成的。

CGI 脚本工作流程

  • 浏览器通过HTML表单或超链接请求指向一个 CGI 应用程序的 URL

  • 服务器收发到请求。

  • 服务器执行所指定的 CGI 应用程序。

  • CGI 应用程序执行所需要的操作,通常是基于浏览者输入的内容。

  • CGI 应用程序把结果格式化为网络服务器和浏览器能够理解的文档(通常是 HTML网页)。

  • web 服务器 把结果返回到浏览器中。

CGI 模式性能
CGI 的跨平台性能极佳,几乎可以在任何操作系统上实现。CGI 方式在遇到连接请求(用户请求)先要创建 CGI 的子进程,激活一个 CGI 进程,然后处理请求,处理完后结束这个子进程。这就是 fork-and-execute 模式。所以用 CGI 方式的服务器有多少连接请求就会有多少 CGI 子进程,子进程反复加载是 CGI 性能低下的主要原因。当用户请求数量非常多时,会大量挤占系统的资源如内存,CPU 时间等,造成效能低下。

3 例子

web 服务器: lighttpd,脚本语言: python, 平台: mac

脚本代码

#!/usr/bin/env python
# -*- coding: UTF-8 -*-

import os

print "Content-Type: text/plain;charset=utf-8\n"

print os.environ.get('SERVER_PROTOCOL')
print os.environ.get('QUERY_STRING')
print "Hello World!"

浏览器端

输入 url 如下:

http://127.0.0.1:8080/cgi-bin/test.py?name=kycool&id=0989238423

返回结果:

HTTP/1.1
name=kycool&id=0989238423
Hello World!

debug 工具中打开

图片描述

4 小结

通过例子就会发现,运行模式如下:

图片描述

例子较为简单,复杂的业务如果写完,估计自己可以造个框架轮子了,因为 CGI 性能低下的原因,python 相关的 wsgi 出现了......

参考文章
https://www.w3.org/CGI/
https://en.wikipedia.org/wiki/Common_Gateway_Interface
http://www.tianmaying.com/blog/8ab3eda84daf4e54014daf68ff09000b


黑月亮
点滴记录,步步成长

现实与完美之间

1.6k 声望
24 粉丝
0 条评论
推荐阅读
centos | 修改静态 IP
设置 Centos 为使用静态 IP1 修改网络配置 {代码...} 修改后的内容如下 {代码...} 2 重启网络服务 {代码...} 3 查看地址 {代码...} 参考来源:[链接]

青阳半雪阅读 1.8k评论 3

数据结构与算法:二分查找
一、常见数据结构简单数据结构(必须理解和掌握)有序数据结构:栈、队列、链表。有序数据结构省空间(储存空间小)无序数据结构:集合、字典、散列表,无序数据结构省时间(读取时间快)复杂数据结构树、 堆图二...

白鲸鱼9阅读 5.3k

滚蛋吧,正则表达式!
你是不是也有这样的操作,比如你需要使用「电子邮箱正则表达式」,首先想到的就是直接百度上搜索一个,然后采用 CV 大法神奇地接入到你的代码中?

良许3阅读 1.5k

搭个ChatGPT算法模型,从哪开始?
最近 ChatGPT 很火,火到了各行各业。记得去年更多的还是码农最新体验后拿它搜代码,现在各行各业都进来体验,问它咋理财、怎么写报告和给小孩起名。😂 也因此让小傅哥在头条的一篇关于 ChatGPT 的文章都有了26万...

小傅哥6阅读 1.3k

封面图
程序员适合创业吗?
大家好,我是良许。从去年 12 月开始,我已经在视频号、抖音等主流视频平台上连续更新视频到现在,并得到了不错的评价。每个视频都花了很多时间精力用心制作,欢迎大家关注哦~考虑到有些小伙伴没有看过我的视频,...

良许3阅读 1.3k

PyCharm 激活破解教程, 2023 年 2 月亲测有用
本文分享一下PyCharm 2022.2.3 版本最新激活破解教程,注意不要使用太新的版本,都是 Jetbrains 产品,本文专门配上了 Pycharm 的图片,跟着下面教程一步一步来即可。

程序员徐公阅读 9.8k评论 1

Ubuntu20.04 从源代码编译安装 python3.10
Ubuntu 22.04 Release DateUbuntu 22.04 Jammy Jellyfish is scheduled for release on April 21, 2022If you’re ready to use Ubuntu 22.04 Jammy Jellyfish, you can either upgrade your current Ubuntu syste...

ponponon1阅读 4.6k评论 1

现实与完美之间

1.6k 声望
24 粉丝
宣传栏