WWW服务器把信息组织成分布式的超文本,这些信息节点是文本、子目录或信息指针。WWW浏览器程序为用户提供基于超文本传输协议HTTP的用户界面。WWW服务器数据文件由超文本标记语言HTML描述。HTML利用通用资源访问地址URL表示超媒体链接,并在文本内指向其他网络资源。
一、环球信息网
1、环球信息网的定义:环球信息网(WWW)是基于客户机/服务器方式的信息发现技术和超文本技术的结合。
2、超文本文档包含着一些借用标题、章节本身等构造文本的命令,从而允许浏览程序格式化为一种文本类型,以获得最佳的屏幕显示效果。
3、Web任务:是使用一个起始URL来获取一个Web服务器上的Web文档,解释这个HTML,并将文档内容以用户环境所许可的效果最大限度地显示出来。
4、浏览器分类:线模式和图形界面。
lynx是线模式浏览器,使用箭头键来浏览内在HTML连接,支持书签和表格功能。特点是:在交互状态,可以将文章发布到新闻组;在非交互状态,可以将HTML过滤为纯文本。
midasWWW是基于X-windows系统浏览程序,支持更多的嵌入图形。
Mosaic是可以支持嵌入的gif和xbm图形,其他的视频影像。
Netscape页面采取边传送文档边显示的方式,增强了交互效果。
Micosoft Explorer
5、Web服务器在,目前主要3种基于UNIX的web服务器公用软件。
NCSA Web是C语言编写的,程序小,速度快,可以单独作为服务进程运行,也可以设置在inetd中运行。
CERN httpd是早期C语言编写的Web服务器,主要特点为提供proxy代理和缓存功能。
Plexus httpd是perl语言编写的,可扩展性好,易于使用和更新,但行动时开销较大。
二、环球信息网服务的建立
1、编译Web服务程序:获取源程序包;编辑修改相应的Makefile;设置选择项,修改src/config.h头文件;在每个目录中运行make编译命令。必要时修改src/makefile,cgi-src/makefile,support/makefile三个配置文件,编译三项内容:httpd服务程序,support支持程序,cgi-bin接口程序。
2、配置Web系统服务:包括在三个配置文件,Web系统配置文件httpd.conf;Web资源文档配置文件srm.conf;Web服务访问控制配置文件access.conf,还包括如何扩充文档MIME类型。
3、http配置文件使用的一些约定:不分大小写;以#开始的为注释行;一个指令定义一行;忽略多余的安全可靠,只认为是一个空格。
4、系统配置文件httpd.conf
配置时首先需要选择httpd的运行方式(单独运行或是在inetd下运行),是否进行服务访问控制。然后以httpd.conf.dist为模板,修改各个变量。
5、文档配置文件srm.conf
指定了Web服务的文档和接口程序等所在的路径。
6、服务访问控制配置文件access.conf
定义了Web用户的访问权限。默认的定义是用户可以浏览Web服务器所能提供的所有文档。
7、访问控制策略:目前有两种方式来控制对文档目录的访问。全程访问控制配置文件,单个目录访问控制文件。
8、扩展文档MIME类型:mime.types文件中定义了httpd不能直接处理的文件类型。可以通过srm.conf设置变量AddEncoding/Addtype/Default Type来定义新的类型。
三、WWW服务管理
1、扩充WWW服务功能
CGI接口程序能够通过WWW服务执行外部程序。外部程序接收用户的输入:传送给WAIS,SQL等服务器;将查询结果以HTML文档或URL的形式返回给WWW服务;CGI接口可用多种编程语言编写,也可以自己编写,
2、WWW服务与CGI的交互技术
WWW服务与CGI交互过程分为两部分:接口程序接收用户输入;从接口程序输出信息到WWW服务。
接口程序通过三个方式接收用户输入:环境变量,WWW服务在将浏览器的请求传送给接口程序时,为接口程序设置的环境变量。标准输入,在查询参数较多,尤其在接收用户FORM表格输入方式设置为POS。命令参数,HTML的﹤ISINDEX﹥标号来输入查询关键字,浏览器遇到标号时显示。
CGI接口程序输出:CGI接口程序的执行结果以标准输出的形式传递给WWW服务。输出中包含一行描述数据类型的头信息、一个分隔行,接着是实际文档数据。
四、FTP服务的配置和管理
1、FTP传送服务主要用于存放大量的网络公用软件、常用工具和技术文档,以及一些著名的FTP镜像。传递的数据类型:ASCII,Postscript、SGML、可执行代码、图像、声音、视频动画。
2、FTP服务通过FTP服务器与FTP客户程序之间的信息交换。数据上载将数据从FTP客户程序传输到FTP服务器。数据下载FTP客户程序从FTP服务获取数据。
3、FTP服务器可提供两种访问形式
内部用户FTP:在主机上有帐号的用户,用户在输入正确的帐号和口令字后,可以访问整个文件系统中有读权限的文档,并可以任意数据到有写权限的目录。
匿名FTP:匿名FTP是internet的公共信息服务,访问范围限于匿名FTP区域(FTP服务器定义的子文件系统)。用户只需要以Anonymous/ftp登录,输入自己的电子邮件作为口令字即可访问并下载所提供的信息资源。
4、FTP包含两个部分:服务器,响应客户请求,传送文档;文件系统,服务器文档扫描调用的区域。FTP服务器命名通常是ftpd或in.ftpd。
5、FTP的运行方式:通常ftpd是在系统超级服务inetd进程下运行。使用TCP的21号端口。基本传输模式:流方式、块方式、压缩方式三种
6、FTP配置,在Inetd的配置文件中(/etc/inetd.conf)中添加相应的一行设置为ftp stream tcp nowait root /etc/ftpd 。每次更新配置后,和kill –HUP INETD进程号,重新启动INETD。
7、在Inetd下配置好FTP后,需要在主机/etc/passwd中设置用户FTP,因为ftpd在允许用户匿名访问ftp之前,首先检查ftp用户是否存在,如果不存在,ftpd拒绝匿名用户访问。
五、建立FTP服务器
1、FTP系统服务及其目录配置
.company/:存放公司本身的信息
.pub/:公用软件目录
.in-coming/:匿名FTP用户上载文件目录
.usr/,bin/,etc/:FTP系统占用的目录
(1)设置FTP server的目录:
(2)修改password和group文件内容及访问权限
(3)在FTP server中设置目录
2、建立镜像系统
文件服务器镜像系统(mirror sites)完成对远程匿名FTP服务器资源的本地镜像。在镜像描述文件中指定远程FTP服务器地址、登录名及口令、需要镜像的远程FTP服务器的目录或文件、本地FTP服务器上的文件存放路径和权限控制码,系统就能够根据镜像描述文件使用FTP协议自动登录到远程FTP服务器,进入相应的目录,取得该目录下的文件列表,与本地目录下的文件列表进行比较。目录流行的镜像软件是mirror-2.3,是用perl语言编写的程序,按照FTP协议,在运行它的主机与远程主机之间,按目录和文件结构进行数据传输。
3、REAMME文件用于描述各个文件及子目录。包括以下内容:系统管理员电子邮件地址,便于用户求助;本服务的基本信息;版权的基本信息;热点透视;声明信息。
4、统计日志WU-FTPD系统定义了访问日志文件的格式,FTP访问日志统计工具有xferstats、iisstat等
5、访问控制
WU-FTP访问控制配置文件是ftpaccess、ftphosts、ftpusers、ftpgroups等。可以根据用户访问控制、CPU负载控制、用户组别控制、向用户自动显示状态信息,记录系统使用情况,文件访问快捷方式,控制文件载。
用户访问控制:可以通过fptaccess定义多种类别来控制用户的访问。类别定义由用户类型和主机地址来组合。用户类型有三种:anonymous,匿名FTP,只有访问FTP系统目录;guest,用户使用帐号和口令访问文件系统的一部分;real,系统本身的用户,可以访问整个文件系统。
6、向用户发送提示信息:WU-FTP有四种方式可向进入系统的用户提示信息,他们是:banner,在用户登录时,将一个提示文件显示给用户;message可以控制在适当的时候提示用户,一般在用户登录或用户转移到某一目录时提示;readme可以提示用户README文件已经更新。Shutdwon关闭FTP服务有两种方式:在ftpaccess中使用shutdown命令;使用ftpshut工具
7、一些管理工具
Ftpshutd 在系统将要关闭时,根本上新的用户访问;并关闭服务。
ftpwho 显示当前每个类别的用户当前有多少人在访问以及最多可访问数、其他一些用户使用情况。
ftpcount 显示每个类别的用户当前访问ftp服务的数目,以及最多访问数.
Fftpmail 是电子邮件与ftp的接口。
六、动态Web文档与CGI技术
1、Web文档的三种基本形式
静态文档:是一个存储于Web服务器的文件,静态文档由作者在写作时决定文档内容,它的内容不会变化。是一种排版语言,主要优点,是简单、可靠、性能好;主要缺点,是灵活性差,当信息变化时,必须重新设计文档。
动态文档:它在浏览器访问Web服务器时创建,没有预先定义的格式。内容总是变化的,每次访问都要创建新文档。可以用来显示天气预报、股巿行情等时效性很强的信息。主要缺点创建费用较高、访问的时间较长、且浏览器取得一个复制的文档后不会再改变。
活动文档:它不完全由服务器产生,一个活动文档包括一个计算和显示的程序。只要用户程序保持运行,该文档可以不断地变化。活动文档本身不包含运行所需要的软件,大部分支持软件在浏览器上。主要缺点,是创建和运行这类文档费用高,安全性差。
2、动态文档的实现
处理动态文档的服务器有三个特性:服务器必须扩展,对来自浏览器的每次请求,能执行一个创建文档的应用程序,并将产生的活动文档返回给浏览器;必须为每个动态文档写一个应用程序;服务器使用设置信息来区分动态文档和静态文档。
3、通用网关接口CGI
构建动态Web文档广泛使用的技术是通用网关接口(common gateway interface)CGI。CGI标准说明了服务器如何和应用程序交互作用,以实现一个动态文档,这种应用程序称为CGI程序。
CGI是服务器和HTML文件之间的接口程序,负责处理HTML文件与运行在服务器中的非HTML程序之间的数据交换。
CGI可以是一个编译的程序,或者是一个批处理文件,或者任何可执行的二进制文件。CGI存放在Web服务器的cgi-bin子目录下,必须要求系统管理员开放对cgi-bin目录的访问权。CGI实现交互查询有两种方法:一种是基于文件的查询;另一种是使用FROM。
七、广域信息服务
1、广域信息服务WAIS(Wide Area Information Search)是一种网络信息查询系统,它可以和关键字对服务器数据库进行全文索引,获取索引所得的信息。
2、WAIS运行模式,采用客户机和服务器方式。运行方式,standalone和inetd方式。包括三部分内容,客户方软件、服务器软件和索引程序。
3、WAIS数据主要有8个文件构成,其中xx.src用于客户端服务器说明,xx.dct,xx.inv用于查询。
4、在UNIX机器上,有waisserch和xwais。在PC要上有winwais。这些客户程序和服务器之间采用Z39.50标准协议,在不同平台上,只要遵循这些协议就能和waisserver进行通信。
5、FreeWais系统组成:其软件由索引建立器、服务器和客户访问程序三部分组成。其工作过程:
(1)索引建立器从数据库中读取数据并建立索引,它为文档中出现的单词建立一个列表,并在一个表中记录单词的出现位置。
(2)服务器则根据用户指定的查询条件,使用已经有的索引进行检索。服务器首先分解出一个用户自然语言的查询条件,把每个单词作为关键词,找出包含这些单词的文档,并给出一个分数来提醒用户每篇文档的切题程序。分数越高表示切题程序越高。
(3)客户程序通过Z39.50标准协议来形成检索规则,显示服务器找到的命中文档,还允许用户查看某一文档的内容。文档的类型包括ASCII文本、二进制信息、声音文件、Post Script文件、HTML文件、JPEG、GIF文件。(it外包)
相关文章