网站的逻辑结构

  综观形形色色的各类网站,虽然形式、内容和规模千差万别,但基本的结构却大相径庭,最终目的都是提供信息服务。从逻辑上看,如果把与网站相关的硬件、软件、开发维护都抽象为逻辑组件,那么一个网站至少包括计算机、网络接入设备、操作系统、www服务器和主页面信息,这四个组件是网站的必备组件,构成网站的最小配置,缺一不可。另外,还可以包括局域网、大型存储设备、数据库存储检索系统、Mail服务器、FTP服务器、应用服务器、控制系统、群集系统、安全系统、备份系统以及研发维护系统等等,这些称为“网站可选组件”,当然这里所说的“可选”是相对于网站的最小配置而言,对于一个搜索引擎,大型存储设备、数据库存储检索系统也上升为必备组件。

  上面提到的各类组件,绝大多数网站的结构都可以套入这种模式,组件数量可能或多或少,但功能都是围绕信息存储和发布来组织。图中背景是渐变色的方框表示该组件是网站的最小配置,背景是白色的方框表示该组件是可选的组件。组件可以按照功能分为六部分,在图中以虚线框出,包括:1.网络接入部分:2、服务器部分;3、数据存储部分;4、中间件;5、研发制作维护部分;6、安全部分。其中安全部分和其他五部分有交叉。下面分别加以介绍。

  1)网络接入部分。主要是指Internet的边缘接入设备一一路由器、调制设备以及防火墙、防病毒墙等网络接入安全系统。路由器等接入设备是网站的关键部分,在线路带宽足够大的情况下,它决定着网站的服务带宽。

  2)服务器部分。www、mail、FTP、新闻组服务器以及底层支撑的操作系统、计算机硬件平台组成了服务器部分,一个简单的低速网站可以只有一台计算机对外提供服务,而对一些高带宽接入(几百兆)的大型网站,一台计算机可能会成为网站的瓶颈,此时就需要多台服务器均载。典型的方案是在局域网中建立服务器群集,群集系统能将访问负载分担到系统中所有计算机上,以避免单台设备的瓶颈问题,同时也可以避免单点故障。对于全球战略性网站,例如Yahoo,还需要考虑到Internet互联的一些缺陷:国与国之间、服务器供应商之间的连接带宽不足,例如欧洲某些国家与我国的互联、我国曾经存在的163和169互联问题等等,为提高访问速度,就要做广域镜像,在各个高速子网内建立镜像站点,同-域名解析到多个IP地址,使用户路由到最快的站点,关于镜像网站和域名解析,在以后的章节中将有详细的讨论。

  3)数据存储部分。作为第四媒体的根据地,网站的经营策略与传统媒体很相似,都是以丰富、快捷和新奇的资讯来吸引客户,扩大影响。丰富的资讯需要有后台的大型数据存储系统来支持。快捷是指信息搜集、发布信息的制作、用户访问和资料查询的周期短,周转速度快,这也需要有一个优秀的数据存储系统做支撑。数据存储部分不仅要有海量存储的能力和高速的搜索速度,还要有一整套数据采集、制作、存储和发布工序,而且能够分工协作、井井有条,这样才能给网站一个稳定可靠的基础。

  4)中间件。界于服务器系统和数据存储系统之间,是服务器系统和数据存储系统之间的桥梁,因此所有在服务器系统和数据存储系统之间的内容都可以归属于中间件。例如网站中普遍使用的应用服务器,视频点播系统中使用的控制服务器等。

  5)研发制作和维护部分。网站的研发、制作会贯穿网站从构思、建立、运营到消亡的整个生命周期。在最初构思一个网站的时候,创始人可能会先构思网站的主体结构、主页面的风格,或许会亲自编写代码测试一下;在网站的软硬件平台搭建期间或搭建好之后,大量的工程师、程序员、数据库开发人员和美工投入到页面设计、制作以及数据库设计和开发的工作中;在网站的运营期间,有专门的维护人员保证现有系统的正常运作,研发制作小组继续开拓新的领地。

  6)安全部分。对于电子商务网站或者大型的、有影响的网站,安全性是至关重要的。由于整个网站暴露在Internet网中,安全防范措施应该贯穿到每一个组件中。首先需要在网络接入部分设置安全系统,例如防火墙、防病毒墙和堡垒主机等等。