<< Back to man.lupaworld.com   LUPA网友原创,转载请注明出处lupaworld.com及作者

Portable Batch System

OpenPBS Release 2.3

Administrator Guide

 

 

Translator: 裴建中(北京工业大学)

Email: pjz0311@emails.bjut.edu.cn

QQ: 250386348

注:翻译这一管理员指南仅仅是想和大家共同学习和交流与集群相关的知识,并无他意。文中带有下划线的句子是我觉得理解的不好的地方,其后同时保留了原来的英文以便大家理解,请留意。对于具体的几种类型系统的依赖性构建这里省略掉了,略掉的地方标有‘?????’。文中翻译不当的地方敬请各位批评更正。另外尤其是有关NQSOpenPBS的心得体会希望能和大家多多交流

 

 

1.    介绍... 2

1.1.     什么是PBS?. 2

1.2.     PBS的组件... 2

1.3.       发布信息... 3

1.3.1.      Tar文件... 3

1.3.2.      附加要求... 3

2.    安装... 4

2.1.       计划... 4

2.2.       安装总结... 6

2.3.       构建细节... 10

2.3.1.      配置选项... 11

2.3.2.      Make File 目标... 16

2.4.       依赖于机器的构建说明... 16

2.4.1.      Cray Systems. 16

2.4.2.      Digital UNIX.. 16

2.4.3.      HP-UX.. 16

2.4.4.      IBM Workstations. 17

2.4.5.      IBM SP. 17

2.4.6.      SGI Workstations Running IRIX5. 17

2.4.7.      SGI Systems Running IRIX6. 17

2.4.8.      FreeBSD and NetBSD.. 17

2.4.9.      Linux. 17

2.4.10.    SUN Running SunOS. 17

3.    批处理系统配置... 18

3.1.       单一执行系统... 18

3.2.     多执行系统... 18

3.2.1.      安装多个Moms. 18

3.2.2.      声明节点... 19

3.2.3.      作业在哪里运行... 20

3.3.       网络地址和端口... 22

3.4.       启动守护进程... 22

3.4.1.      启动Mom.. 23

3.4.2.      启动服务器... 23

3.4.3.      启动调度器... 23

3.5.       配置作业服务器,pbs_server. 24

3.5.1.      服务器配置... 24

3.5.2.      队列配置... 25

3.5.3.      报告服务器配置... 28

3.6.       配置可执行服务器,pbs_mom. 29

3.6.1.      访问控制和初始化值... 29

3.6.2.      静态资源... 31

3.6.3.      shell 命令... 31

3.6.4.      配置文件的例子... 32

3.7.       配置调度器,pbs_sched. 33

4.    调度策略... 33

 

 

 

1.         介绍

       此文档用来为系统管理员提供构建、安装、配置并且管理PBS所需的一些信息。很可能有一些重要的信息项被漏掉了。这类文档中没有更加完善的了,到目前为止,它已经被好几个不同的管理员在不同的站点进行了更新,当然仍是比较欠缺。

1.1.       什么是PBS?

       PBS是一个批处理作业和计算机系统资源管理软件包。它原本是按照POSIX 1003.2d批处理环境来开发的。这样,它就可以接受批处理作业、shell脚本和控制属性,作业运行前对其储存并保护,然后运行作业,并且把输出转发回提交者。

       PBS可以被安装并配置运行在单机系统或多个系统组来支持作业处理。由于PBS的灵活性,多个系统可以以多种方式组合。

1.2.       PBS的组件

       PBS包括四个主要的组件:命令组件、作业服务器、作业执行组件和作业调度器。这里给出每一部分的简要描述来帮助你在安装过程中做出决定。

命令组件

       PBS支持与POSIX1003.2d相一致的命令行和图形接口两种命令方式。这些命令用于提交、监视、修改和删除作业。命令可以被安装在任何PBS支持的系统类型上,并且不需要在本地安装任何其它的PBS组件。共有三种类型的命令:任何已授权用户可以使用的命令;操作员命令;管理员命令;操作员和管理员命令需要不同的访问权限。

作业服务器

       作业服务器是PBS的中心。在本文档中,它一般被称作服务器或被称为可执行文件的名字pbs_server。所有命令和其它守护进程都通过IP网络和服务器通信。服务器的主要功能就是提供基本的批处理服务,例如接收/创建一个批处理作业,修改作业,保护作业免受系统机的影响并运行作业。

作业执行器

       作业执行器是一个守护进程,它真正地把作业放入执行队列。这一进程,pbs_mon,被非正式地命名为Mom,正如它是所有正在执行的作业的母亲(mother)一样。当Mom从一个服务器那里接收一个作业拷贝时就将它放入执行队列。Mom创建一个和用户登陆会话尽可能一致的新的会话。例如,如果用户的登陆shellcsh,那么Mom就创建一个会话,在此会话中.login.cshrc一样运行。当服务器指示需要那么做时,Mom也负责把作业的输出返回给用户。

 

作业调度器

       作业调度器是另一个守护进程,这一进程包括site policy[1],这一策略控制着哪一个作业被运行,在那个节点运行,什么时候运行。因为每一个site对于什么是好的或者有效的策略都有它自己的想法,PBS允许每一个site来创建它自己的调度器。当运行的时候,调度器就可以和不同的Moms进行通信来获知系统资源的状态;和服务器进行通信来获知要执行的作业的有效性。与服务器之间的接口是通过和命令组件一样的API。实际上,调度器仅仅作为服务器的批处理管理器出现的。

       除了上面主要的部分之外,PBS也提供了一个应用编程接口,API,命令组件用它来和服务器进行通信。这一API在和PBS一起完成的第三部分的man pages中描述。A site[1]如果愿意可以利用这些API来实现新的命令。

1.3.   发布信息

1.3.1.       Tar文件

PBS是以一个单一的tar文件来提供的。这个tar文件包括:

Ø         以后记和文本两种形式提供的本文档

Ø         一个“配置”脚本,所有的源码,头文件和用于构建并安装PBSmake文件。

当解压tar文件时,将会在上面的信息之上创建一个顶层目录。这一顶层目录将被命名为发布版本加补丁级别。例如,对于发布版本2.1和补丁级别13,这一目录将被命名为pbs_v2.1p13

       建议这些文件在解压时带上-p参数以便保留权限位。

1.3.2.       附加要求

       PBS使用一个由GNUautoconf生成的配置脚本来产生make文件。如果你有一个POSIX make程序,那么由配置脚本生成的make文件将尝试利用POSIXmake特性。当构建时如果你的make不能够处理这个make文件那么你可能用的是一个被破坏的make。要是在构建时make失败,就试一下GNUmake

      如果使用了基于GUITcl或基于调度器的Tcl,就需要有Tcl的头文件和库。Tcl的官方网站是:http://www.scriptics.com/, ftp://ftp.scriptics.com/pub/tcl/tcl8_0

PBS已经不再使用Tcl8.0之前的版本。必须使用TclTk8.0或更高的版本。

       如果使用了BaSL调度器,将需要yacclex(或者GNU bisonflex)。对于bisonflex的有关站点是:http://www.gnu.org/software/software.html  prep.ai.mit.edu:/pub/gnu

       为了格式化包含在这一发布版本的这一文档,我们强烈推荐使用GNU groff包。最新的groff版本1.11.1,它可以在这里找到:http://www.gnu.org/software/groff/groff.html

2.         安装

       这一部分试图来解释构建和安装PBS的步骤。PBS安装可以通过GNUautoconf过程来完成。这一安装过程与其他许多“典型”软件包相比需要更多的手工配置。因为有一些涉及site policy的选项,所以安装就不能被自动的决定。如果PBS运行在基于intel x86的红帽Linux上,可以使用RPM包来安装。对于安装说明请看2.4.9