Username: Password:

Perl教学第十一篇文档系统
来源:linux宝库作者:linux宝库 发布时间:2007-09-30 00:00:00


  本章所讲的函数多数使用了UNIX操作系统的特性,在非UNIX系统中,一些函数可能没有定义或有不同的工作方式,使用时请查看Perl联机文档。

  一、文档输入/输出函数

  本节讲述从文档中读取信息和向文档写入信息的内置库函数。

  1、基本I/O函数

  一些I/O函数在前面的章节中已有讲述,如

  ?open:允许程式访问文档

  ?close:终止文档访问

  ?print:文档写入字符串

  ?write:向文档写入格式化信息

  ?printf:格式化字符串并输出到文档

  这里简单回顾一下,再讲一些前面未提到的函数。

  1)open函数

  open函数将文档变量和某文档联系起来,提供访问文档的接口,例如:open(MYVAR, "/u/file"); 假如文档打开成功,则返回非零值,否则返回零。缺省地,open打开文档用以读取其内容,若想打开文档以写入内容,则在文档名前加个大于号:open (MYVAR, ">/u/file"); 向已有的文档末尾添加内容用两个大于号:open(MYVAR, ">>/u/file"); 若想打开文档作为数据导向的命令,则在命令前加上管道符(|):open(MAIL, "|mail dave");

  2)用open重定向输入

  能够把打开的文档句柄用作向程式输入数据的命令,方法是在命令后加管道符(|),如:

  open(CAT, "cat file*|");

  对open的调用运行命令cat file* ,此命令创建一个临时文档,这个文档的内容是任何以file打头的文档的内容连接而成,此文档看作输入文档,可用文档变量CAT访问,如:

  $input = ;

  下面的例子使用命令w的输出来列出当前登录的任何用户名。

  1 : #!/usr/local/bin/perl

  2 :

  3 : open (WOUT, "w|");

  4 : $time = ;

  5 : $time =~ s/^ *//;

  6 : $time =~ s/ .*//;

  7 : ; # skip headings line

  8 : @users = ;

  9 : close (WOUT);

  10: foreach $user (@users) {

  11: $user =~ s/ .*//;

  12: }

  13: print ("Current time: $time");

  14: print ("Users logged on:\n");

  15: $prevuser = "";

  16: foreach $user (sort @users) {

  17: if ($user ne $prevuser) {

  18: print ("\t$user");

  19: $prevuser = $user;

  20: }

  21: }

  结果输出如下:

  Current time: 4:25pm

  Users logged on:

  dave

  kilroy

  root

  zarquon

  w命令列出当前时间、系统负载和登录的用户,连同每个用户的作业时间和当前运行的命令,如:

  4:25pm up 1 day, 6:37, 6 users, load average: 0.79, 0.36, 0.28

  User tty login@ idle JCPU PCPU what

  dave ttyp0 2:26pm 27 3 w

  kilroy ttyp1 9:01am 2:27 1:04 11 -csh

  kilroy ttyp2 9:02am 43 1:46 27 rn

  root ttyp3 4:22pm 2 -csh

  zarquon ttyp4 1:26pm 4 43 16 cc myprog.c

  kilroy ttyp5 9:03am 2:14 48 /usr/games/hack

  上例中从w命令的输出中取出所需的信息:当前时间和登录的用户名。第3行运行w命令,此处对open的调用指定w的输出用作程式的输入,用文档变量WOUT来访问该输入。第4行读取第一行信息,即:

  4:25pm up 1 day, 6:37, 6 users, load average: 0.79, 0.36, 0.28

  接下来的两行从这行中抽取出时间。首先,第5行删除起始的空格,然后第6行删去除时间和结尾换行符之间的任何字符,存入变量$time。

  第7行从WOUT读取第二行,这行中无有用信息,故不作处理。第8行把剩下的行赋给数组@users,然后第9行关闭WOUT,终止运行w命令的进程。

  @users中的每个元素都是一行用户信息,因为本程式只需要每行的第一个单词,即用户名,故10~12行去掉除换行符外的其他字符,这一循环结束后,@users中只剩下用户名的列表。

  第13行输出存贮在$time中的时间,注意这时print无需加上换行符,因为$time中有。16~21行对@users中的用户名排序并输出。因为同一个用户能够多次登录,所以用$preuser存贮输出的最后一个用户名,下次输出数组元素$user时,假如其和$preser相等,则不输出。

  3)文档重定向

  许多UNIX shell能够把标准输出文档(STDOUT)和标准错误文档(STDERR)都重定向到同一个文档,例如在Bourne Shell(sh)中,命令

  $ foo > file1 2>&1

  运行命令foo并把输出到标准输出文档和标准错误文档的内容存贮到文档file1中。下面是用Perl实现这一功能的例子:

  1: #!/usr/local/bin/perl

  2:

  3: open (STDOUT, ">file1") || die ("open STDOUT failed");

  4: open (STDERR, ">&STDOUT") || die ("open STDERR failed");

  5: print STDOUT ("line 1\n");

  6: print STDERR ("line 2\n");

  7: close (STDOUT);

  8: close (STDERR);

  运行后,文档file1中的内容为:

  line 2

  line 1

  能够看到,这两行并未按我们想象的顺序存贮,为什么呢?我们来分析一下这段程式。

  第3行重定向标准输出文档,方法是打开文档file1将他和文档变量STDOUT关联,这也关闭了标准输出文档。第4行重定向标准错误文档,参数> &STDOUT告诉Perl解释器使用已打开并和STDOUT关联的文档,即文档变量STDERR指向和STDOUT相同的文档。第5、6行分别向STDOUT和STDERR写入数据,因为这两个文档变量指向同一个文档,故两行字符串均写到文档file1中,但顺序却是错误的,怎么回事呢?

  问题在于UNIX对输出的处理上。当使用print(或其他函数)写入STDOUT等文档时,UNIX操作系统真正所做的是把数据拷贝到一片特别的内存即缓冲区中,接下来的输出操作继续写入缓冲区直到写满,当缓冲区满了,就把全部数据实际输出。象这样先写入缓冲区再把整个缓冲区的内容输出比每次都实际输出所花费的时间要少得多,因为一般来说,I/O比内存操作慢得多。

  程式结束时,任何非空的缓冲区都被输出,然而,系统为STDOUT和STDERR分别维护一片缓冲区,并且先输出STDERR的内容,因此存贮在STDERR的缓冲区中的内容line 2出现在存贮在STDOUT的缓冲区中的内容line 1之前。

  为了解决这个问题,能够告诉Perl解释器不对文档使用缓冲,方法为:

  1、用select函数选择文档

  2、把值1赋给系统变量$|

  系统变量$|指定文档是否进行缓冲而不管其是否应该使用缓冲。假如$|为非零值则不使用缓冲。$|和系统变量$~和$^协同工作,当未调用select函数时,$|影响当前缺省文档。下例确保了输出的次序:

  1 : #!/usr/local/bin/perl

  2 :

  3 : open (STDOUT, ">file1") || die ("open STDOUT failed");

  4 : open (STDERR, ">&STDOUT") || die ("open STDERR failed");

  5 : $| = 1;

  6 : select (STDERR);

  7 : $| = 1;

  8 : print STDOUT ("line 1\n");

  9 : print STDERR ("line 2\n");

  10: close (STDOUT);

  11: close (STDERR);

  程式运行后,文档file1中内容为:

  line 1

  line 2

  第5行将$|赋成1,告诉Perl解释器当前缺省文档不进行缓冲,因为未调用select,当前的缺省文档为重定向到文档file1的STDOUT。第6 行将当前缺省文档设为STDERR,第7行又配置$|为1,关掉了重定向到file1的标准错误文档的缓冲。由于STDOUT和STDERR的缓冲均被关掉,向其的输出立即被写到文档中,因此line 1出现在第一行。

  4)指定读写权限

  打开一个既可读又可写的文档方法是在文档名前加上"+>",如下:

  open (READWRITE, "+>file1");

  此语句打开既可读又可写的文档file1,即能够重写其中的内容。文档读写操作最好和库函数seek和tell一起使用,这样能够跳到文档任何一点。

  注:也可用前缀"+<"指定可读写权限。

  5)close函数

  用于关闭打开的文档。当用close关闭管道,即重定向的命令时,程式等待重定向的命令结束,如:

  open (MYPIPE, "cat file*|");

  close (MYPIPE);

  当关闭此文档变量时,程式暂停运行,直到命令cat file*运行完毕。

  6)print, printf和write函数

  print是这三个函数中最简单的,他向指定的文档输出,假如未指定,则输出到当前缺省文档中,如:

  print ("Hello, there!\n");

  print OUTFILE ("Hello, there!\n");

  第一句输出到当前缺省文档中,若未调用select,则为STDOUT。第二句输出到由文档变量OUTFILE指定的文档中。

  printf函数先格式化字符串再输出到指定文档或当前缺省文档中,如:

  printf OUTFILE (“You owe me %8.2f", $owing);

  此语句取出变量$owing的值并替换掉串中的%8.2f,%8.2f是域格式的例子,把$owing的值看作浮点数。

  write函数使用输出格式把信息输出到文档中,如:

  select (OUTFILE);

  $~ = "MYFORMAT";

  write;

  关于printf和write,详见《第x章 格式化输出》。

  7)select函数

  select函数将通过参数传递的文档变量指定为新的当前缺省文档,如:

  select (MYFILE);

  这样,MYFILE就成了当前缺省文档,当对print、write和printf的调用未指定文档时,就输出到MYFILE中。

  8)eof函数

  eof函数查看最后一次读文档操作是否为文档最后一个记录,假如是,则返回非零值,假如文档更有内容,返回零。

  一般情况下,对eof的调用不加括号,因为eof和eof()是等效的,但和<>操作符一起使用时,eof和eof()就不同了。现在我们来创建两个文档,分别叫做file1和file2。file1的内容为:

  This is a line from the first file.

  Here is the last line of the first file.

  file2的内容为:

  This is a line from the second and last file.

  Here is the last line of the last file.

  下面就来看一下eof和eof()的区分,第一个程式为:

  1: #!/usr/local/bin/perl

  2:

  3: while ($line = <>) {

  4: print ($line);

  5: if (eof) {

  6: print ("-- end of current file --\n");

  7: }

  8: }

  运行结果如下:

  $ program file1 file2

  This is a line from the first file.

  Here is the last line of the first file.

  -- end of current file --

  This is a line from the second and last file.

  Here is the last line of the last file.

  -- end of current file --

  $

  下面把eof改为eof(),第二个程式为:

  1: #!/usr/local/bin/perl

  2:

  3: while ($line = <>) {

  4: print ($line);

  5: if (eof()) {

  6: print ("-- end of output --\n");

  7: }

  8: }

  运行结果如下:

  $ program file1 file2

  This is a line from the first file.

  Here is the last line of the first file.

  This is a line from the second and last file.

  Here is the last line of the last file.

  -- end of output --$

  这时,只有任何文档都读过了,eof()才返回真,假如只是多个文档中前几个的末尾,返回值为假,因为更有要读取的输入。

  9)间接文档变量

  对于上述各函数open, close, print, printf, write, select和eof,都能够用简单变量来代替文档变量,这时,简单变量中所存贮的字符串就被看作文档变量名,下面就是这样一个例子,此例很简单,就不解释了。需要指出的是,函数open, close, write, select和eof还允许用表达式来替代文档变量,表达式的值必须是字符串,被用作文档变量名。

  1: #!/usr/local/bin/perl

  2:

  3: &open_file("INFILE", "", "file1");

  4: &open_file("OUTFILE", ">", "file2");

  5: while ($line = &read_from_file("INFILE")) {

  6: &print_to_file("OUTFILE", $line);

  7: }

  8:

  9: sub open_file {

  10: local ($filevar, $filemode, $filename) = @_;

  11:

  12: open ($filevar, $filemode . $filename) ||

  13: die ("Can’t open $filename");

  14: }

  15: sub read_from_file {

  16: local ($filevar) = @_;

  17:

  18: <$filevar>;

  19: }

  20: sub print_to_file {

  21: local ($filevar, $line) = @_;

  22:

  23: print $filevar ($line);

  24: }

  2、跳过和重读数据

  函数名 seek

  调用语法 seek (filevar, distance, relative_to);

  解说 在文档中向前/后移动,有三个参数:

  1、filevar,文档变量

  2、distance,移动的字节数,正数向前移动,负数往回移动

  3、reletive_to,值可为0、1或2。为0时,从文档头开始移动,为1时,相对于当前位置(将要读的下一行)移动,为2时,相对于文档末尾移动。

  运行成功返回真(非零值),失败则返回零,常和tell函数合用。

  函数名 tell

  调用语法 tell (filevar);

  解说 返回从文档头到当前位置的距离。

  注意:

  1、seek和tell不能用于指向管道的文档变量。

  2、seek和tell中文档变量参数可使用表达式。

  3、系统读写函数

  函数名 read

  调用语法 read (filevar, result, length, skipval);

  解说 read函数设计得和UNIX的fread函数等效,能够读取任意长度的字符(字节)存入一个简单变量。其参数有四个:

  1、filevar:文档变量

  2、result:存贮结果的简单变量(或数组元素)

  3、length:读取的字节数

  4、skipval:可选项,指定读文档之前跳过的字节数。

  返回值为实际读取的字节数,假如已到了文档末尾,则返回零,假如出错,则返回空串。

  函数名 sysread

  调用语法 sysread (filevar, result, length, skipval);

  解说 更快的读取数据,和UNIX函数read等效,参数和read相同。

  函数名 syswrite

  调用语法 syswrite (filevar, data, length, skipval);

  解说 更快的写入数据,和UNIX函数write等效,参数:

  1、filevar:将要写入的文档

  2、data:存贮要写入数据的变量

  3、length:要写入的字节数

  4、skipval写操作之前跳过的字节数。

  4、用getc读取字符

  函数名 getc

  调用语法 $char = getc (infile);

  解说 从文档中读取单个字符。

  5、用binmode读取二进制文档

  函数名 binmode

  调用语法 binmode (filevar);

  解说 当您的系统(如类DOS系统)对文本文档和二进制文档有所区分时使用。必须在打开文档后、读取文档前使用。

  二、目录处理函数

  函数名 mkdir

  调用语法 mkdir (dirname, permissions);

  解说 创建新目录,参数为:

  1、dirname:将要创建的目录名,能够为字符串或表达式

  2、permissions:8进制数,指定目录的访问权限,其值和意义见下表,权限的组合方法为将相应的值相加。

  值 权限

  4000 运行时配置用户ID

  2000 运行时配置组ID

  1000 粘贴位

  0400 拥有者读权限

  0200 拥有者写权限

  0100 拥有者执行权限

  0040 组读权限

  0020 组写权限

  0010 组执行权限

  0004 任何人读权限

  0002 任何人写权限

  0001 任何人执行权限

  函数名 chdir

  调用语法 chdir (dirname);

  解说 改变当前工作目录。参数dirname能够为字符串,也能够为表达式。

  函数名 opendir

  调用语法 opendir (dirvar, dirname);

  解说 打开目录,和下面几个函数合用,可查看某目录中文档列表。参数为:

  1、dirvar:目录变量,和文档变量类似

  2、dirname:目录名,可为字符串或表达式

  成功返回真值,失败返回假。

  注:程式中可用同名的目录变量和文档变量,根据环境确定取成分。

  函数名 closedir

  调用语法 closedir (mydir);

  解说 关闭打开的目录。

  函数名 readdir

  调用语法 readdir (mydir);

  解说 赋给简单变量时,每次赋予一个文档或子目录名,对数组则赋予全部文档和子目录名。

  函数名 telldir

  调用语法 location = telldir (mydir);

  解说 象在文档中前后移动相同,telldir和下面的seekdir用于在目录列表中前后移动。

  函数名 seekdir

  调用语法 seekdir(mydir, location);

  解说 location必须为telldir返回的值。

  函数名 rewinddir

  调用语法 rewinddir (mydir);

  解说 将读取目录的位置重置回开头,从而能够重读目录列表。

  函数名 rmdir

  调用语法 rmdir (dirname);

  解说 删除空目录。成功则返回真(非零值),失败返回假(零值)。

  三、文档属性函数

  1、文档重定位函数

  函数名 rename

  调用语法 rename (oldname, newname);

  解说 改变文档名或移动到另一个目录中,参数可为字符串或表达式。

  函数名 unlink

  调用语法 num = unlink (filelist);

  解说 删除文档。参数为文档名列表,返回值为实际删除的文档数目。

  此函数之所以叫unlink而不叫delete是因为他实际所做的是删除文档的链接。

  2、链接和符号链接函数

  函数名 link

  调用语法 link (newlink, file);

  解说 创建现有文档的链接--硬链接,file是被链接的文档,newlink是被创建的链接。

  成功返回真,失败返回假。

  当删除这两个链接中的一个时,还能够用另一个来访问该文档。

  函数名 symlink

  调用语法 symlink (newlink, file);

  解说 创建现有文档的符号链接,即指向文档名,而不是指向文档本身。参数和返回值同上。

  当原文档被删除(如:被unlinke函数删除),则被创建链接不可用,除非再创建一个和原被链接的文档同名的文档。

  函数名 readlink

  调用语法 filename = readlink (linkname);

  解说 假如linkname为符号链接文档,返回其实际指向的文档。否则返回空串。

  3、文档许可权函数

  函数名 chmod

  调用语法 chmod (permissions, filelist);

  解说 改变文档的访问权限。参数为:

  1、permissions为将要配置的权限,其含义见上述mkdir中权限表

  2、filelist为欲改变权限的文档列表

  函数名 chown

  调用语法 chown (userid, groupid, filelist);

  解说 改变文档的属主,有三个参数:

  1、userid:新属主的(数字)ID号

  2、groupid:新的组(数字)ID号,-1为保留原组

  3、filelist:欲改变属主的文档列表

  函数名 umask

  调用语法 oldmaskval = umask (maskval);

  解说 配置文档访问权限掩码,返回值为当前掩码。

  4、其他属性函数

  函数名 truncate

  调用语法 truncate (filename, length);

  解说 将文档的长度减少到length字节。假如文档长度已小于length,则不做任何事。其中filename能够为文档名,也能够为文档变量

  函数名 stat

  调用语法 stat (file);

  解说 获取文档状态。参数file可为文档名也可为文档变量。返回列表元素依次为:

  ?文档所在设备

  ?内部参考号(inode)

  ?访问权限

  ?硬链接数

  ?属主的(数字)ID

  ?所属组的(数字)ID

  ?设备类型(假如file是设备的话)

  ?文档大小(字节数)

  ?最后访问时间

  ?最后修改时间最后改变状态时间

  ?I/O操作最好块大小

  ?分配给该文档的块数

  函数名 lstat

  调用语法 lstat (file);

  解说 和stat类似,区分是将file看作是符号链接。

  函数名 time

  调用语法 currtime = time();

  解说 返回从1970年1月1日起累计秒数。

  函数名 gmtime

  调用语法 timelist = gmtime (timeval);

  解说 将由time, stat 或 -A 和 -M 文档测试操作符返回的时间转换成格林威治时间。返回列表元素依次为:

  ?秒

  ?分钟

  ?小时,0~23

  ?日期

  ?月份,0~11(一月~十二月)

  ?年份

  ?星期,0~6(周日~周六)

  ?一年中的日期,0~364

  ?是否夏令时的标志

  详见UNIX的gmtime帮助。

  函数名 localtime

  调用语法 timelist = localtime (timeval);

  解说 和gmtime类似,区分为将时间值转换为本地时间。

  函数名 utime

  调用语法 utime (acctime, modtime, filelist);

  解说 改变文档的最后访问时间和最后更改时间。例如:

  $acctime = -A "file1";

  $modtime = -M "file1";

  @filelist = ("file2", "file3");

  utime ($acctime, $modtime, @filelist);

  函数名 fileno

  调用语法 filedesc = fileno (filevar);

  解说 返回文档的内部UNIX文档描述。参数filevar为文档变量。

  函数名 fcntl

  flock

  调用语法 fcntl (filevar, fcntlrtn, value);

  flock (filevar, flockop);

  解说 详见同名UNIX函数帮助。

  四、使用DBM文档

  Perl中可用关联数组来访问DBM文档,所用函数为dbmopen和dbmclose,在Perl5中,已用tie和untie代替。

  函数名 dbmopen

  调用语法 dbmopen (array, dbmfilename, permissions);

  解说 将关联数组和DBM文档相关联。参数为:

  1、array:所用关联数组

  2、dbmfilename:将打开的DBM文档名

  3、访问权限,详见mkdir

  函数名 dbmclose

  调用语法 dbmclose (array);

  解说 关闭DBM文档,拆除关联数组和之的关系。

喜欢本文,那就收藏到:

    Del.icio.us Google书签 Digg Live Bookmark Technorati Furl Yahoo书签 Facebook 百度搜藏 新浪ViVi 365Key网摘 天极网摘 和讯网摘 博拉网 POCO网摘 添加到饭否 QQ书签 Digbuzz我挖网
相关评论  我也要评论
还没有关于此文章的相关评论!
  • 昵称: (为空则显示guest)
  • 评论分数: ★ ★ ★★★ ★★★★ ★★★★★
  • 评论内容:(不能超过250字,需审核后才会公布,请自觉遵守互联网相关政策法规。
  • 导航
    赞助商
    文章类别
    订阅