| 订阅 | 在线投稿
分享
 
 
当前位置: 王朝网络 >> perl >> 功能丰富的Perl:用Perl读写Excel文件
 

功能丰富的Perl:用Perl读写Excel文件

2008-05-19 06:25:55 编辑來源:互联网 繁體版 评论
 
 
  Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel

  在 2000 年,Takanori Kawai 和 John McNamara 编写出了 Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel 模块并将它们张贴在 CPAN 上,这两个模块使得在任何平台上从 Excel 文件抽取数据成为可能(尽管不容易)。

  正如我们在稍后将看到的,如果您正在使用 Windows,Win32::OLE 仍提供一个更简单、更可靠的解决方案,并且 Spreadsheet::WriteExcel 模块建议使用 Win32::OLE 来进行更强大的数据和工作表操纵。Win32::OLE 带有 ActiveState Perl 工具箱,可以用来通过 OLE 驱动许多其它 Windows 应用程序。请注意,要使用此模块,您仍需要在机器上安装和注册一个 Excel 引擎(通常随 Excel 本身安装)。

  需要解析 Excel 数据的应用程序数以千计,但是这里有几个示例:将 Excel 导出到 CSV、与存储在共享驱动器上的电子表格交互、将金融数据移至数据库以便形成报告以及在不提供任何其他格式的情况下分析数据。

  要演示这里给出的示例,必须在您的系统上安装 Perl 5.6.0。您的系统最好是最近(2000 年或以后)的主流 UNIX 安装(Linux、Solaris 和 BSD)。虽然这些示例在以前版本的 Perl 和 UNXI 以及其他操作系统中也可以使用,但是您应该考虑到您将面对那些它们无法作为练习发挥作用的情况。

  Windows 示例:解析

  本节仅适用于 Windows 机器。所有其它各节适用于 Linux。

  在进行之前,请安装 ActiveState Perl(这里使用版本 628)或 ActiveState Komodo IDE 以编辑和调试 Perl。Komodo 为家庭用户提供一个免费许可证,您大概在几分钟之内就可以得到它。(有关下载站点,请参阅本文后面的参考资料。)

  使用 ActiveState PPM 软件包管理器安装 Spreadsheet::ParseExcel 和 Spreadsheet::WriteExcel 模块是困难的。PPM 没有历史记录,难以设置选项,帮助会滚出屏幕并且缺省方式是忽略相关性而安装。您可以从命令行输入“ppm”然后发出以下命令来调用 PPM:

  清单 1:安装 Excel 模块的 PPM 命令

  ppm install OLE::Storage_Lite

  ppm install Spreadsheet::ParseExcel

  ppm install Spreadsheet::WriteExcel

  在这种情况下,该模块的安装将失败,因为 IO::Scalar 还不可用,因此,您可能想放弃 PPM 问题的查找,而转向内置的 Win32::OLE 模块。然而,在您阅读本文时,ActiveState 可能已经发布了该问题的修正。

  有了 ActiveState 的 Win32::OLE,您可以使用下面所列的代码逐个单元地转储工作表:

  下载 win32excel.pl

  清单 2:win32excel.pl

  #!/usr/bin/perl -w

  use strict;

  use Win32::OLE qw(in with);

  use Win32::OLE::Const 'Microsoft Excel';

  $Win32::OLE::Warn = 3;

  # die on errors...

  # get already active Excel application or open new

  my $Excel = Win32::OLE-GetActiveObject('Excel.Application')

  || Win32::OLE-new('Excel.Application', 'Quit');

  # open Excel file

  my $Book = $Excel-Workbooks-Open("c:/komodo projects/test.xls");

  # You can dynamically obtain the number of worksheets, rows, and columns

  # through the Excel OLE interface.

  Excel's Visual Basic Editor has more

  # information on the Excel OLE interface.

  Here we just use the first

  # worksheet, rows 1 through 4 and columns 1 through 3.

  # select worksheet number 1 (you can also select a worksheet by name)

  my $Sheet = $Book-Worksheets(1);

  foreach my $row (1..4)

  {

  foreach my $col (1..3)

  {

  # skip empty cells

  next unless defined $Sheet-Cells($row,$col)-{'Value'};

  # print out the contents of a cell

  printf "At ($row, $col) the value is %s and the formula is %s\n",

  $Sheet-Cells($row,$col)-{'Value'},

  $Sheet-Cells($row,$col)-{'Formula'};

  }

  }

  # clean up after ourselves

  $Book-Close;

  请注意,您可以用以下方式很轻松地为单元分配值:

  $sheet-Cells($row, $col)-{'Value'} = 1;

  Linux 示例:解析

  本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。

  很难给出一个比 Spreadsheet::ParseExcel 模块文档中所提供的示例更好的 Linux 解析示例,因此我将演示那个示例,然后解释其工作原理。

  下载 parse-excel.pl

  清单 3:parse-excel.pl

  #!/usr/bin/perl -w

  use strict;

  use Spreadsheet::ParseExcel;

  my $oExcel = new Spreadsheet::ParseExcel;

  die "You must provide a filename to $0 to be parsed as an Excel file" unless @ARGV;

  my $oBook = $oExcel-Parse($ARGV[0]);

  my($iR, $iC, $oWkS, $oWkC);

  print "FILE

  :", $oBook-{File} , "\n";

  print "COUNT :", $oBook-{SheetCount} , "\n";

  print "AUTHOR:", $oBook-{Author} , "\n"

  if defined $oBook-{Author};

  for(my $iSheet=0; $iSheet {SheetCount} ; $iSheet++)

  {

  $oWkS = $oBook-{Worksheet}[$iSheet];

  print "--------- SHEET:", $oWkS-{Name}, "\n";

  for(my $iR = $oWkS-{MinRow} ;

  defined $oWkS-{MaxRow} && $iR {MaxRow} ;

  $iR++)

  {

  for(my $iC = $oWkS-{MinCol} ;

  defined $oWkS-{MaxCol} && $iC {MaxCol} ;

  $iC++)

  {

  $oWkC = $oWkS-{Cells}[$iR][$iC];

  print "( $iR , $iC ) =", $oWkC-Value, "\n" if($oWkC);

  }

  }

  }

  此示例是用 Excel 97 测试的。如果它不能工作,则试着将它转换成 Excel 97 格式。Spreadsheet::ParseExcel 的 perldoc 页也声称了 Excel 95 和 2000 兼容性。

  电子表格被解析成一个名为 $oBook 的顶级对象。$oBook 具有辅助程序的特性,例如“File”、“SheetCount”和“Author”。 Spreadsheet::ParseExcel 的 perldoc 页的工作簿一节中记载了这些特性。

  该工作簿包含几个工作表:通过使用工作簿 SheetCount 特性迭代它们。每个工作表都有一个 MinRow 和 MinCol 以及相应的 MaxRow 和 MaxCol 特性,它们可以用来确定该工作簿可以访问的范围。Spreadsheet::ParseExcel perldoc 页的工作表一节中记载了这些特性。

  可以通过 Cell 特性从工作表获得单元;那就是清单 3 中获得 $oWkC 对象的方式。Spreadsheet::ParseExcel 的 perldoc 页的 Cell 一节中记载了 Cell 特性。根据文档,似乎没有一种方式能够获得特定单元中列出的公式。

  Linux 示例:写入

  本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。

  Spreadsheet::WriteExcel 在 Examples 目录中带有许多示例脚本,通常可以在 /usr/lib/perl5/site_perl/5.6.0/Spreadsheet/WriteExcel/examples 下找到这些脚本。它可能被安装在其它各处;如果找不到那个目录,请与您的本地 Perl 管理员联系。

  坏消息是 Spreadsheet::WriteExcel 无法用于写入现有 Excel 文件。必须自己使用 Spreadsheet::ParseExcel 从现有 Excel 文件导入数据。好消息是 Spreadsheet::WriteExcel 与 Excel 5 直至 Excel 2000 兼容。

  这里有一个程序,它演示如何从一个 Excel 文件抽取、修改(所有数字都乘以 2)数据以及将数据写入新的 Excel 文件。只保留数据,不保留格式和任何特性。公式被丢弃。

  下载 excel-x2.pl

  清单 4:excel-x2.pl

  #!/usr/bin/perl -w

  use strict;

  use Spreadsheet::ParseExcel;

  use Spreadsheet::WriteExcel;

  use Data::Dumper;

  # cobbled together from examples for the Spreadsheet::ParseExcel and

  # Spreadsheet::WriteExcel modules

  my $sourcename = shift @ARGV;

  my $destname = shift @ARGV or die "invocation: $0 ";

  my $source_excel = new Spreadsheet::ParseExcel;

  my $source_book = $source_excel-Parse($sourcename)

  or die "Could not open source Excel file $sourcename: $!";

  my $storage_book;

  foreach my $source_sheet_number (0 .. $source_book-{SheetCount}-1)

  {

  my $source_sheet = $source_book-{Worksheet}[$source_sheet_number];

  print "--------- SHEET:", $source_sheet-{Name}, "\n";

  # sanity checking on the source file: rows and columns should be sensible

  next unless defined $source_sheet-{MaxRow};

  next unless $source_sheet-{MinRow}

  
 
 
 
 
上一篇《功能丰富的Perl:Perl用于实现遗传算法》
下一篇《功能丰富的Perl:编写说英语的Perl程序》
 
 
 
 
 
 
日版宠物情人插曲《Winding Road》歌词

日版宠物情人2017的插曲,很带节奏感,日语的,女生唱的。 最后听见是在第8集的时候女主手割伤了,然后男主用嘴帮她吸了一下,插曲就出来了。 歌手:Def...

兄弟共妻,我成了他们夜里的美食

老钟家的两个儿子很特别,就是跟其他的人不太一样,魔一般的执着。兄弟俩都到了要结婚的年龄了,不管自家老爹怎么磨破嘴皮子,兄弟俩说不娶就不娶,老父母为兄弟两操碎了心...

如何磨出破洞牛仔裤?牛仔裤怎么剪破洞?

把牛仔裤磨出有线的破洞 1、具体工具就是磨脚石,下面垫一个硬物,然后用磨脚石一直磨一直磨,到把那块磨薄了,用手撕开就好了。出来的洞啊很自然的。需要猫须的话调几...

我就是扫描下图得到了敬业福和爱国福

先来看下敬业福和爱国福 今年春节,支付宝再次推出了“五福红包”活动,表示要“把欠大家的敬业福都还给大家”。 今天该活动正式启动,和去年一样,需要收集“五福”...

冰箱异味产生的原因和臭味去除的方法

有时候我们打开冰箱就会闻到一股异味,冰箱里的这种异味是因为一些物质发出的气味的混合体,闻起来让人恶心。 产生这些异味的主要原因有以下几点。 1、很多人有这种习...

 
 
 
  Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel   在 2000 年,Takanori Kawai 和 John McNamara 编写出了 Spreadsheet::WriteExcel 和 Spreadsheet::ParseExcel 模块并将它们张贴在 CPAN 上,这两个模块使得在任何平台上从 Excel 文件抽取数据成为可能(尽管不容易)。   正如我们在稍后将看到的,如果您正在使用 Windows,Win32::OLE 仍提供一个更简单、更可靠的解决方案,并且 Spreadsheet::WriteExcel 模块建议使用 Win32::OLE 来进行更强大的数据和工作表操纵。Win32::OLE 带有 ActiveState Perl 工具箱,可以用来通过 OLE 驱动许多其它 Windows 应用程序。请注意,要使用此模块,您仍需要在机器上安装和注册一个 Excel 引擎(通常随 Excel 本身安装)。   需要解析 Excel 数据的应用程序数以千计,但是这里有几个示例:将 Excel 导出到 CSV、与存储在共享驱动器上的电子表格交互、将金融数据移至数据库以便形成报告以及在不提供任何其他格式的情况下分析数据。   要演示这里给出的示例,必须在您的系统上安装 Perl 5.6.0。您的系统最好是最近(2000 年或以后)的主流 UNIX 安装(Linux、Solaris 和 BSD)。虽然这些示例在以前版本的 Perl 和 UNXI 以及其他操作系统中也可以使用,但是您应该考虑到您将面对那些它们无法作为练习发挥作用的情况。   Windows 示例:解析   本节仅适用于 Windows 机器。所有其它各节适用于 Linux。   在进行之前,请安装 ActiveState Perl(这里使用版本 628)或 ActiveState Komodo IDE 以编辑和调试 Perl。Komodo 为家庭用户提供一个免费许可证,您大概在几分钟之内就可以得到它。(有关下载站点,请参阅本文后面的参考资料。)   使用 ActiveState PPM 软件包管理器安装 Spreadsheet::ParseExcel 和 Spreadsheet::WriteExcel 模块是困难的。PPM 没有历史记录,难以设置选项,帮助会滚出屏幕并且缺省方式是忽略相关性而安装。您可以从命令行输入“ppm”然后发出以下命令来调用 PPM:   清单 1:安装 Excel 模块的 PPM 命令   ppm install OLE::Storage_Lite   ppm install Spreadsheet::ParseExcel   ppm install Spreadsheet::WriteExcel   在这种情况下,该模块的安装将失败,因为 IO::Scalar 还不可用,因此,您可能想放弃 PPM 问题的查找,而转向内置的 Win32::OLE 模块。然而,在您阅读本文时,ActiveState 可能已经发布了该问题的修正。   有了 ActiveState 的 Win32::OLE,您可以使用下面所列的代码逐个单元地转储工作表:   下载 win32excel.pl   清单 2:win32excel.pl   #!/usr/bin/perl -w   use strict;   use Win32::OLE qw(in with);   use Win32::OLE::Const 'Microsoft Excel';   $Win32::OLE::Warn = 3;   # die on errors...   # get already active Excel application or open new   my $Excel = Win32::OLE-GetActiveObject('Excel.Application')   || Win32::OLE-new('Excel.Application', 'Quit');   # open Excel file   my $Book = $Excel-Workbooks-Open("c:/komodo projects/test.xls");   # You can dynamically obtain the number of worksheets, rows, and columns   # through the Excel OLE interface.   Excel's Visual Basic Editor has more   # information on the Excel OLE interface.   Here we just use the first   # worksheet, rows 1 through 4 and columns 1 through 3.   # select worksheet number 1 (you can also select a worksheet by name)   my $Sheet = $Book-Worksheets(1);   foreach my $row (1..4)   {   foreach my $col (1..3)   {   # skip empty cells   next unless defined $Sheet-Cells($row,$col)-{'Value'};   # print out the contents of a cell   printf "At ($row, $col) the value is %s and the formula is %s\n",   $Sheet-Cells($row,$col)-{'Value'},   $Sheet-Cells($row,$col)-{'Formula'};   }   }   # clean up after ourselves   $Book-Close;   请注意,您可以用以下方式很轻松地为单元分配值:   $sheet-Cells($row, $col)-{'Value'} = 1;   Linux 示例:解析   本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。   很难给出一个比 Spreadsheet::ParseExcel 模块文档中所提供的示例更好的 Linux 解析示例,因此我将演示那个示例,然后解释其工作原理。   下载 parse-excel.pl   清单 3:parse-excel.pl   #!/usr/bin/perl -w   use strict;   use Spreadsheet::ParseExcel;   my $oExcel = new Spreadsheet::ParseExcel;   die "You must provide a filename to $0 to be parsed as an Excel file" unless @ARGV;   my $oBook = $oExcel-Parse($ARGV[0]);   my($iR, $iC, $oWkS, $oWkC);   print "FILE   :", $oBook-{File} , "\n";   print "COUNT :", $oBook-{SheetCount} , "\n";   print "AUTHOR:", $oBook-{Author} , "\n"   if defined $oBook-{Author};   for(my $iSheet=0; $iSheet {SheetCount} ; $iSheet++)   {   $oWkS = $oBook-{Worksheet}[$iSheet];   print "--------- SHEET:", $oWkS-{Name}, "\n";   for(my $iR = $oWkS-{MinRow} ;   defined $oWkS-{MaxRow} && $iR {MaxRow} ;   $iR++)   {   for(my $iC = $oWkS-{MinCol} ;   defined $oWkS-{MaxCol} && $iC {MaxCol} ;   $iC++)   {   $oWkC = $oWkS-{Cells}[$iR][$iC];   print "( $iR , $iC ) =", $oWkC-Value, "\n" if($oWkC);   }   }   }   此示例是用 Excel 97 测试的。如果它不能工作,则试着将它转换成 Excel 97 格式。Spreadsheet::ParseExcel 的 perldoc 页也声称了 Excel 95 和 2000 兼容性。   电子表格被解析成一个名为 $oBook 的顶级对象。$oBook 具有辅助程序的特性,例如“File”、“SheetCount”和“Author”。 Spreadsheet::ParseExcel 的 perldoc 页的工作簿一节中记载了这些特性。   该工作簿包含几个工作表:通过使用工作簿 SheetCount 特性迭代它们。每个工作表都有一个 MinRow 和 MinCol 以及相应的 MaxRow 和 MaxCol 特性,它们可以用来确定该工作簿可以访问的范围。Spreadsheet::ParseExcel perldoc 页的工作表一节中记载了这些特性。   可以通过 Cell 特性从工作表获得单元;那就是清单 3 中获得 $oWkC 对象的方式。Spreadsheet::ParseExcel 的 perldoc 页的 Cell 一节中记载了 Cell 特性。根据文档,似乎没有一种方式能够获得特定单元中列出的公式。   Linux 示例:写入   本节适用于 UNIX,特别适用于 Linux。没有在 Windows 中测试它。   Spreadsheet::WriteExcel 在 Examples 目录中带有许多示例脚本,通常可以在 /usr/lib/perl5/site_perl/5.6.0/Spreadsheet/WriteExcel/examples 下找到这些脚本。它可能被安装在其它各处;如果找不到那个目录,请与您的本地 Perl 管理员联系。   坏消息是 Spreadsheet::WriteExcel 无法用于写入现有 Excel 文件。必须自己使用 Spreadsheet::ParseExcel 从现有 Excel 文件导入数据。好消息是 Spreadsheet::WriteExcel 与 Excel 5 直至 Excel 2000 兼容。   这里有一个程序,它演示如何从一个 Excel 文件抽取、修改(所有数字都乘以 2)数据以及将数据写入新的 Excel 文件。只保留数据,不保留格式和任何特性。公式被丢弃。   下载 excel-x2.pl   清单 4:excel-x2.pl   #!/usr/bin/perl -w   use strict;   use Spreadsheet::ParseExcel;   use Spreadsheet::WriteExcel;   use Data::Dumper;   # cobbled together from examples for the Spreadsheet::ParseExcel and   # Spreadsheet::WriteExcel modules   my $sourcename = shift @ARGV;   my $destname = shift @ARGV or die "invocation: $0 ";   my $source_excel = new Spreadsheet::ParseExcel;   my $source_book = $source_excel-Parse($sourcename)   or die "Could not open source Excel file $sourcename: $!";   my $storage_book;   foreach my $source_sheet_number (0 .. $source_book-{SheetCount}-1)   {   my $source_sheet = $source_book-{Worksheet}[$source_sheet_number];   print "--------- SHEET:", $source_sheet-{Name}, "\n";   # sanity checking on the source file: rows and columns should be sensible   next unless defined $source_sheet-{MaxRow};   next unless $source_sheet-{MinRow}   
󰈣󰈤
 
 
 
  免责声明:本文仅代表作者个人观点,与王朝网络无关。王朝网络登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
 
华丽的模特拍摄(8)
华丽的模特拍摄(7)
华丽的模特拍摄(6)
华丽的模特拍摄(5)
八里沟
朝阳宫
天下峨眉 云上金顶
老家(四)
 
>>返回首页<<
 
 
 为你推荐
 
 
 
 转载本文
 UBB代码 HTML代码
复制到剪贴板...
 
 热帖排行
 
 
 
 
©2005- 王朝网络 版权所有