FC2ブログ

付録についていた count_word.pl

日経 Linux 2011-05 を参考に Hadoop を実験してみましたが
なぜかエラーになるので
一度ソースを見てみました
結果、付録DVDに入っていたスクリプトには

#!/usr/bin/perl
#use strict;
my %words;

while () {
chomp $_;
undef %words;
my @words = split ( /\s+/, $_ );
foreach $s ( @words ) {
$s =~ tr/A-Z/a-z/;
$s =~ s/\W+//g;
$s =~ s/([\w\d]+)/$1/g;
unless ( $s =~ /\w{4,}/ ) { next; }
print ($s . "\t" . 1 . "\n" );
}
}


となっていましたが
書籍のページでは

#!/usr/bin/perl
use strict;
my $s;

while () {
chomp $_;
my @words = split ( /\s+/, $_ );
foreach $s ( @words ) {
$s =~ tr/A-Z/a-z/;
$s =~ tr/a-z//cd;
if ( $s =~ /[a-z]{4,}/ ) {
print ($s . "\t" . 1 . "\n" );
}
}
}

となっています

コマンドで書き換えたような記憶はないので、
ソースそのものが違っているような気がします....

count_word.pl*
となっているので、他にも要因があるのかもしれません
スポンサーサイト



テーマ : Linux
ジャンル : コンピュータ

コメント

非公開コメント

最新記事
検索フォーム
GREEハコニワ攻略サイト
リンク
カテゴリ
月別アーカイブ
フリーエリア
最新記事
FXプライムレート
最新コメント
最新トラックバック