Lingua::StopWordsの次の例を使用しています。
use Lingua::StopWords qw( getStopWords );
my $stopwords = getStopWords('en');
my @words = qw( i am the walrus goo goo g'joob );
# prints "walrus goo goo g'joob"
print join ' ', grep { !$stopwords->{$_} } @words;
$document
my を使用し、ストップワードを削除して、結果をファイルに出力するにはどうすればよいですか? ここで私のコードを参照してください:
open(FILESOURCE, "sample.txt") or die("Unable to open requested file.");
my $document = <FILESOURCE>;
close (FILESOURCE);
open(TEST, "results_stopwords.txt") or die("Unable to open requested file.");
use Lingua::StopWords qw( getStopWords );
my $stopwords = getStopWords('en');
print join ' ', grep { !$stopwords->{$_} } $document;
これらのバリエーションを試しました:
print join ' ', grep { !$stopwords->{$_} } TEST;
print TEST join ' ', grep { !$stopwords->{$_} } @words;
基本的に、ドキュメントを読み込んでストップワードを削除し、結果を新しいファイルに書き込むにはどうすればよいですか?