package Lingua::StopWords::NL;
use strict;
use warnings;
use utf8;
use Encode qw(encode);
use Exporter;
our @ISA = qw(Exporter);
our %EXPORT_TAGS = ( 'all' => [ qw( getStopWords ) ] );
our @EXPORT_OK = ( @{ $EXPORT_TAGS{'all'} } );
our $VERSION = 0.12;
sub getStopWords {
if ( @_ and $_[0] eq 'UTF-8' ) {
my %stoplist = map { ( $_, 1 ) } _stopwords();
return \%stoplist;
}
else {
my %stoplist = map { ( encode("iso-8859-1", $_), 1 ) } _stopwords();
return \%stoplist;
}
}
sub _stopwords {
return qw(
de en van ik te dat die in een hij het niet zijn is was op aan
met als voor had er maar om hem dan zou of wat mijn men dit zo
door over ze zich bij ook tot je mij uit der daar haar naar heb
hoe heeft hebben deze u want nog zal me zij nu ge geen omdat
iets worden toch al waren veel meer doen toen moet ben zonder
kan hun dus alles onder ja eens hier wie werd altijd doch wordt
wezen kunnen ons zelf tegen na reeds wil kon niets uw iemand
geweest andere
);
}
1;