表示されている記事に応じて、いくつかのキーワード メタ タグをページにドロップしたいと考えています。
ページ blabla.com/article.aspx?id=2 をロードするとします。ID が 2 に等しい記事のタイトルは、「ビジネス管理における意図的な間違いの知恵」です。
したがって、次のようなメタ タグを含めたいと思います。
<META name="keywords" content="wisdom, deliberate, mistakes, business, management" />
そのため、ノイズの多い単語を除外する方法が必要です (SQL Server FullText と同様)。どのようにしますか?
1) ノイズ ワード リストを webconfig に保存しますか? 2) ノイズ ワードをデータベースに保存しますか? 3) ノイズ ワードをテキスト ファイルに保存しますか? 4) コード内のノイズ ワードをハードコーディングする (NOT =P)
では、これらのノイズ ワードをどのように読み込んで、ページの読み込みを最小限に抑えますか? 最後に、文字列を解析してノイズ ワードを削除するにはどうすればよいでしょうか。
ありがとう!
編集: ノイズ (またはストップ) ワードは、SQL Server 2005 FTS が使用するものと同じです (MSSQL\FTDATA の noiseENU.txt を確認してください)。そのファイルの内容は次のとおりです。
about
1
after
2
all
also
3
an
4
and
5
another
6
any
7
are
8
as
9
at
0
be
$
because
been
before
being
between
both
but
by
came
can
come
could
did
do
does
each
else
for
from
get
got
has
had
he
have
her
here
him
himself
his
how
if
in
into
is
it
its
just
like
make
many
me
might
more
most
much
must
my
never
no
now
of
on
only
or
other
our
out
over
re
said
same
see
should
since
so
some
still
such
take
than
that
the
their
them
then
there
these
they
this
those
through
to
too
under
up
use
very
want
was
way
we
well
were
what
when
where
which
while
who
will
with
would
you
your
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z