言葉による関係の分類に使用するのに最適なアルゴリズムが何であるかはわかりません。例えば「The yellow sun」のような文章の場合、黄色と太陽の関係があります。これまで検討してきた機械学習手法は、ベインズ統計、ラフ集合、ファジー論理、隠れマルコフ モデル、人工ニューラル ネットワークです。
何か提案はありますか?
ありがとうございました :)
言葉による関係の分類に使用するのに最適なアルゴリズムが何であるかはわかりません。例えば「The yellow sun」のような文章の場合、黄色と太陽の関係があります。これまで検討してきた機械学習手法は、ベインズ統計、ラフ集合、ファジー論理、隠れマルコフ モデル、人工ニューラル ネットワークです。
何か提案はありますか?
ありがとうございました :)
Stanford Parserはまさにあなたが望むことを行います。オンラインデモもあります。これがあなたの例の結果です。
Your sentence
The yellow sun.
Tagging
The/DT yellow/JJ sun/NN ./.
Parse
(ROOT
(NP (DT The) (JJ yellow) (NN sun) (. .)))
Typed dependencies
det(sun-3, The-1)
amod(sun-3, yellow-2)
Typed dependencies, collapsed
det(sun-3, The-1)
amod(sun-3, yellow-2)
あなたの質問から、型付けされた依存関係に興味があるようです。
ユーザー dmcer が指摘したように、依存関係パーサーが役立ちます。あなたが読むことができる依存関係の解析に関する文献はたくさんあります。この本とこれらの講義ノートは、従来の方法を紹介するための出発点として適しています。
依存関係解析に似たリンク文法パーサーは、Sleator と Temperley のリンク文法構文を使用して、単語と単語のリンケージを生成します。元の Link Grammar ページと最新のAbiword ページで詳細を確認できます(Abiword は現在実装を維持しています)。
依存関係解析への型にはまらないアプローチについては、化学/物理学における素粒子相互作用に類似した単語と単語の関係をモデル化するこの論文を読むことができます。