7

手続き型言語を使用して、文字ではなく単語に対して正規表現スタイルの変換を行うための構文例または一般的な手法を探しています。

たとえば、コピーをトレースするには、意味は似ているが単語の選択が異なるドキュメントを作成する必要があります。

テキスト ストリームに適用できるこれらの可能な変換を簡潔に定義できるようにしたいと考えています。

例えば。「fast noun」から「rapid noun」へ、しかし「go fast」。変換されません (その後に名詞はありません。
または: "アリスは歌を歌います"から "はアリスによって歌われます"

これは、受動態の検出など、文法チェッカーで行われることを期待しています。

この種の言語処理のための AC# 実装は非常に優れたものになるでしょうが、どのような努力の大半も適切なルールを考え出すことにかかっていると思います。ルールを明確で理解しやすいものに保つことは、出発点のように思えます。

4

6 に答える 6

3

Jason Rennie > WordNet-QueryData-1.47 > WordNet::QueryDataを試すことができます

于 2008-10-23T14:24:56.563 に答える
2

調査を開始するのに適した場所の1つは、「Word Net」です。これは、セマンティクスの辞書であり、類似した意味で単語をグループ化し、単語間の関係を便利な方法で記録します。

Word Netコーパスを活用するソフトウェアプロジェクトはたくさんありますが、そのうちの1つが必要なものかもしれません。

于 2008-10-23T09:20:54.290 に答える
2

特定の言語に縛られていない場合、HaskellにはAarneRantaの文法フレームワークがあります。

http://www.grammaticalframework.org/

これは、この種の自然言語処理用のパーサーなどを生成するように明示的に設計されています。

于 2008-11-05T16:15:08.570 に答える
0

自然言語の解析/変換にさらに堅牢なものが必要な場合は、 OpenNLP の C# ポートを試すことができます。

于 2008-10-23T08:50:58.157 に答える
0

開始するのに適した場所は、SIL のCARLAStudioの「コンピュータ支援関連言語適応」スイートです。または、SIL のAdapt It。SIL には膨大な範囲の言語分析ソフトウェアがあり、これはあなたが進んでいるように見える方向です。これは、意味を気にしない正規表現から、言語分析を処理できるものへの大きな飛躍であることは間違いありません。

于 2008-10-23T06:45:48.393 に答える
-1

あなたが議論するような英語処理のために存在する構文を私は知りません。そこにあるツールセット (Word Net など) のいずれかを使用して、独自の DSL を作成する必要があります。

于 2008-10-25T15:03:56.323 に答える