問題タブ [linguistics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 文脈に従ってテキストから単語を抽出する方法
ユーザーが提供したテキストステートメントから関連する単語を抽出したい。例えば。「長方形には何辺ありますか?」という質問に対して 単語は 'rectangles' 、 'sides' 、 'many' 、 'how' でなければなりません。
まさに私が目指しているのは、NLP の質問応答システムであることがわかりました。しかし今は、質問から必要なキーワードのみを抽出したいと考えています。質問のドメインはそれほど広大ではありません。
さまざまなデータ マイニング ツールに出くわしましたが、それらが実際にこれに役立つかどうかはよくわかりません。それらは少し高度すぎるか、正確に関連していないようです。
要件に合ったツールがあるかどうか、または自分でコーディングしてみる必要があるかどうかを教えてください。
役立つと思われるあらゆる種類のポインターを提供してください。
c# - 長い文字列から人間が読める短い文字列を作成する
次のような文字列を契約する必要があります...
ロボットになることを考えますか。年間の無料オイル交換を提供します。」
...はるかに短いが、それでも人間が識別できるものに(選択リストから見つける必要があります-私の現在のソリューションでは、ユーザーが選択の唯一の目的で任意のタイトルを入力しています)
質問を形成する文字列の部分のみを抽出し(可能であれば)、何らかの方法でそれを次のように減らしたいと思います
ロボットになることを検討します
これに役立つ文法アルゴリズムはありますか? 動詞と名詞だけを拾うことができる何かがあるのではないかと考えています。
これはキーとして機能するだけなので、完璧である必要はありません。私は、英語の固有の複雑さを矮小化しようとしているわけではありません。
ruby - ルビーで浮動小数点数を保持するにはどうすればよいですか
そのため、数値を文字列に変換するコードを試しています。ただし、場合によっては、小数点以下 2 桁が保持されないことに気付きました。たとえば、加算に 1.01 と 1.04 を入力すると、2.04 が返されます。1.05 と入力すると、数値が保持され、正確に返されます。私は物事が丸められていることを理解しています。ただし、丸められないようにする方法はわかりません。(1.01+1.04) を 1 つの入力として自分自身に送信することを検討する必要がありますか?
警告!私はまだこれを試していないので、サポートされているかどうかはわかりません:
私がこれまでに持っているもの:
助けてくれてありがとう!私が試すことができるように、いくつかのコードを投稿してください!
generator - ドメイン固有のテキスト ジェネレーターのコーディング
私の友人は不動産ビジネスに携わっており、不動産広告のコピーを書く技術を見せられた後、それが非常に定型的であることに気付きました。特に、事前に定義されたフィールドに入力するオンライン広告の場合.
当然のことながら、広告の作成をほぼ自動化するジェネレーターを作成することを考えました。人間のように単語や文章をまとめることができるというだけで、傑出した、または非常に優れたコピーを生成するとは思いません。
広告を定義するスケルトン/テンプレートがあり、ランダムに選択できるフレーズと単語のセットもまとめましたが、そのようなジェネレーターのコーディングのより一般的な側面に興味がありますか? この小さなプロジェクトをよりよく理解するために読むことができる提案、ヒント、または文献はありますか?
dictionary - アプリケーション用の二か国語辞書はどこで入手できますか?
プログラム用にオープン形式の二か国語辞書を入手できる場所があるかどうか疑問に思っています。これまでのところ、eng-esp、eng-frn、ger-esp など、いくつかの言語ペアを使用したいと考えています。私はこれまで成功せずにググって潜んでいました。
nlp - 文中の「あなた」のさまざまな形を識別するアルゴリズムはありますか別名英語の文を解析する方法
「あなた」が文の主語または目的語として使用されているかどうかはどうすればわかりますか?
nlp - ドイツ語の性別と複数形の単語リストはどこにありますか?
ドイツ語の単語の性別と複数形を判別するための単純なテキスト マイニング アプリケーションを作成しようとしています。
そのため、まずトレーニング用の大きな単語リストが必要です。私は周りを検索しましたが、性別または複数形のリストを見つけることができませんでした.
linguistics - semcorコーパス構造を理解するh
私はNLPを学んでいます。私は現在、語義の曖昧性解消で遊んでいます。semcorコーパスをトレーニングデータとして使用することを計画していますが、xml構造を理解するのに問題があります。グーグルを試しましたが、semcorのコンテンツ構造を説明するリソースがありませんでした。
- wnsnは「単語の意味」だと思います。それが正しいか?
- 属性lexsnはどういう意味ですか?それはどのようにwordnetにマッピングされますか?
- 属性pnは何を指しますか?(3行目)
- rdf属性はどのように割り当てられますか?(再び3行目)
- 一般的に、可能な属性は何ですか?
compare - 言語固有の癖に対するダメラウ・レーベンシュタイン距離
オランダ語を話す人々にとって、2つの文字「ij」は「y」と簡単に交換できる1文字と見なされます。
私が取り組んでいるプロジェクトでは、ダメラウ・レーベンシュタイン距離の変形を使用して、「ij」と「y」の間の距離を現在の値2ではなく1として計算したいと思います。
私はこれを自分で試しましたが失敗しました。私の問題は、両方のテキストの長さが異なるという事実をどのように処理するかについての手がかりがないことです。誰かがこれを解決する方法についての提案/コードフラグメントを持っていますか?
ありがとう。
r - テキストから「((Adj|Noun)+|((Adj|Noun)(Noun-Prep)?)(Adj|Noun))Noun」を抽出する (Justeson & Katz、1995)
Justeson and Katz (1995) によって R パッケージで提案された((Adj|Noun)+|((Adj|Noun)(Noun-Prep)?)(Adj|Noun))Nounを抽出できるかどうかを問い合わせたいと思います。オープンNLP?
つまり、この言語フィルタリングを使って名詞句の候補を抽出したいと考えています。
その意味がよく理解できません。
それを説明するか、そのような表現をR言語に変換してください。
どうもありがとう。
サンプル コードを次の場所から開始できます。
これについて新しい質問を開くように言われました。元の質問はこちらです。