問題タブ [sentence]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1888 参照

java - Java を使用した文のオートコンプリート

ユーザーがフィールドに入力しているときに提案として提供したい約1000の文があるとしましょう。

私は実行lucene in memory searchしてから、結果を にフィードすることを考えていましたsuggestions set

trigger検索を実行するための はとspace charですexit from the input field

これを使用するつもりGWTなので、クライアントはサーバーから結果を取得するだけです。

私はグーグルがしていることをしたくありません。各単語を完成させ、各キーワード セットについて提案を行います。キーワードをチェックして、それに基づいて提案をしたいだけです。ここでスタックオーバーフローで質問のタイトルを入力しているときのようなものです。

誰かが前にこのようなことをしましたか? 私が使用できるライブラリはすでにありますか?

0 投票する
1 に答える
286 参照

iphone - UIWebView の HTML ページで複数の文を選択できない

以下のような HTML ページがあります。

<html>

<body>

<div id='0>

<span id='0'>Hi </span>

<span id='1'>How </span>

<span id='2'>Are </span>

<span id='3'>You</span>

</div>

<br><br>

<div id='1>

<span id='4'>welcome </span>

<span id='5'>to </span>

<span id='6'>our </span>

<span id='7'>place</span>

</div> <br><br> </body> </html>

このような HTML をロードした iPhone webView で複数の文を選択しようとしています。しかし、私は代わりにセネテンスのブロックを選択しています。

何を変更する必要がありますか?

0 投票する
2 に答える
1844 参照

antlr - さまざまな単語タイプの文を解析する

2種類の文を分析するための文法を探しています。つまり、空白で区切られた単語を意味します。

  1. ID1:数字で始まらない単語を含む文
  2. ID2:数字と数字で始まらない単語を含む文

基本的に、文法の構造は次のようになります。

@Bart
2つのトークンを追加し、後でlexer-ruleで使用するためにlexer-ruleとして追加しようと'_'しまし'"'た。次の文法で使用していなくても 、ANTLRWorks 1.4.2で次のエラーが発生します。前のトークンが同じ入力に一致するため、次のトークン定義を一致させることはできません。そのエラー。なんで? SpecialWordSpecial

fragmentSpecial

次に、 Lexer-ruleSpecialをlexer-ruleで使用しますWord

0 投票する
5 に答える
2241 参照

java - 正規表現を使用してテキストを分割する方法ですが、分割された単語は正規表現の区切り記号を保持し続けますか?

テキストがあり、この単純な正規表現を使用して単語に分割します: [ \n]. スペースと改行を使用してテキストを単語に分割します。

いくつかの処理の後、これを単純な文の検出に使用するため、分割された単語に空白または改行を保持する方法があるかどうかを知りたいです。

String#splitメソッドを使用しています。

0 投票する
2 に答える
4200 参照

ruby-on-rails - 文で配列を「変換」する方法は?

Ruby on Rails v3.0.9 を使用しており、句読点を含む文の文字列の配列を「変換」したいと考えています。つまり、次のような配列があるとします。

取得\ビルドしたい:

どうやってやるの?

0 投票する
4 に答える
35361 参照

c# - 文を単語に分割するが、C# の句読点に問題がある

同様の質問をいくつか見ましたが、これを達成しようとしています。

文字列を指定すると、str="月は私たちの自然の衛星です。つまり、月は地球の周りを回転しています!" 単語を抽出して配列に格納したい。予想される配列要素はこれです。

String.split( ','\t','\r') を使用してみましたが、これは正しく機能しません。. やその他の句読点も削除しようとしましたが、「ie」のような文字列も解析したいと思います。これを達成するための最良の方法は何ですか?また、regex.split を使用してみましたが、役に立ちませんでした。

正しい方向へのいくつかの微調整に感謝します。

0 投票する
1 に答える
173 参照

regex - 正規表現を使用してドキュメントの行を操作しようとしています

目的に合わせてフォーマットが不十分なテキストドキュメントがあり、いくつか変更を加える必要がありました。しかし今、私は別の問題を抱えています。それは、次のように、それ自体で「取り残された」多くの文です。

正規表現で文を表現する方法を知っている人はいますか?これらの文を上または下の段落と結合したいと思います。尋ねる前に、私はグーグルとこのサイトの両方を検索したことを誓います。

編集:申し訳ありませんが、元の投稿にアクセスできなくなり、Amberの回答にコメントできませんでした。今後の質問のためにアカウントを登録します。さらに、私はNotepad++を使用しているという事実に言及することを怠りました。

0 投票する
3 に答える
2106 参照

javascript - Javascript(jQuery)は長いテキストの最後の文を削除します

長いテキストチャンク(実際には1段落)の最後の文を削除するのに十分スマートなjavascript関数を探しています。複雑さを示すいくつかのサンプルテキスト:

これで、配列の最後のエントリを分割し.て削除できましたが、?または!で終わる文では機能せず、一部の文は次のような引用符で終わります。something: "stuff."

これを行う方法?適切なアルゴリズムは何ですか?

編集-長いテキストとは段落内のすべてのコンテンツを意味し、文とは実際の文(行ではない)を意味するため、私の例では最後の文はHe later described it as: "Something insane."次のようになります。She did not know, "I think we should move past the fence!", she quickly said."

0 投票する
3 に答える
367 参照

php - PHP: 並列構造を除いて、コンマに沿って文を分割する

並列構造が含まれている場合を除いて、セットをコンマに沿って部分に分割したいと思います。

たとえば、次の文 (http://owl.english.purdue.edu/owl/resource/623/01/) があるとします。

メアリーはハイキング、水泳、自転車に乗るのが好きです。

メアリーはハイキング、水泳、自転車が好きです。

これらを最初のコンマだけに沿って分割すると、次のようになります。

おそらく前向きな正規表現を使用して、コンマで囲まれていない少なくとも 2 ~ 3 個の空白をチェックしますか?

0 投票する
2 に答える
1436 参照

java - 文中の単語の検索に関するJavaクエリ

私はスタンフォードのNLPパーサー(http://nlp.stanford.edu/software/lex-parser.shtml)を使用して、テキストのブロックを文に分割し、どの文に特定の単語が含まれているかを確認しています。

これまでの私のコードは次のとおりです。

「javaTokenizerDemotestfile.txtwall」を使用してコマンドラインからコードを実行します

testfile.txtの内容は次のとおりです。

したがって、プログラムで最初の文の「wall」を検出する必要があります(「wall」はコマンドラインの2番目の引数として入力されます)。しかし、プログラムは「yes!」を出力しないため、「wall」を検出しません。プログラムの出力は次のとおりです。

スタンフォードパーサーのDocumentPreprocessorは、テキストを2つの文に正しく分割します。問題は、equalsメソッドの使用にあるようです。各単語のタイプは「edu.stanford.nlp.ling.Word」です。単語の基になる文字列にアクセスしようとしたので、文字列が「壁」に等しいかどうかを確認できますが、アクセス方法がわかりません。

2番目のforループを"for(Word word:sentence){"と書くと、コンパイル時に互換性のないタイプのエラーメッセージが表示されます。