“sentence”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

198 参照

regex - 繰り返される文をキャプチャするための正規表現

最近、大きなテキストファイルを扱う作業を行っています。as quotecharを使用してそれらを CSV 形式に変換しました|が、テキストファイル内で文全体が繰り返されている場合があることがわかりました。文の長さはさまざまです。私の目的は、CSV ファイルから重複した文を削除することです。明確にするために、次のようになります。

2 番目の列の一部は繰り返しです。正規表現の経験はありますが、これに使用できるものは見たことがありません。正規表現はこれにアプローチする正しい方法ですか、それともより良い代替手段はありますか? アドバイスをいただければ幸いです。

2013-07-13T10:52:55.290

0 投票する

3 に答える

5896 参照

python - 2単語を含む文を抽出するPython

このリンクPython 抽出文を含む wordで説明したのと同じ問題がありますが、違いは、同じ文で 2 つの単語を見つけたいということです。2 つの特定の単語を含むコーパスから文を抽出する必要があります。誰か助けてくれませんか？

python regex nltk sentence text-segmentation

2013-08-30T09:11:35.167

0 投票する

2 に答える

176 参照

xslt - XSLT を使用して、XML をネストされた AND/OR を持つ「ブール」英文に変換する

XML を英文に似たものに変換する必要があります。たとえば、次の XML:

次のようなものに変換する必要があります。

これは一例ですが、「and」および「or」条件はさらにネストできます。

ルールは次のようです。

要素に後続の兄弟または子がない場合、何も出力されず、完了です。
「and」または「or」に子を持たない後続の兄弟がある場合、後続の兄弟のタイプ (「and」または「or」) が出力されます (例: A と B、C と D、D または E)。
"and" に "or" 子を持つ "and" 兄弟が続く場合、"and either" が出力されます (例: and either C)。
テキストのない要素は出力されません。

この出力を生成するためにいくつかのアプローチを試みましたが、成功しませんでした。1 つの問題は、再帰が正しく行われていないことです。1 つの要素がネストされている xslt 処理の例をたくさん見てきましたが (たとえば、Item は、他の Item で構成される他の Item で構成することができます)、「and」と「or」のような 2 つの要素の例はありません。 " は兄弟であったり、相互に入れ子になったりすることができます。xsl:template match= "and | or" を使用してから、"and" または "or" をテストしてみましたが、リーフレベルに到達していないか、順序が間違っています。

このような構造を処理するための正しい方向に誰かが私を向けることができるかどうか、および/または「ブール」文を表すためのより良い構造を誰かが提案できるかどうかを知りたいです。XML はまだファイナライズされていないため、処理が容易になる場合は変更できます。

注: 私は Saxon 9 を使用しており、xslt 2.0 ソリューションを使用できます。

より詳しい情報：

@g-ken-holman に改めて感謝します。提案されたトップダウンのアプローチは気に入っていますが、いくつか問題があります。ケンの例で and/or シーケンスが or/and に変更された理由がわかりません。and/or シーケンスは正しいようです。とにかく、私は例を実行しましたが、うまくいきました。しかし、私は全部で5つのケースを与えられました。最初の 2 つの単純なケースでは、すべてが and か or で、ケース 5 は上記のケースで機能しました。しかし、ケース 3 と 4 は機能しませんでした。XML と結果は次のとおりです。

そして例4：

結果: 基準を満たすには、イベントに A と BC または D または E が必要です。期待: 基準を満たすには、イベントに A と B と、C、D または E のいずれかが必要

その理由は、複数の (position()>1) テストがある場合にのみ and/or or が出力されているためだと思います。しかし、これですべてのケースがカバーされるわけではありません。たぶん、position()>1 of node count = 1 の場合でしょうか?

それが簡単になる場合は、「どちらか」の要素を追加できます。

回答時の注意:

これはコメント欄には長すぎるので、ここに追加します。@Ken が答えを提供してくれたと信じており、彼が提案する 2 番目のアプローチが最適です。

処理がわかれば。ドキュメント内のすべてのノードを照合しています。「イベント」に一致し、他のノードの外側にネストされているため、最初に実行されます。次に、「and」ノードが検出された場合、「and」で一致を取得し、そのレベルのすべての「and」兄弟を (for-each) 繰り返し処理します。テスト「position() > 1」が失敗するため、最初のノードの単語「and」は出力しません。xls:text を使用して常に空白を出力します。次に、現在の (コンテキスト) ノードからテンプレートを適用します ()。「and」の子ノードでのみ一致するようになったため、これでツリーをたどり始めます。「and」に一致する場合は、これまで行ったことを繰り返します。次に「or」に一致する場合は、「and」とほとんど同じである match="or" テンプレートを実行します。ただし、「または」という単語を出力します。ただし、"or" および 1]" priority="1"> で一致する 2 つの可能なテンプレートがあります。priority="1" は、優先度が指定されていない限り、他の "or" 一致よりも高い一致の優先度を設定します。、一致のデフォルトの優先度は 0.5 です。したがって、現在の「or」ノードに 2 つの子がある場合 (or[count(*) > 1])、「either」を出力してから、優先度の低い「or」を許可する呼び出しを呼び出します。実行する一致します。一致のデフォルトの優先度は 0.5 です。したがって、現在の "or" ノードに 2 つの子 (or[count(*) > 1]) がある場合、"either" を出力してから、優先度の低い "or" マッチを実行できるようにする呼び出しを行います。一致のデフォルトの優先度は 0.5 です。したがって、現在の "or" ノードに 2 つの子 (or[count(*) > 1]) がある場合、"either" を出力してから、優先度の低い "or" マッチを実行できるようにする呼び出しを行います。

これは正しいと思いますが、1つ質問があります。オペランドのテキストはどのように出力されますか?

xslt recursion sentence

2013-09-04T21:35:07.770

0 投票する

1 に答える

71 参照

c - 中断したところからサイクルを保存して再起動する

この言語で多くの注目を集めているので、私は C で何かを始めています。数字と文字を混ぜてワードジェネレーターを作りました。単語の長さは 8 で、特定の文字が含まれています。

単語を正しく生成するコードを作成したため、助けを求めます。生成された 20,000 単語ごとに最後の単語が txt に保存されます。起動すると、その単語が検出されてコンソールに表示されます。

私がやりたいのは、その最後の単語を取得し、それをサイクルに送信することです。単語がある場合は、単語の先頭ではなく先頭に移動します。

ここにコードがあります。助けを提供できる人に事前に感謝します。

c cycle sentence

2013-09-14T12:00:52.533

0 投票する

2 に答える

3894 参照

javascript - javascript 文 (または段落) ジェネレーターを作成するには?

javascript 文 (または段落) ジェネレーターを作成するにはどうすればよいですか?

ボタンをクリックすると一度に 1 つの見積もりを生成するジェネレーターを作成しました。引用は、2 つのボックス内のテキストエリア内に表示されます。

しかし、私の問題は、一度に 1 つの見積もりしか表示できないことです。たくさんのハーフフレーズを混ぜ合わせて段落を作成できるようにしたい。

(つまり)

別の結果は次のようになります。

|車 | 緑の。| | 車 | 写真速いです。|

「|」の間にあるのは、異なる結果です。

Ps また、すべてを 1 つのテキストエリアに配置し、ボタンクリックで生成したいと考えています。私はいくつかのコーディングを行っています。パラグラフジェネレーターが可能になるように変更したいと思います。

元のコード:

CSS

Javascript

HTML

javascript html generator paragraph sentence

2013-10-15T05:02:06.300

0 投票する

4 に答える

1386 参照

python - 長文チェックインセンテンス

長い単語があるかどうかを文章で確認したい。たとえば、soooo、toooo、thaaatttt などです。長い単語が含まれている場合と含まれていない場合がある文章のリストがあるため、ユーザーが何を入力するかわかりません。Pythonでそれを確認するにはどうすればよいですか。私はpythonが初めてです。

python regex file sentence

2013-11-24T01:26:09.690

0 投票する

1 に答える

765 参照

javascript - HTML5 と JavaScript を使用して、連続した音を再生して音声文を作成する

phonegap アプリのオーディオマップをまとめようとしています。簡単な文章を作成してルートを作成したい。

物事を絞り込むために、オーディオナビゲーションを実行するために連続して再生したいオーディオ要素の配列があります。例えば：

この投稿の最後に、私が遊んでいるがあまり成功していない単純化されたコードを示します。エラーが発生し続けます。jplayer または別のシステムの使用を提案する前に、これらは、停止する機能を備えた曲の再生を対象としているように思えます。本格的な jplayer またはその他のスタイルのインターフェイスは必要ありません。ボタンを押すだけで、オーディオマップシステムをガイドできるようになります。コンソールに次のエラーが表示され続けます。

配列を要素IDと単なる変数の両方として試しました。

何かお役に立てば幸いです。簡略化されたスクリプトは次のとおりです。

javascript html audio playback sentence

2013-11-30T16:50:23.233

問題タブ [sentence]

Reference