問題タブ [text-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
931 参照

python - パイパーシングの質問

このコードは機能します:

私は2つの問題で立ち往生しています:

1 - カスタム関数を使用してトークンを解析する方法。たとえば、正規表現の代わりにカスタム ロジックを使用して、数値が郵便番号かどうかを判断したいとします。それ以外の:

多分:

2 - 文字列が TO を解析するものをどのように判断しますか。「80001」は「zipcode」に解析されますが、pyparsing を使用してこれを判断するにはどうすればよいですか? 文字列の内容を解析するのではなく、単にそれがどのような種類のクエリであるかを判断するだけです。

0 投票する
3 に答える
520 参照

java - Java でのテキストの解析に関する詳細はどこで確認できますか?

今学期はデータ構造のクラス (Java) に参加していますが、設計した構造にデータを入力するために、テキスト ファイルに対して多くの解析を行っています。構文解析アルゴリズムではなく、構造自体に焦点が当てられています。私はこの分野が苦手なので、誰かこのテーマに関する本やサイトを教えてもらえないだろうかと思っていました。デザインパターン、ライブラリ、スタイルなど。ありがとう!

0 投票する
3 に答える
20152 参照

python - Python:キーごとに複数行の構成ファイルを読み取る

私は小さなDBテストスイートを書いています。これは、クエリと期待される結果を含む構成ファイルを読み取ります。例:

これはうまく機能します。Pythonを使用して各行を分割しますstring.partition('=')

私の問題は非常に長いSQLクエリです。現在、私はこれらのクエリをワンライナーとして貼り付けるだけですが、これは醜くて保守できません。

たとえ多くの行にまたがっていても、式の権利を読み取るためのエレガントでPythonicな方法を見つけたいと思います。

ノート:

  • 私のSQLクエリには=
  • "sがない既存のファイルがたくさんあるので、右側にsを強制するという考えは好きではありません。

編集:

ConfigParserは優れていますが、複数行のエントリのすべての行の先頭にスペースまたはタブを追加する必要があります。これは大きな苦痛かもしれません。

前もって感謝します、

アダム

0 投票する
3 に答える
5408 参照

java - Javaバッファリーダーテキストファイルの解析

私はテキストファイルの解析に本当に苦労しています。次の形式のテキストファイルがあります

などただし、IDは2つの値のいずれかを表すことができます。0は新しいフィールドであることを意味し、-1は最後の新しいフィールドに関連していることを意味します。関連するフィールドがそれ自体を繰り返すことができる回数は無制限です。ここで問題が発生しています。

ライブラリに新しいFloatのArrayListを受け取るメソッドがあるので、関連するFloatのArrayListのArrayListを取得します。

このためのロジックをコーディングしようとすると、whileループがどんどん深く埋め込まれていきます。

私はこれについてどのように取り組むべきかについての提案を本当にいただければ幸いです。前もって感謝します。

これが私がこれまでに持っているコードです。

新しいコード

0 投票する
2 に答える
1678 参照

linq - LINQ と File.ReadAllLines() を使用して次の行を読み取る

アイテムを表すファイルがあります。1 行にアイテム GUID があり、その後にアイテムを説明する 5 行が続きます。

例:

最初にこのファイルにアクセスして、LINQ を使用して提供された基準を満たすアイテムの GUID を取得しようとしています。この GUID を別の関数に渡し、ファイルに「再度」アクセスし、その行を見つけます (その行line.Contains("line1") && line.Contains("8e2803d1-444a-4893-a23d-d3b4ba51baee")から始まる次の 5 行を読み取ります。

そうするための効率的な方法はありますか?

0 投票する
2 に答える
237 参照

java - テキストからxmlへの解析と翻訳

ドメイン固有言語で記述されたプログラムを xml 表現に変換する必要があります。これらのプログラムは、単純なテキスト ファイルの形式です。どのようなアプローチをお勧めしますか? どの API を使用する必要がありますか:

  1. この言語で書かれたテキスト ファイルを解析します。
  2. 取得したトークンとトークン ストリームに基づいて xml を記述します。

私の基準は、メモリや計算時間の効率よりも、迅速で簡単な開発です。

どうもありがとうケタン

0 投票する
2 に答える
142 参照

language-agnostic - Google マップのような複数の形式で住所を読み取る方法

Google マップでは、任意の方法で住所を入力できることに注意してください。それが有効な住所である限り...Googleマップはそれを読み取ります。

ルビーの本で、このようなもののコードスニペットを見たことがありますが、電話番号が含まれていました。

アドレスに対してこれを行う方法はありますか?

あなたの選択した言語で。

編集:

「有効な」アドレスは気にしません。アドレスを解析したいだけです。123 fake street, WA, 34223 が住所になり、123 fake street WA 34223 も住所になります。

0 投票する
4 に答える
1071 参照

c# - テキスト解析、条件付きテキスト

プレースホルダーを実際の値に置き換えるために解析するプレースホルダーを含むテキスト テンプレートがあります。

テキスト テンプレート:

StringBuilder.Replace() を使用してプレースホルダーを置き換えます

今はもっと高度なアルゴリズムを作りたいと思っています。コードの一部の行は条件付きです。それらは完全に削除するか、保持する必要があります。

テキスト テンプレート

行 Employer は、人が雇用されている場合にのみ表示されます (ブール変数 Person.IsEmployed によって制御されます)。

更新:開始/終了タグを使用できます。文字列 A と B の間のテキストを見つけるにはどうすればよいですか? 正規表現を使用できますか? どのように?

0 投票する
3 に答える
1132 参照

java - 文字列、文法ファイルの解析

以下の文字列をどのように分割しますか。分離する必要があるのは、文字列の残りの部分からの山かっこを含む各<Word>です。したがって、以下の場合、私はいくつかの文字列になります1."私はあなたと別れる必要があります"2. "<理由>"(スペースなし)3。"。 "5."。 "

以下は私が現在持っているものです(その醜い...)

0 投票する
1 に答える
559 参照

php - 外部プロジェクトでWordpressのhttp.phpを使用するにはどうすればよいですか?

回答:Curlを使用して実装されています...

別のサーバーでホストされているパイプ区切りのテキストファイルからデータを解析しようとしています。このファイルはデータベースに挿入されます。私のホスト(1and1)はphp.iniでallow_url_fopenを無効にしたと思います。

エラーメッセージ :

コード:

Wordpressにはこのクールなhttp.phpファイルがあります。それを行うためのより良い方法はありますか?そうでない場合、このタスクにhttp.phpを使用するにはどうすればよいですか?君たちありがとう..