問題タブ [parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
9 に答える
85515 参照

regex - 正規表現:文字列内の2つのタグ間のサブ文字列を引き出す

次の形式のファイルがあります。

正規表現を使用して、タグとタグData I wantの間からを取得したいと思います。誰かがこれがどのように行われるかを教えてもらえますか?[Start][End]

0 投票する
15 に答える
66813 参照

java - Javaで文字列を解析するさまざまな方法は何ですか?

プレイヤー コマンドを解析するために、私はほとんどの場合、splitメソッドを使用して文字列を区切り文字で分割し、残りを一連のifs またはswitches で割り出しました。Javaで文字列を解析するいくつかの異なる方法は何ですか?

0 投票する
13 に答える
10088 参照

language-agnostic - 引用部分を無視して文字列を分割する

次のような文字列を指定します。

a,"string, with",various,"values, and some",quoted

引用されたセクション内のコンマを無視しながら、コンマに基づいてこれを分割する良いアルゴリズムは何ですか?

出力は配列である必要があります。

[ "a", "string, with", "various", "values, and some", "quoted" ]

0 投票する
10 に答える
1752 参照

algorithm - sprintf() 関数の出力を逆にするアルゴリズムを探しています

ログ ファイルの解析が必要なプロジェクトに取り組んでいます。次のようなグループメッセージを受け取る高速なアルゴリズムを探しています:

P1 の温度は華氏 35 度です。

P1 の温度は 40F です。

P3 の温度は華氏 35 度です。

ロガーが停止しました。

ロガーを開始しました。

P1 の温度は 40F です。

printf() の形式で何かを出力します。

アルゴリズムは、メッセージ グループ内のほぼすべてのデータ ロードを認識できるように十分に汎用的である必要があります。

この種のテクノロジーを検索してみましたが、検索する正しい用語もわかりません。

0 投票する
8 に答える
388442 参照

xml - vba を使用して XML を解析する方法

私はVBAで働いていて、例えば文字列を解析したい

XとYの値を2つの別々の整数変数に取得します。

私は XML に関しては初心者です。なぜなら、私が働いている分野のために VB6 と VBA に行き詰まっているからです。

どうすればいいですか?

0 投票する
4 に答える
4483 参照

c# - How to get only directory name from SaveFileDialog.FileName

What would be the easiest way to separate the directory name from the file name when dealing with SaveFileDialog.FileName in C#?

0 投票する
24 に答える
155592 参照

string - 文字列から使用可能な住所、市区町村、州、郵便番号を解析する

問題: SQL Server 2005 に変換された Access データベースの住所フィールドがあります。このフィールドにはすべてが 1 つのフィールドに含まれています。住所の個々のセクションを、正規化されたテーブルの適切なフィールドに解析する必要があります。約 4,000 レコードに対してこれを行う必要があり、繰り返し可能である必要があります。

仮定:

  1. 米国内の住所を想定する (今のところ)

  2. 入力文字列には、宛先 (宛先の人物) および/または 2 番目の番地 (すなわちスイート B) が含まれることがあると想定します。

  3. 状態は省略される場合があります

  4. 郵便番号は、標準の 5 桁または zip+4 です。

  5. 場合によってはタイプミスがあります

更新: 提起された質問に答えて、標準は普遍的に守られていませんでした。ジオコードだけでなく、個々の値を保存する必要があり、エラーはタイプミスを意味します(上記で修正)

サンプルデータ:

  • AP Croll & Son 2299 Lewes-Georgetown Hwy, Georgetown, DE 19947

  • 11522 ショーニー ロード、グリーンウッド DE 19950

  • 144 Kings Highway, SW Dover, DE 19901

  • 統合された定数。サービス 2 Penns Way Suite 405 New Castle, DE 19720

  • Humes Realty 33 Bridle Ridge Court, Lewes, DE 19958

  • Nichols Excavation 2742 Pulaski Hwy Newark, DE 19711

  • 2284 Bryn Zion Road、スマーナ、DE 19904

  • VEI Dover Crossroads, LLC 1500 Serpentine Road, Suite 100 Baltimore MD 21

  • 580 North Dupont Highway ドーバー、DE 19901

  • 私書箱 778 ドーバー、DE 19903

0 投票する
10 に答える
7428 参照

parsing - パーサーコンビネーターについて学ぶにはどうすればよいですか?

この件に関するいくつかのリソースを見つけましたが、それらはすべてSmallTalkまたはHaskellの深い理解を必要としますが、どちらも知りません。

0 投票する
5 に答える
1634 参照

.net - .Net解析と変換

<datatype>.parse.Netでは、またはを使用して文字列値を別のデータ型に読み込むことができますConvert.To<DataType>

私は解析と変換の基本に精通していないので、どちらがより良い/より速い/より適切であるかを尋ねられたとき、私はいつも途方に暮れています。

では、どのような状況でどちらの方法が最適ですか?

0 投票する
6 に答える
2441 参照

c# - PHPファイルでSQLを解析するための最良のアプローチ?

卒業論文では、準備済みステートメントを使用して SQL インジェクションの脆弱性を自動的に検出し、修正を提案するプログラムを開発しました。具体的には、PHP の mysqli 拡張機能です。SO コミュニティに対する私の質問は次のとおりです。PHP ソース コード内の SQL を検出するために、どのようなアプローチをお勧めしますか?

を含む列挙型を使用しSQL keywords (SELECT, INSERT, ...)、基本的に各行を解析し、列挙型を繰り返し処理して、SQL が存在するかどうかを判断しました。さらに、パーサーが html を誤って検出していないことを確認する必要がありました (たとえば、<\select>)。

私にとっては、このソリューションはうまく機能しましたが、今はもう少し時間があり、コードをリファクタリングして、よりエレガントな (そして効率的な) ソリューションを使用することを考えています。私がプログラムを書いたのはC#の使用に限定してください。