問題タブ [parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - SQLクエリを解析して列名とテーブル名を引き出す方法はありますか?
使用されているすべての列名とテーブル名を特定するために分析する必要がある(データ結果ではなく実際のSQLコードのみ)個別のテキストファイルに150以上のSQLクエリがあります。できれば、各列とテーブルが出現する回数を指定してください。ネストされたSELECTステートメントなどを使用して、まったく新しいSQL解析プログラムを作成するのは見た目よりも難しいです。
これを実行するプログラムまたはコード(またはこれに近いもの)が必要ですが、私はそれを見つけていません。
c# - C# キャストと解析
次のうち、C# でより適切なコードはどれですか?またその理由は?
また
最終的に、キャストするのと解析するのとではどちらが良いでしょうか?
c# - C# で正確な日付を解析しても、IFormatProvider を作成する必要はありません
私が間違っている場合は誰かが私を修正してください。ただし、C# で yyyy/MM/dd (または他の特定の形式) の日付を解析するのは、
いいえ、C# では IFormatProvider を作成する必要があります。
毎回これを行う必要がないように、これを設定する app.config フレンドリーな方法はありますか?
javascript - 文字列の解析: 単語やフレーズの抽出 [JavaScript]
それ以外の場合はスペースで区切られた用語のリストで、正確なフレーズ (引用符で囲まれている) をサポートする必要があります。したがって、それぞれの文字列をスペース文字で分割するだけでは不十分です。
例:
複雑な解析や分割と再結合の操作を実行するのではなく、単一の RegEx でこれを達成できるかどうか疑問に思います。
どんな助けでも大歓迎です!
php - PHP でのエラー トレラントな HTML/XML/SGML 解析
HTML に似た古いドキュメントがたくさんあります。のように、それらは HTML のように見えますが、HTML の一部ではない追加の作成されたタグがあります
これらのファイルを解析する必要があります。PHP は、利用可能な唯一のツールです。ドキュメントは整形式の XML にはほど遠いものです。
私の最初の考えは、PHP DOMDocument で loadHTML メソッドを使用することでした。ただし、これらのメソッドは HTML タグを構成することを妨げ、文字列/ファイルの解析を拒否します。
私が思いついた唯一の解決策は、無効なタグを削除し、それらを有効な HTML タグ (おそらくタグ名の ID を持つスパン) に置き換える文字列置換関数でファイルを前処理することです。
よりエレガントなソリューションはありますか?有効と見なす追加のタグについて DOMDocument に知らせる方法はありますか? PHP用の別の堅牢なHTML解析クラス/オブジェクトはありますか?
(明らかでない場合、ここでは正規表現を有効な解決策とは見なしません)
更新: 偽のタグの情報はここでの目標の一部であるため、Tidy のようなものはオプションではありません。また、私は、整形式のクリーンアップのすべてではないにしても、ある程度のレベルを実行するものを求めています。これが、最初に DomDocument の loadHTML メソッドを探していた理由です。
.net - .NET でクエリ文字列を NameValueCollection に解析する方法
p1=6&p2=7&p3=8
などの文字列を解析したいと思いNameValueCollection
ます。
Page.Request
オブジェクトにアクセスできない場合、これを行う最もエレガントな方法は何ですか?
algorithm - 単語として書かれた数字から値を読み取る方法は?
ご存知のように、数字は数字で書くことも、名前で呼ぶこともできます。123を123に変換する例はたくさんありますが、逆に変換する方法の良い例は見つかりませんでした。
注意点のいくつか:
- 枢機卿/名目または序数:「1つ」および「最初」
- 一般的なスペルミス:「40」/「40」
- 数百/千:2100->「二十百」そして「二千百」
- 区切り文字:「1125」だけでなく、「1125」または「1125」など
- 口語表現:「30代」
- 分数:「3分の1」、「5分の2」
- 一般名:「ダース」、「ハーフ」
そして、おそらくまだリストされていない可能性のあるより多くの警告があります。アルゴリズムが非常に堅牢である必要があり、スペルミスさえ理解している必要があるとします。
これらすべての書き方を学ぶために、どの分野/論文/研究/アルゴリズムを読む必要がありますか?情報はどこにありますか?
PS:私の最後のパーサーは、実際には英語、ロシア語、ヘブライ語の3つの異なる言語を理解する必要があります。そして、おそらく後の段階で、より多くの言語が追加されるでしょう。ヘブライ語には男性/女性の番号もあります。たとえば、「1人の男性」と「1人の女性」には異なる「1つ」があります—「ehad」と「ahat」。ロシア語にも独自の複雑さがいくつかあります。
グーグルはこれで素晴らしい仕事をしています。例えば:
(逆も可能ですhttp://www.google.com/search?q=999999999999+in+english)
c# - C# には Java のような String Tokenizer がありますか?
単純な文字列入力の解析を行っていますが、文字列トークナイザーが必要です。私は C# は初めてですが、Java をプログラミングしたことがあります。C# に文字列トークナイザーが必要なのは当然のことです。そうですか?それはどこにある?どうやって使うの?
parsing - ファイルを解析するツール
GE Logician MEL トレース ファイルを解析して読みやすくする最善の方法を見つけようとしています。
次のようなセグメントがあります
と
私はそれを手続き的に行うことにうんざりすることができましたが、私が扱ったすべての正規表現の後、同様の方法でファイルを解析するためのルールを定義できるものは何もないとは信じがたいです. 私が間違っている?
php - Javascript または PHP 用の Parsing Expression Grammar (PEG) ライブラリはありますか?
ドメイン固有の言語を記述するための構文解析式文法形式に惹かれていますが、これまでのところ、実装コードは Java や Haskell などの言語で書かれており、私の組織の共有ホスティング環境では Web サーバーに適していません。一緒に暮らす必要があります。
JavascriptまたはPHP用のPEGライブラリまたはPackRatパーサージェネレーターを知っている人はいますか? もちろん、Javascript や PHP のソース コードを生成できる任意の言語のコード ジェネレーターを使用すれば、うまくいきます。