問題タブ [parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
parsing - タイムスタンプを無視して、ログファイルを比較する簡単な方法は?
2 つのログ ファイルを比較する必要がありますが、各行のタイム スタンプ部分 (正確には最初の 12 文字) は無視します。私を助けることができる良いツール、または賢い awk コマンドはありますか?
javascript - JSON文字列を安全にオブジェクトに変換する
JSONデータの文字列が与えられた場合、その文字列をJavaScriptオブジェクトに安全に変換するにはどうすればよいですか?
明らかに、私はこれを次のようなもので安全に行うことができます:
しかし、それでは他のコードを含むJSON文字列に対して脆弱なままになり、単純に評価するのは非常に危険なようです。
bash - bashでファイル名をどのように解析しますか?
次のような形式のファイル名があります。
system-source-yyyymmdd.dat
「-」を区切り文字として使用して、ファイル名のさまざまなビットを解析できるようにしたいと思います。
c# - ログをフォーマットする良い方法は何ですか?
Telnet 接続から受信したすべての受信メッセージをログに記録する必要があるアプリケーションを設計しています。テキストはほとんどプレーンですが、テキストの色と書式設定 (16 色、太字、下線など) を提供する ANSI タグを含めることができます。
ログをフォーマットして、フォーマット、日付/時刻、および後で他のメタデータを含むテキストを保存したいと考えています。私が最初に考えたのはすべて XML でしたが、これは後で高速な検索ツールを作成する能力に影響を与える可能性があります。私の現在のアイデアは、行番号で参照される、別の XML ファイルに保存されたメタデータを含む 1 つのファイルの日付/時刻 + テキストです。
これは良い解決策ですか?また、書式設定コマンドをどこにどのように保存すればよいですか? 元の ANSI タグはプレーンを混乱させますが、それらを 2 つの異なるファイルに含めるのは扱いにくい場合があります。
追加:これまでのいくつかの回答に感謝しますが、ほとんどの場合、メッセージはシステムメッセージではなく、人から人へのコミュニケーションになることに言及する必要があります. 一種のより原始的な IRC。どのメッセージが重要であったかを後で (メタデータを追加して) 決定するのはユーザー次第です。これは、フィルタリングまたは編集されたログが派生する可能性のあるレコード ログの未加工です。
c# - C# からスタック トレース情報を出力する
製品のエラー処理の一部として、スタック トレース情報をダンプしたいと考えています。ただし、多くのユーザーは、プログラムから入手できる完全なレポートのコピーを送信する代わりに、エラー メッセージ ダイアログのスクリーンショットを撮るだけで済みます。そのため、このダイアログで最小限のスタック トレース情報を入手できるようにしたいと考えています。
私のマシンの .NET スタック トレースは次のようになります。
この質問があります:
形式は次のようになります。
ただし、atキーワードとinキーワードは、たとえば、インストールした英語の .NET ランタイムではなく、ノルウェー語の .NET ランタイムを実行する場合、ローカライズされると思います。
このスタック トレースを言語に依存しない方法で分離して、これを含むエントリのファイルと行番号のみを表示できるようにする方法はありますか?
つまり、上記のテキストから次の情報を取得したいと思います。
あなたが与えることができるアドバイスは役に立ちます。
unit-testing - BNF 文法テスト ケースの生成
単体テストにフィードできる BNF 文法からテスト文字列を生成するツールを使用した経験のある人はいますか?
python - Webページから国際文字を取得しますか?
単純なPython正規表現を使用して、サッカー(サッカー)のWebページからいくつかの情報を取得したいと思います。問題は、最初のチャップ、ÄÄRITALOなどのプレイヤーがÄÄ RITALO!として出てくることです。
つまり、htmlは、Äなどの特殊文字にエスケープされたマークアップを使用します。
HTMLを正しいPython文字列に読み込む簡単な方法はありますか?XML / XHTMLの場合、それは簡単ですが、パーサーがそれを行います。
c# - 相対時間を解析するには?
この質問は、「相対時間をどのように計算しますか? 」という質問の反対側です。
相対時間に対する人間の入力が与えられた場合、それをどのように解析できますか? デフォルトでは、 からオフセットしますがDateTime.Now()
、オプションで別の からオフセットすることもできますDateTime
。
(C#での回答を好む)
入力例:
- 「20分で」
- "5時間前"
- 「3時間2分」
- "次の週"
編集: 入力にいくつかの制限を定義できるとしましょう。この種のコードは、Web 上にあると便利です。
c# - C#でhtmlを解析する最良の方法は何ですか?
一般的な xml 解析ライブラリよりも多くの html 固有の機能を備えた html ファイルを解析するためのライブラリ/メソッドを探しています。
c# - 文字列を解析する最良の方法は何ですか?
多数の電子メール (プレーン テキスト) を解析する必要があるシナリオがあります。各電子メールの「種類」は、さまざまなプラットフォームに対して実行されるスクリプトの結果です。タブで区切られているものもあれば、スペースで区切られているものもあれば、まだわからないものもあります。
今後もさらに多くの「フォーマット」をサポートする必要があります。
以下を使用して解決策を探しますか。
- 正規表現
- 単純な文字列検索 (string.IndexOf などを使用)
- レックス/ヤック
- 他の
全体的なソリューションは C# 2.0 (できれば 3.5) で開発されます。