問題タブ [data-extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
298 参照

javascript - JavaScript から i18n トークンを抽出する

i18n をサポートする Javascript アプリに取り組んでいます。翻訳トークンは、次の形式を使用してソース コード全体に分散されます__('some.token')__('other.token.with.vars', {name: 'Julia', otherName: 'Nadine'})

ファイルからすべてのトークンを抽出する方法についてのアイデアはありますか? そのようなことのためのツールはありますか?または、独自のパーサーを作成する必要がありますか?

0 投票する
1 に答える
259 参照

regex - 引用符なしの CF 正規表現 REFind() 部分文字列

CF バックエンドは、さまざまなパラメーターの名前と値を抽出するために、TEXT ファイルであるかのように CFM ファイルを読み取る必要があります。データは次のようになります。

ご覧のとおり、SINGLE または DOUBLE で引用できる STRINGS を使用できます。

また、通常は引用符なしの BOOLANS と NUMBERS もありますが、(single または double) を使用することもできます。

ファイルを「解析」して値を抽出しています。次のような一致を返すパターンを見つけたいです。

request.config. MY_PARAM_2 = "ブラブラブラ";

私は成功に非常に近づいていますが、残念ながら、次の式は最後の引用符を取り除くことができません.

たとえば、 を返しますBlaBlaBla"。最初の引用符は正常に省略されていますが、最後の引用符は省略されていません。何が間違っていますか?

0 投票する
1 に答える
441 参照

excel - Excel の単一セルから住所を引き離す

サーバーからのダウンロード プロセス中にすべて 1 つのセルにコンパイルされた 2002 年のアドレスがあります。ほとんどの場合、フィールドを区切るためにハッシュ (#) 記号が使用されます (Line 1、Line 2、City、Postcode など)。

LEFTMIDおよび他の機能の組み合わせを試すのに多くの時間を費やしましたが、役に立ちませんでした。問題は、非常に多くの住所があり、すべての住所が各フィールドに同じ数の文字を持っているわけではないことです (郵便番号など - 6 文字 (空白を含む) を含むものもあれば、5 文字以上を含むものもあります)。より少ない)、一度入力してから Excel の自動入力ハンドル/機能を使用してすべてのレコードのプロセスを完了することができる万能のソリューションはないようです。

これが私のデータのサンプルです(匿名化されています):

ハッシュ記号の間のすべてを抽出できるようにしたい (ハッシュ記号自体を除く/省略する) ため、このデータを格納するために 4 つの列を専用にしています: Address Line 1AL2AL3Postcode.

単一のセルに存在する最初の例 ( 44A THE ADDRESS#EALING#LONDON#W1 1WW#) を使用すると、次のような結果を達成したいと考えています。

一部の住所セクションが間違った列の下に表示されても問題ありません。これは非常に簡単に修正でき、別の列を追加することもできます。単一のセルからデータを抽出できるようにしたいだけです。

0 投票する
6 に答える
406 参照

php - preg_match_all を使用した二重引用符内のデータの照合

以下に示すデータは、「名前」:「値」、「名前 2」:「値 2」、「名前 3」:「値 3」のような形式です。

PHPを使用して名前を抽出しようとしていました

しかし、それは機能していません。それを修正することを知っている誰かが私を助けてくれることを願っています。ありがとうございました。

0 投票する
4 に答える
284 参照

php - Phpを使用して複数レベルの反復xmlタグ間のテキストを抽出する

マルチレベル XML タグ間のテキストを抽出しようとしています。 これは、 で囲まれたタグ 間の 10 個の ID を抽出したい
データ ファイルです。正規表現は、10 個のうち最初の値だけを取得します。 xml データは $temp_Str 変数に格納されており、$pids に格納されている値を取得しようとしています。これに関する他の提案はありますか?
<eSearchResult> <Count>7117</Count> <RetMax>10</RetMax> <RetStart>0</RetStart> <QueryKey>1</QueryKey> <WebEnv> NCID_1_457044331_130.14.22.215_9001_1401819380_1399850995 </WebEnv> <IdList> <Id>24887359</Id> <Id>24884828</Id> <Id>24884718</Id> <Id>24884479</Id> <Id>24882343</Id> <Id>24879340</Id> <Id>24871662</Id> <Id>24870721</Id> <Id>24864115</Id> <Id>24863809</Id> </IdList> <TranslationSet/> <TranslationStack> <TermSet> <Term>BRCA1[tiab]</Term> . . . </TranslationStack> </eSearchResult>
<ID></ID><IdList></IdList>preg_match_all('~<Id>(.+?)<\/Id>~', $temp_str, $pids)

0 投票する
2 に答える
695 参照

matlab - リアルタイムでデータを Matlab にインポートし、非静的ファイル名でプロットする

オシロスコープを使用して信号を測定する課題に取り組んでいます。オシロスコープの出力データのパラメータを自動的に設定して、特定の数のファイルを書き込むプログラムを作成しました(Nと呼びましょう)。これらのファイルはすべてドキュメントに含まれています。

これらのファイルを Matlab にインポートし、必要なデータを抽出して、1 秒間隔 (ファイル間) でリアルタイムにプロットしたいと考えています。

実行例

ドキュメント/開発に12個のファイル(N = 12)を書き込み、キーが入力されたときにエスケープするwhileループを作成しますtextreadを使用して各ファイルを読み取ります(更新されたバージョンのmatlabがないため、textscanを使用できません)。
次のファイルの終わりに移動するデータをプロットします

問題は、ファイル名が一貫していないことです。それらはすべて、処理にかかった時間に従って名前が付けられているため、毎回異なる量で異なります (stream-july-10-10:12 、 stream-july-10-10:13 、stream-july-10-10:15 など。

したがって、実際にファイルの名前を調べなくても、次のファイルに移動してプロットする方法が必要です。

私はその多くを知っていますが、正しい方向への助けやポイントは大歓迎です。

ありがとう、ジミッチ

0 投票する
1 に答える
654 参照

reverse-engineering - Filemaker アプリケーションからのデータの抽出

FileMaker 10 (FML10.dll) で記述されたアプリケーションのエンド ユーザー バージョンがあり、ソフトウェアの背後にあるデータが必要です。データを抽出する方法を知っている人はいますか? USR ファイルにデータが含まれているようですが、開く方法がわかりません。c# を介してクエリを実行する方法はありますか?