問題タブ [fileparsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
163 参照

c - C: 空白を失わないファイル解析

Cプログラムで特定のキーワードマッチングのためにファイルを解析しています。これが私のサンプルコードです...

Somefile.txt

出力:

問題 : x に "Hi Hello" のような値が含まれている場合、"Hi" のみを解析するだけです。スペースを失うことなく x の値全体を解析したいと考えています。

解決策を提案してください。

ありがとう。

0 投票する
4 に答える
2131 参照

python - Python でファイルを解析する最も効率的な方法

テキスト ファイルを解析する最も効率的な方法を知りたいです。たとえば、次のテキスト ファイルがあるとします。

接続サーバーの数: 1

サーバーのステータス: ACTIVE

サーバーへの接続数: 4

サーバーのステータス: ACTIVE

サーバーが応答していません: 13:25:03

サーバー接続が確立されました: 13:27:05

私がやりたいことは、ファイルを調べて情報を収集することです。たとえば、サーバーへの接続数やサーバーがダウンした回数などです。これらの値をリストに保存して、後で表示またはプロットできるようにします。

次のようにリストにキーワードがあると仮定すると、これを実行する最良の方法は何ですか。

リストには完全な文はなく、その一部しかないことに注意してください。ファイルを 1 行ずつ調べて、読み取った行が referenceLines リストのいずれかのエントリに対応しているかどうかを確認します。対応している場合は、リスト エントリのインデックスを取得し、対応する関数を呼び出します。

典型的なテキスト ファイルのサイズは約 50MB になるため、これを行うための最も効率的な (時間、メモリ) 方法は何でしょうか。

ありがとうございました。

どれでも

0 投票する
2 に答える
2466 参照

python - 既存のファイルを開こうとしたときのIOError

特別なテキストファイルからいくつかの情報を抽出するために作成したPythonプログラムに小さな問題があります。データセットを構築できるように、ループ(以下のコード)はextract_zcoords()500ファイル(1ファイルで1つのリスト)を超えて関数を実行する必要があります。


エラー:IOExceptionNo such file or directoryが発生するため、何らかの理由でpythonがファイルにアクセスしていません。ディレクトリパス名(場所)とファイルのアクセス許可を確認しましたが、正しい(読み取り+書き込み)です。ファイルが存在し、パス名が正しい場合にIOErrorが報告される理由はありますか?

何が間違っているのでしょうか?

0 投票する
1 に答える
292 参照

python - PythonでのDocxコンテンツとフォーマットの抽出

docx フォルダーを解析し、特定の単語が太字であるかどうかに基づいて特定の要素を取得しようとしています。これが文書内のテキストである場合:

フー:こんにちは

ブー: 何とか何とか

•何とか

•何とか

チュー:こんにちは

行ごとにスキャンし、太字の単語の後のすべてのテキストを次の太字の単語まで取りたいと思います。

現在、改行文字に基づいて解析する XML パーサーを使用しています。そのようなメタデータを提供するZipfileまたは個々の行には何も見つかりません。

これを行うことは可能ですか?

0 投票する
2 に答える
1524 参照

parsing - 区切り文字のないファイルから 0 ~ 255 の数字を取り込む方法

0 から 255 までのn桁を含む数字のみ(スペース、コンマ、改行などを含まない)のプレーンテキスト ファイルがあります。それを取り込んで、これらの値を配列に格納したいと考えています。


ファイルに次のシーケンスがあるとします。

私はこのようにそれを取り入れたい.in.readはファイル入力ストリームでtempArrayあるendArray.

この動作を達成する方法を知っている人はいますか? 多くのプログラミング言語に翻訳できるように、回答を疑似コードに保つようにしてください。

0 投票する
3 に答える
2170 参照

linux - Bash - ファイルを配列に解析する

私はこのファイルを持っています

次のように、各 Seq (Seq1、Seq2) の配列が必要です。

私はこれを書きましたが、whileループを壊しません..

このスクリプトは永久に繰り返され、while ループから抜け出しません。この愚かな人間に手を差し伸べてください:(

0 投票する
1 に答える
93 参照

python - Python を使用して特定のファイルを解析する

次のような行を含む 300 MB のファイルがあります

Python を使用してファイルを解析し、次のような辞書のリストを生成する方法についての提案をいただければ幸いです。

リストをファイルに保存します。

ありがとう

0 投票する
1 に答える
339 参照

perl - 既存の情報を保持するためにperlソースファイルヘッダーパーサーを拡張するにはどうすればよいですか?

すべてのソースファイルの先頭でライセンスヘッダーを使用する必要がある既存のプロジェクトがあります。問題は、ライセンスヘッダーが静的ではないことです。

ファイルのリストをスキャンしてファイルタイプ(C、Java、bashなど)を判別し、ライセンスのプリアンブルが存在するかどうかを確認するための基本的なチェックを行う既存のperlスクリプトがあります。

そうでない場合は、手動で更新する必要がある空白のライセンスヘッダーを挿入できます。

しかし、私はどのように私ができるか知りたいです:

  1. 非静的情報を使用して既存のライセンスを検出し、
  2. 既存のperlprocessFile($ fileName、$ type)関数(下記)を拡張して、既存の「プロジェクト」、「説明」、および「作成者」情報を保持しますか?

動的テキストを示すためにライセンステンプレートにマーカーを配置する必要があるのではないかと思います。動的テキストは、再生成されたヘッダーに保存する必要があります。

perl正規表現またはパターンマッチャーを使用して現在の変数情報を取得し、ヘッダーに再挿入して年を更新する方法についての指針を教えてください。

すべての魔法は「for($ i = 0; $ i <5; ++ $ i)」ループで発生する必要があることがわかります。

0 投票する
2 に答える
80 参照

php - PHPでファイルを解析する方法

このファイルを持っていますが、このファイルを解析する方法がわかりません。

これを次のような配列にしたい

preg_match を試してみましたが、うまくいきませんでした。何か案は?

0 投票する
2 に答える
438 参照

python - Python でテキスト ファイルから辞書を作成する方法

次のようなエントリを含むテキスト ファイルがあります。

これは小さなサンプルです。ファイルには複数の学生が含まれています。各生徒の名前の下に 2 つの課題があり、各課題の「終了」で始まる行に「終了: はい」と表示されている場合にのみ合格となります。各課題の下のすべてのデータはまとまりがありませんが、各課題の下のどこかに「終了: はい (またはいいえ)」という行があります。ファイルを読み取って、学生が合格したかどうかを判断する方法が必要です。これまでのところ、私は

このコードを取得して単一のエントリを返すことしかできません(最初の「終了」をキーとして読み取り、「YESまたはNO」を値として読み取りますが、これは私が望むものですが、開始するファイル内のすべての行を返すようにしたいですだから私が提供したサンプルデータは、2つのエントリを持つdictを返したいです {Finished:"NO" , Finished:"NO"}