問題タブ [fileparsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
66 参照

r - Rで特定の形式のファイルを読み取る方法は?

各行が日付、テキスト、数値を含むデータセットを表すファイルを読みたいと思います。例:

一般的な区切り文字 (CSV のような) はありませんが、タブ、文字、およびテキストを使用できるため、形式はかなり適切に記述できます。

フォーマットとファイルの説明を受け取り、data.frame に指定されたデータを入力する関数はありますか?

0 投票する
1 に答える
4689 参照

bison - flex と bison を使用してファイルを解析する

flex と Bison を使用して次のファイルを解析する必要があります。

新しいファイル

上記のファイルを読みたいので、このコードを書きます

lex.l

yacc.y

まず、ファイルの 2 行目を印刷しようとしましたが、何も印刷できません。どうすればいいですか?

コンパイルは次の方法で行われます。

0 投票する
0 に答える
117 参照

java - Apache Apache Commons CVS で cvs ファイル ヘッダーを検証する方法

Apache Commons CVS を使用して CVS ファイルを解析したいと考えています。また、ユーザーが 1 ではなく 5 と言う間違ったヘッダー行を渡したシナリオがあるかもしれません。cvsParser に渡されたヘッダー行を検証する方法はありますか?

0 投票する
0 に答える
39 参照

python - ファイル内の変数を集約するための python プログラム

さまざまな番組やさまざまなチャンネルの視聴者数を持つファイルをpythonで読み込もうとしています。チャンネル「ABC」の番組を選択し、そのチャンネルの各番組の合計視聴者数を調べたいと思います。テキスト ファイルは、次のリンクに示されているとおりです。

テキストファイル

番組がチャンネル 'ABC' で放送されているかどうかについての要件なしで、各番組の視聴者数を合計するところまで来ました。コードは次のとおりです。

今、私は立ち往生しており、さらに先に進む方法がわかりません。

0 投票する
2 に答える
5143 参照

javascript - D3.js を使用してアップロードされた CSV ファイルを解析する

私は d3.js を初めて使用するので、これがばかげた質問に思える人もいるかもしれませんので、ご容赦ください。ユーザーがアップロードした csv ファイルを解析して、その出力をコンソールに出力しようとしています。CSVファイルの絶対パスを指定するとCSVファイルを解析できますが、ファイルアップロード機能で同じことをしようとすると、コンソールに出力が得られません..

作業中の Javascript コード..

コンソール出力...

新しい HTML コード..

修正された Javascript コード (動作しない) ..

ユーザーがアップロードした CSV ファイルの処理方法に関する公式ドキュメントがなかったので、どこが間違っているのかわかりません..HTML5 ファイル リーダーを使用する方法はありますか?? 助けてください..

0 投票する
2 に答える
547 参照

python - Python - ファイルの解析に必要なヘルプ。EOF 文字を無視する方法はありますか?

文字列を抽出しようとしているバイナリ ファイルがあり、それを行うのにかなりの時間を費やしています。:(

私の現在の戦略は、Python を使用してファイルを読み込むことです (次の関数のいずれかを使用します: read()、readline()、または readlines())。次に、行を (1 文字ずつ) 解析し、特殊文字 'ô' を探します。ほとんどの場合、これは目的の文字列の直後に続きます! 最後に、「有効」であると識別したすべての文字を記録する特別な文字から逆方向に解析します。

結局のところ、先頭のタイム スタンプと、行内の次の 3 つの文字列が必要です。

結果:

入力例の行 #1 では、「読み取り」関数は行全体を読み取りません (出力イメージに示されています)。これは、関数がバイナリを EOF char として解釈し、読み取りを停止したためだと思います。

例の 2 行目で、「特殊文字」が表示される場合がありますが、抽出したい文字列の後ではありません。:(

このデータを解析するより良い方法はありますか? そうでない場合、#1 の例に見られる問題を解決する方法はありますか?

行を読み取ったまま印刷した場合の入力データと結果の出力データの例。ご覧のとおり、使用時に行全体を読み取るわけではありませんreadlines() 行を読み取ったまま印刷した場合の入力データと結果の出力データの例。 ご覧のとおり、readlines() を使用すると、行全体が読み取られません。

あまり堅牢ではない私の文字列抽出アルゴリズム。 あまり堅牢ではない私の文字列抽出アルゴリズム。

参考までに、効率は必ずしもインポートではありません。

0 投票する
1 に答える
400 参照

bash - シェルスクリプトを使用して CSV ファイルを解析する

CSV ファイルを解析し、指定された形式で出力するスクリプトを作成しようとしています。

入力ファイルは以下の形式です。

出力は次の形式であることが期待されます (入力の最初の行の出力行の一​​部のみを示します)。

最初の行の後に各行の列 1 と 4 を出力し、その後に列名 (ファイルの行 1 から)、:列 6..NF の列値 (列 2、3、5 をすべて無視) を出力する必要があります。1 つの入力行から、多数の出力行が生成されます。

私が書いたスクリプト:

スクリプトは実行されていますが、同じ行にすべてのパラメーターが名前なしで表示されています。どうすれば修正できますか?