問題タブ [webarchive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1075 参照

python - warc ファイルからレコードのサブセットを読み取る方法

PythonでCommon Crawlから .warc ファイルを解析しようとしています。

ファイルが巨大なので、最初の数レコードのサンプル/サブセットから始めたいと思います。

配置されている改行/改行を保持しながら、ファイルを切り捨てて最初の X 行のみを含めるにはどうすればよいですか?

これが私がすでに試したことです:

  1. head -n 250 oldfile > newfileこれにより、ファイルの解析に必要な戻り値の一部が削除されます。Hadoop ジョブでこのファイルを使用しようとすると (warcパッケージで読み取る) 、次のエラーが表示されます。

    /li>
  2. #1と同じですが、tailコマンドがあります

  3. #1 と同じですが、失われた改行または(キャリッジ リターン) 文字を置換するためにtrまたはの後に使用します。これにより、パッケージは、予想されるキャリッジ リターンまたは改行が配置されていないと不平を言い続けます。sed^Mwarc
  4. unix2dos oldfile
0 投票する
0 に答える
88 参照

javascript - Safari webarchive で複製された D3 svg 要素

特定の理由により、私が取り組んでいるプロジェクトでは、Safari の webarchive 機能を使用する必要があります。このペンの簡易版をプログレス バーに使用しています。より単純なコードは、ここと以下で見ることができます。

このページが Web アーカイブとして保存されている場合、プログレス バーはそれ自体の下に複製されます。アニメートされている場合、その下の「ゴースト」は非アクティブです。重複がないように、これに回避策があるかどうか疑問に思っていました。非表示や表示: なしなど、可視性の設定を変更しようとしても失敗しました。

編集:代わりにブートストラップの進行状況バーを使用して、今のところ問題を回避しました。

0 投票する
1 に答える
1157 参照

html - HTML で webarch ファイルを開く

HTML Web ページ経由で Web アーカイブ ファイルを開こうとしていますが、ファイルが開かずにダウンロードされます。

これを Web ページとして開くにはどうすればよいですか?

私のコードは;

前もって感謝します。

0 投票する
1 に答える
1286 参照

download - ウェイバック マシンから Web サイト全体を復元する方法はありますか?

Web サイトのファイルが破損し、何らかの理由ですべてのバックアップ ファイルが失われました。サイト全体をダウンロードするプロセスを提案してください。

シンプルなhtmlサイトです。ダウンロードした後、どうすればホストできますか? 助けてください

0 投票する
0 に答える
76 参照

cocoa - サンドボックス化されたアプリのフォルダー内に配置された Webarchive (Safari) ファイルが破損します。どのような権限が必要ですか?

これは興味深いケースです。Webarchive ファイルを Safari からデスクトップに保存します。正常に動作し、Safari で開くことができます。問題はありません。

この webarchive をマイ アプリにドラッグ アンド ドロップすると、ファイルはFSMoveObjectAsync関数を使用してアプリのコンテナー フォルダーに移動されます。その後、「・・・破損して開けない」とのことでwebarchiveが開かなくなりました。ファイルを元に戻すことは役に立ちません。macOS のセキュリティ システムによって隔離されたようです。

ここで注意が必要なのは、非サンドボックス モードで実行しても問題がないことです。サンドボックスでは、Web アーカイブが破損します。

これに苦しむ他のファイルタイプはありません。ウェブアーカイブのみ。

私のアプリには、Web アーカイブを処理するためのサンドボックス エンタイトルメントが欠けているようです。でもどっちか分からない。

「隔離された」Web アーカイブを開こうとすると、コンソールに次のメッセージが表示されます。


助けが必要。