問題タブ [webarchive]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - warc ファイルからレコードのサブセットを読み取る方法
PythonでCommon Crawlから .warc ファイルを解析しようとしています。
ファイルが巨大なので、最初の数レコードのサンプル/サブセットから始めたいと思います。
配置されている改行/改行を保持しながら、ファイルを切り捨てて最初の X 行のみを含めるにはどうすればよいですか?
これが私がすでに試したことです:
/li>head -n 250 oldfile > newfileこれにより、ファイルの解析に必要な戻り値の一部が削除されます。Hadoop ジョブでこのファイルを使用しようとすると (warcパッケージで読み取る) 、次のエラーが表示されます。#1と同じですが、
tailコマンドがあります- #1 と同じですが、失われた改行または(キャリッジ リターン) 文字を置換するために
trまたはの後に使用します。これにより、パッケージは、予想されるキャリッジ リターンまたは改行が配置されていないと不平を言い続けます。sed^Mwarc unix2dos oldfile
javascript - Safari webarchive で複製された D3 svg 要素
特定の理由により、私が取り組んでいるプロジェクトでは、Safari の webarchive 機能を使用する必要があります。このペンの簡易版をプログレス バーに使用しています。より単純なコードは、ここと以下で見ることができます。
このページが Web アーカイブとして保存されている場合、プログレス バーはそれ自体の下に複製されます。アニメートされている場合、その下の「ゴースト」は非アクティブです。重複がないように、これに回避策があるかどうか疑問に思っていました。非表示や表示: なしなど、可視性の設定を変更しようとしても失敗しました。
編集:代わりにブートストラップの進行状況バーを使用して、今のところ問題を回避しました。
html - HTML で webarch ファイルを開く
HTML Web ページ経由で Web アーカイブ ファイルを開こうとしていますが、ファイルが開かずにダウンロードされます。
これを Web ページとして開くにはどうすればよいですか?
私のコードは;
前もって感謝します。
download - ウェイバック マシンから Web サイト全体を復元する方法はありますか?
Web サイトのファイルが破損し、何らかの理由ですべてのバックアップ ファイルが失われました。サイト全体をダウンロードするプロセスを提案してください。
シンプルなhtmlサイトです。ダウンロードした後、どうすればホストできますか? 助けてください
cocoa - サンドボックス化されたアプリのフォルダー内に配置された Webarchive (Safari) ファイルが破損します。どのような権限が必要ですか?
これは興味深いケースです。Webarchive ファイルを Safari からデスクトップに保存します。正常に動作し、Safari で開くことができます。問題はありません。
この webarchive をマイ アプリにドラッグ アンド ドロップすると、ファイルはFSMoveObjectAsync関数を使用してアプリのコンテナー フォルダーに移動されます。その後、「・・・破損して開けない」とのことでwebarchiveが開かなくなりました。ファイルを元に戻すことは役に立ちません。macOS のセキュリティ システムによって隔離されたようです。
ここで注意が必要なのは、非サンドボックス モードで実行しても問題がないことです。サンドボックスでは、Web アーカイブが破損します。
これに苦しむ他のファイルタイプはありません。ウェブアーカイブのみ。
私のアプリには、Web アーカイブを処理するためのサンドボックス エンタイトルメントが欠けているようです。でもどっちか分からない。
「隔離された」Web アーカイブを開こうとすると、コンソールに次のメッセージが表示されます。
助けが必要。