問題タブ [webarchive]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
338 参照

ipad - フィルダーに保存されているローカル Web サイト (PC 上のディレクトリ) を .webarchive ファイルに変換するにはどうすればよいですか?

ローカルのハードドライブに完全なウェブサイトのhtml、css、画像、javascript、およびビデオがあり、すべてフォルダーに含まれています。

ウェブサイトは私の PC でうまく動作しますが、iPad に転送する必要があります。これは簡単だと思っていました。サイトをコピーして PC のように実行することはできないからです。

私の次のステップは、サイトの.webarchiveを試してみることでしたが、jqueryとビデオファイルがたくさんあるので、ビデオファイルなどが含まれないため、サファリだけを使用することはできません.

誰かがフォルダーを webarchive に変換するツールまたは方法を知っていることを望んでいました。

0 投票する
3 に答える
15737 参照

html - webarchive を html に変換する

複雑な Web サイトの動作を Web アーカイブにまとめることができました。その後、その webarchive を入れ子になったディレクトリの html セットに変えたいと思います。それでも、Waf と Apple ストアで購入した商用ソフトウェアの両方でそれを行った場合、得られるのは、下部に html ページがあり、画像も css も作業リンクもないネストされたディレクトリだけです。興味のある方は、webarchive ドキュメントは次の場所にあります。

http://www.miafoto.it/it/GiroMilano.webarchive

一方、抽出の弱い製品は次のとおりです。

http://www.miafoto.it/it/Giromilano/Pagine/default.aspx

上記の空のディレクトリ。異なる外観に加えて、webarchive は公式 Web サイトと同じ動作を表示します (リストボックス vales が選択されてからボタンが押された場合)。一方、抽出されたバージョンは、公式ページではなく、それ自体をロードすることによってコンテンツのないページを生成します。ご覧のとおり、webarchive は 1 MB を超えていますが、抽出は 1 KB を少し超えています。

何が問題なのか、どうすればこのような一見些細なビジネスを実行して、使用可能な結果を​​得ることができるでしょうか?

ありがとう、

0 投票する
1 に答える
187 参照

open-source - WebサイトにアクセスせずにアーカイブされたWebコンテンツ

実際のウェブサイトに行かずにウェブデータを取得したい。

http://archive.org/web/web.phpは、Webサイトのスナップショットを保持する例です。これに伴う問題は、データがかなり古い(5〜6か月)ことです。

最近のhtmlコンテンツを見つけることができる他のアーカイブストレージはありますか?

ありがとう

0 投票する
2 に答える
1267 参照

caching - インターネットからキャッシュされた Web データ (Google Cache、Wayback Machine など) を使用する

Google Cache を使用して、他の Web サイトの Web ページにアクセスしなくてもアクセスできるようにしたいと考えています。

このようなクエリ を実行http://webcache.googleusercontent.com/search?q=cache:<URL without SCHEME>すると、データを取得できます。

私は次のことを見つけました/仮定します(質問0.それらのいずれかが間違っている場合は修正してください):

  1. Google は、サイトのポリシーに応じて、キャッシュされた情報を持っている場合と持っていない場合があります。
  2. JavaScriptを実行する必要がある場合、GoogleはとにかくWebサイトにアクセスします。
  3. Google は、テキストの最初の 101 KB だけを保存します。

質問 1. Google のキャッシュには最近クロールされたページしか表示されないことはわかっていますが、このデータがどれくらい古いかについて何か考えはありますか?

質問 2. その Web サイトにアクセスしたすべてのヒットを Google キャッシュに移動する予定がある場合、問題はありますか (Web サイトがキャッシュされており、古いページがほとんどなくても問題ないと仮定します)?

質問 3. Wayback Machine はデータを提供しますが、データのクロールと表示の間に大きな遅延があります。最近アーカイブされたデータ (Wayback マシンや Google キャッシュなど) を取得できるディレクトリはありますか?

0 投票する
1 に答える
906 参照

safari - Safariを使用せずにWindowsで.webarchiveを作成しますか?

Windowsを使用してSafariを使用せずにWebサイトをSafariの.webarchiveに変換する方法はありますか?

奇妙なリクエストだとは思いますが、.webarchiveファイルを作成してUIWebViewにロードする必要があり、(さまざまな理由で)SafariまたはMacを使用することはできません。

Webkitにはいくつかの利用可能な方法があるのではないかと思っていましたが、あまり運がありませんでした。

0 投票する
1 に答える
3383 参照

android - AndroidでWebviewアーカイブファイルをInputStreamに取得するにはどうすればよいですか?

以前、WebView へのアーカイブ ファイルの読み込みについて同様の質問をしました。

チュートリアルによると、WebArchiveReader.java でメソッド loadToWebView を使用できるように、アーカイブ ファイルを InputStream にロードする必要があります。

ただし、チュートリアルでは、ライターは次のステートメントを使用してアーカイブ ファイルを取得します。

残念ながら、「Assets」フォルダー以外の場所からアーカイブ ファイルを取得したいと考えています。

上記のコードで保存したファイル「yahoo.html」をロードしたいとします。

InputStream のインスタンスを取得するにはどうすればよいですか?

0 投票する
1 に答える
166 参照

wordpress - wordpress.comでのブログの作成時間を決定できますか?

今日wordpress.comにブログを書いて、過去の別の日付を付けることは可能ですか?

もう1つの質問は、http://wordpress.com/のブログが作成されたときにどのように見つけるかです。ブログとは、user.wordpress.comのようなURLを持つユーザーのブログを意味します。

0 投票する
1 に答える
145 参照

java - HTML 上のリンクされたファイルを動的に操作する

バックアップ Web サイトがあります。ウェイバックマシンのようなもの。HTML のコンテンツを返すと、明らかに、リンクされたドキュメント (画像、javascript ファイル、css ファイルなど) が元の Web サーバー (私のサーバーではなく) から読み込まれます。これらのリンクをサーバーからロードされるように置き換えたいと思います。私が取るべき2つのアプローチがあります:

  1. Java または PHP を使用してサーバー側で実行します。これを行うには、Java と PHP の両方を使用できます。たとえば Java では、jSoup を使用して HTML を解析し、リンクを置き換えることができます。
  2. jQueryを使用してクライアント側で実行します。

2番目の方法を使用すると、HTMLを解析するためにサーバーに負荷をかける必要がなくなりますが、ページが読み込まれるとすぐに元のサーバーからファイルのダウンロードが開始され、ユーザーの帯域幅が浪費される.

一方、画像が正常にダウンロードされたかどうかを何らかの方法で判断できれば、サーバーからのダウンロードをスキップして、元のサーバーからダウンロードしたファイルをユーザーに使用させることができます。

これに対するあなたの提案は何ですか?

アップデート

相対リンクと絶対リンクについて、いくつか明確にする必要があります。私のサービスのリンクは絶対パスとして保存されます。ただし、HTML ドキュメントには両方のタイプのリンクが含まれる場合があります。私がする必要があるのは:

  • http://stackoverflow.com/images/image.pngに変換http://mysite.com/view/content?url=http://stackoverflow.com/images/image.png
  • /images/image.png(上でhttp://stackoverflow.com)に変換するhttp://mysite.com/view/content?url=http://stackoverflow.com/images/image.png

つまり、HTML 上の相対リンクを絶対リンクに変換してから、私の Web サイトにURL引数として送信する必要があります。

0 投票する
1 に答える
267 参照

cocoa - Mail.app と Notes.app から WebArchive を表示する

Cocoa の WebView は .webarchive ファイルを表示できます。Safari や Mail.app で Web ページの一部をコピーする場合など、ペーストボードから表示しようとしているものです。

私が抱えている問題は、Mail と Notes からの Web アーカイブは WebView に表示されませんが、Safari からの Web アーカイブは表示されるということです。

これらのアーカイブのデータを調べたところ (BBEdit は、バイナリ plist 形式を解読し、XML として適切に表示できます)、メール (およびメモ) がそこに配置した異常な URL 参照が原因であることがわかりました。

そのエントリを削除するか、http:// を使用するものに変更すると、WebView は突然そのようなアーカイブを表示できます。

さて、コードでこれを一般的に解決するにはどうすればよいですか?

読み込みのためにアーカイブを WebFrame に渡す前に、webarchive をデコードし、WebResourceURL エントリを見つけて削除する必要はありません。

これを機能させるには、WebView またはそのメイン フレームのいずれかで設定する必要があるものが他にあるのではないかと思います。

Xcode がこれらの Web アーカイブを問題なく表示できることに気付きました。これは、Xcode が問題を解決するより「適切な」方法で WebKit を使用していることを示唆しています。しかし、おそらくそれは、私のコードがCFDataオブジェクトからアーカイブをロードしている間に、NSWebFrameがディスクからアーカイブをロードしているためです.ファイルからロードするとき、WebKitはそのファイルURLをベースURLとして使用している可能性があります.使用可能な URL がまったく取得されない場合。


ここで Xcode の小さなデモ プロジェクトを作成しました: http://files.tempel.org/Various/Mail-WebArchive-Display-Issue.zip

メールからの元のアーカイブ (「mail-bad.webarchive」) と固定アーカイブ (「mail-good.webarchive」) の両方が含まれており、どちらもデモ アプリの 2 つの webView に表示されます。


また、Apple DTS で Tech Support Indident (TSI) を開いたところ、バグを報告する必要があるとの回答がありました。バグ レポートは、http: //openradar.appspot.com/radar?id=2843403で確認できます。

0 投票する
1 に答える
247 参照

iphone - ローカルの webarchive ファイルを読み取る - ときどき - null WebResourceData を返す

アロハ、

iOS 6.1.3 で webarchive ファイルを読み取る際に、WebResourceData が null を返す ことがあるという問題に遭遇しました。

これらは、バンドル内に保存されている (TextEdit で作成された) 既知の適切なファイルであり、通常は正常に読み取られます。ただ、そうでない場合が多いのです。

以下に示す簡単なテストでは、エラーが見つかるまで 3 つの異なるファイルを何度も読み取ります。iOS 6.1.3 の場合、テストを実行するたびに、1 回から 200 回の反復でエラーが発生しました。これをさまざまなデバイスとシミュレーターで実行しましたが、同じ結果が得られました。

エラーは次の 2 行に表示されます。

しかし、それは一貫していません。反復回数と再テスト ボタンを表示する以外に、これが唯一のアクティビティである新しい xcode プロジェクトを作成して、コードを分離しました。ファイルは常に読み込まれ、常に WebResourceData キーを持つ WebMainResource があります。

考えられる手がかりは、代わりにコードを ViewDidLoad に挿入すると、さらに多くの反復で実行されますが、それでも null が検出されることです。ボタン アクションから [self testMe] を呼び出すと、はるかに速くエラーが発生します...理由はわかりません。

私は少し途方に暮れており、それが iOS のバグではなく、単に欠けている基本的なものであることを願っています。どんな助けでも大歓迎です。