問題タブ [import.io]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
609 参照

import.io - Import.io シンプル スクリプト javascript

シンプルな import.io を JavaScript (サンプル Web サイト) と統合しようとしていますが、スクリプトが機能しません。手伝って頂けますか?

0 投票する
1 に答える
322 参照

java - import.io は Web ページをロードしません

「 import.io 」をインポートすると、Web ページが読み込まれません。Windows 8.1 / Win 64 を使用しており、Java バージョン 8 Update 45 を使用しています。プログラムが終了すると、次の「 error-protocol 」が表示されます。

この問題を解決する方法についてのヒントを教えてもらえますか?

0 投票する
2 に答える
96 参照

html - import.io Connect Extract に CSS を含める方法

import.io コネクタを使用して、ソース Web サイトから html のセグメントを抽出することができました。この結果は「html」型で返されます。結果は、スタイルが body html で定義されているが抽出されていないデータの単一のテーブルです。これにより、抽出された html セグメントがスタイルなしで表示され、見栄えが悪くなります。

CSS スタイルの抽出を含める方法はありますか。つまり、ソース html に含まれる複数の css href を

また、同時に次のような動的 css を含めます。

...結果のhtmlセグメントを適切にスタイルして表示できるように、コネクタ抽出で?

前もって感謝します!

0 投票する
1 に答える
181 参照

mysql - Google 画像から画像を抽出する

動画でデータベースを作っていますが、Google 画像から画像を保存し、特定の動画で並べ替える方法がわかりません。
データベースには 17000 の映画があり、import.io を使用して IMDB からそれらをクロールしますが、画像が小さすぎます。
アドバイスをお願いします。

0 投票する
0 に答える
76 参照

import.io - 余分な画面で import.io を使用する認証済みコネクターが機能しない

import.io を使用して Web サイトへの認証済みログインを作成しようとしていますが、ユーザー名とパスワードの画面に移動する前に、別の画面で ID 番号を入力する必要があります。すべてのアクションを記録しましたが、記録を停止すると、「ユーザー名とパスワードだけを入力しませんでした」というメッセージが表示され、それ以上進めなくなります。ID 番号を入力し、ユーザー名とパスワードの画面に移動してから記録を開始すると、import.io がページをリロードしてしまい、ID 番号の画面に戻ります。

ID、ユーザー名、およびパスワードをログオン資格情報として受け入れるように import.io を取得するにはどうすればよいですか? または、レコードをヒットしたときに import.io がページをリロードしないようにするにはどうすればよいですか?

0 投票する
1 に答える
170 参照

import.io - API が POST での入力を無視する

アプリで作成したエクストラクタに API POST 経由でこのボディを送信しています。

どの URL を入力しても、常に同じページからの結果が返されます (トレーニングしたページである必要があると思います)。そこに任意の文字列を入れることができますが、それは完全に無視されます。

GET は問題なく動作しますが、私はむしろ POST を使用したいと考えています。

これが機能しない理由を知っている人はいますか?

0 投票する
1 に答える
260 参照

import.io - サイトのクロール時の ServerErrorException

API を使用してサイトのフル クロールを行っていますが、多くの情報が得られます。

{ "errorType": "ServerErrorException", "error": "ServerErrorException: サーバー エラーです。(HTTP 500)" }

また、タイムアウト応答が返され、実際の http が失敗します。StatusCode: 504, ReasonPhrase: 'GATEWAY_TIMEOUT'

同時にクロールしているサイトをブラウジングしていますが、それでも高速で応答性が高く、速度が低下することはありません。

コードからマルチスレッドを削除し、同期的に実行すると 500 エラーが停止しますが、それでも多くのタイムアウトが発生します (そして時間がかかります)。

マルチスレッドで実行している同時接続数は 100 未満です。それは多すぎますか?1000以上まで上げたいです。リクエスト間に遅延を追加する必要がありますか?