問題タブ [import.io]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
import.io - Import.io シンプル スクリプト javascript
シンプルな import.io を JavaScript (サンプル Web サイト) と統合しようとしていますが、スクリプトが機能しません。手伝って頂けますか?
java - import.io は Web ページをロードしません
「 import.io 」をインポートすると、Web ページが読み込まれません。Windows 8.1 / Win 64 を使用しており、Java バージョン 8 Update 45 を使用しています。プログラムが終了すると、次の「 error-protocol 」が表示されます。
この問題を解決する方法についてのヒントを教えてもらえますか?
html - import.io Connect Extract に CSS を含める方法
import.io コネクタを使用して、ソース Web サイトから html のセグメントを抽出することができました。この結果は「html」型で返されます。結果は、スタイルが body html で定義されているが抽出されていないデータの単一のテーブルです。これにより、抽出された html セグメントがスタイルなしで表示され、見栄えが悪くなります。
CSS スタイルの抽出を含める方法はありますか。つまり、ソース html に含まれる複数の css href を
また、同時に次のような動的 css を含めます。
...結果のhtmlセグメントを適切にスタイルして表示できるように、コネクタ抽出で?
前もって感謝します!
mysql - Google 画像から画像を抽出する
動画でデータベースを作っていますが、Google 画像から画像を保存し、特定の動画で並べ替える方法がわかりません。
データベースには 17000 の映画があり、import.io を使用して IMDB からそれらをクロールしますが、画像が小さすぎます。
アドバイスをお願いします。
import.io - 余分な画面で import.io を使用する認証済みコネクターが機能しない
import.io を使用して Web サイトへの認証済みログインを作成しようとしていますが、ユーザー名とパスワードの画面に移動する前に、別の画面で ID 番号を入力する必要があります。すべてのアクションを記録しましたが、記録を停止すると、「ユーザー名とパスワードだけを入力しませんでした」というメッセージが表示され、それ以上進めなくなります。ID 番号を入力し、ユーザー名とパスワードの画面に移動してから記録を開始すると、import.io がページをリロードしてしまい、ID 番号の画面に戻ります。
ID、ユーザー名、およびパスワードをログオン資格情報として受け入れるように import.io を取得するにはどうすればよいですか? または、レコードをヒットしたときに import.io がページをリロードしないようにするにはどうすればよいですか?
import.io - API が POST での入力を無視する
アプリで作成したエクストラクタに API POST 経由でこのボディを送信しています。
どの URL を入力しても、常に同じページからの結果が返されます (トレーニングしたページである必要があると思います)。そこに任意の文字列を入れることができますが、それは完全に無視されます。
GET は問題なく動作しますが、私はむしろ POST を使用したいと考えています。
これが機能しない理由を知っている人はいますか?
import.io - サイトのクロール時の ServerErrorException
API を使用してサイトのフル クロールを行っていますが、多くの情報が得られます。
{ "errorType": "ServerErrorException", "error": "ServerErrorException: サーバー エラーです。(HTTP 500)" }
また、タイムアウト応答が返され、実際の http が失敗します。StatusCode: 504, ReasonPhrase: 'GATEWAY_TIMEOUT'
同時にクロールしているサイトをブラウジングしていますが、それでも高速で応答性が高く、速度が低下することはありません。
コードからマルチスレッドを削除し、同期的に実行すると 500 エラーが停止しますが、それでも多くのタイムアウトが発生します (そして時間がかかります)。
マルチスレッドで実行している同時接続数は 100 未満です。それは多すぎますか?1000以上まで上げたいです。リクエスト間に遅延を追加する必要がありますか?