だから私はSCRAPYを使ってウェブサイトの本をこすり落としています。
私はクローラーを動作させており、クロールは正常に行われますが、XPATH で選択を使用して HTML をクリーニングする場合、うまくいきません。今は本のウェブサイトなので、各ページにほぼ131冊の本があり、それらのXPATHは次のようになります
たとえば、本のタイトルを取得する -
1st Book --- > /html/body/div/div[3]/div/div/div[2]/div/ul/li/a/span
2nd Book ---> /html/body/div/div[3]/div/div/div[2]/div/ul/li[2]/a/span
3rd book ---> /html/body/div/div[3]/div/div/div[2]/div/ul/li[3]/a/span
DIV[] の数は、本によって増加します。これをループに入れ、すべてのタイトルをキャッチする方法がわかりません。画像と著者名についてもこれを行う必要がありますが、同様になると思います。この最初のものを完成させる必要があります。
事前にご協力いただきありがとうございます。