問題タブ [praw]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - futures.ProcessPoolExecutor を使用しているが、PRAW ラッパーで futures.ThreadPoolExecutor を使用していない場合の再帰最大エラー
このコードを使用して API をスクレイピングしています。
スレッドではうまく動作しますが、プロセスを使用しようとするとキューがいっぱいになり、次のエラーが発生します。
当初、このプロセスは小規模なデータの取得では非常に高速に機能していましたが、現在はまったく機能していません。これはバグですか、それとも PRAW オブジェクトがスレッドではなくプロセスで再帰エラーを引き起こすのは何が起こっているのでしょうか?
python - Django で reddit の投稿を取得する
Python/Django を学習する方法として、PRAW を使用して Django で reddit を再作成しようとしていますが、いくつかの問題が発生しています。現在、アプリを reddit に接続して IndexView クラスのホームページから上位 10 件の投稿を取得するように構成していますが、Posts
モデルにフィールドを追加してmakemigrations
. django admin からデータベースからすべてを削除した場合でも、モデルにフィールドを追加してから を使用すると、または同様python manage.py makemigrations
のエラーが頻繁に発生します。no such column: post_is_self
新しいフィールドをコメントアウトしてdjangoサーバーを再起動すると、その間アプリのインデックスにアクセスしていなくても、投稿がデータベースに戻ります。
問題は、データベースにデータを入力する方法にあると思います。ユーザーがアプリのインデックスに移動したときに最新の上位 10 件の投稿を取得したいのですが、新しいフィールドを追加するのは非常に困難です。取得すべきではないときに投稿を取得しているように見えます。これは、新しいフィールドがモデルに追加され、makemigrations が呼び出されているときに問題を引き起こしています。
ここに私の IndexView クラスがあります:
編集: ...そして私のPost
モデル:
上位の投稿を別の場所で取得する必要がありますか? 新しいフィールドがモデルに追加される前に投稿を取得していますか? どんな助けでも大歓迎です、ありがとう!
python - Reddit の subreddit からすべてのコメントをスクレイピングする方法は?
サブレディットからすべてのコメントをスクレイピングしようとしています。PRAWというライブラリを見つけました。例を示します
ただし、これは最新の 25 件のコメントのみを返します。subreddit のすべてのコメントを解析するにはどうすればよいですか? Reddit インターフェースにはnext
ボタンがあるので、ページごとに履歴をさかのぼることができるはずです。
python - スレッド化されたコメント リストを再帰的に取得する
Reddit 送信からネストされたコメントを取得できる再帰関数を作成しようとしています。私はPython + PRAWを使用しています
そして、次の出力が得られますが、これは不完全で、ネストされた配列があります。
Submission
オブジェクトには、オブジェクトのリストである属性comments
がありComment
ます。各Comment
オブジェクトには、より多くの の_replies
リストである属性がありますComment
。
私は何が欠けていますか?私は最善を尽くしました - 再帰は難しいです。