URL を収集するための最良の方法を見つけようとしています。独自の小さなクローラーを作成することもできますが、サーバーがインターネット全体をクロールするには数十年かかり、必要な帯域幅が膨大になります。もう 1 つの考えは、Google の Search API または Yahoo の Search API を使用することですが、結果を得る前に検索を実行する必要があるため、これは実際には優れたソリューションではありません。
その他の考えとしては、DNS サーバーに問い合わせて URL のリストを要求することも考えられますが、DNS サーバーは私の要求を制限/抑制したり、まとめて禁止したりすることさえできます。現時点では、DNS サーバーに問い合わせる知識がかなり限られているため、これが最善の方法であるかどうかはわかりません。
URL の膨大なリストが必要なだけですが、将来的にレンガの壁にぶつかることなくこのリストを作成したいと考えています。何かご意見は?
私はPythonを学ぶためにこのプロジェクトを始めていますが、それは質問とは何の関係もありません.