問題タブ [dmoz]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - DMOZ ODP RDF を MySQL に変換するにはどうすればよいですか?
rdf.dmoz.orgからDMOZ ODP構造とコンテンツアーカイブをダウンロードしました。それらを RDF から MySQL に変換するにはどうすればよいですか?
問題は、ODP RDF にはバグがあり、厳密なパーサーでそれらを解析することが不可能なことです。
dmoz2mysqlを見つけましたが、30 分後に非常に長い SQL ダンプでクラッシュするため、エラー メッセージを表示できません。
url - DmozODPからURLを取得する方法
DMOZODPに存在するURLのデータベースをアプリケーションに使用したいと思います。(URL文字列の配列または同じものを含むファイル)。(手動のコピー&ペースト以外に)それを取得する方法はありますか?
編集 :
rdfファイルを解析するためのスクリプト/コードはありますか?
php - PHP スクリプトを使用した dmoz rdf ファイルの解析
私はphpスクリプトを使用しました
http://sourceforge.net/projects/dmoz2mysql/files/
dmoz データを MySQL テーブルにダウンロード、抽出、クリーニング、解析、および挿入します。structure.rdf の処理中に問題は発生しません。
しかし、content.rdf の解析中に、3200000 行を挿入した後に突然一時停止し、その後何も起こりません。約 1 時間待ってから強制終了する必要がありました。このスクリプトを Windows コマンド プロンプトで実行します。私は PHP を知らないので、この問題の原因を見つけることができません。
php - 各カテゴリとサブカテゴリの数を計算するためのDmoz/Monsterアルゴリズム?
monter.comやdmozディレクトリのようなブラウズページを作成する必要があります。私の問題は、各カテゴリのカウントです。同様のことをするための最良の実践は何ですか?PHP / MySQL Thxを使用しています!
php - PHPを使用してODPDMOZ.orgからWebサイトの説明(メタ)を取得します
私はphpのウェブサイトに取り組んでいます。私がやりたいのは、ウェブサイトの説明やメタ情報を廃止することです。私がやりたいのはdmoz.orgから情報を入手することですが、そのようなことをする方法はありますか?
そうでない場合、他の選択肢は何ですか?cURL?
どうもありがとう、
編集:
どうやら私の質問は明確ではありませんでした。dmoz.orgは、Webサイトに関する情報を提供するオープンディレクトリです。提供される情報は、Webサイト自体のメタタグとは異なります。だから私がやりたいのはそのような情報を入手することです。
mysql - mysql と php で dmoz の rdf データを利用する方法は?
Webで検索しましたが、まだ明確な答えを得ることができません。私の目標は、dmoz からのrdf データを利用することです。そのため、ここに 2 つの質問があります。
rdf を mysql にインポートする方法は? (どんな固い道具でも使えますか?)
SPARQL を介してデータをクエリ可能にする方法は? (どのコンポーネントまたはクエリ エンジンを使用する必要があるか)
私が学んだことから、 Redland RDF ライブラリに基づいてストレージを構築する必要があり、それから SPARQL でクエリを実行できます。しかし、レッドランドをさらに読んでみると、彼らは php の適切なドキュメントを持っていません。私はrdfテクノロジーにかなり慣れていないので、これらの欠けているギャップは私を混乱させます。
php - PHPからDMOZディレクトリのサイトリストを検出する方法
特定のサイトがPHPのDMOZディレクトリでlistendであるかどうかをどのように検出できますか?
web-crawler - Web サイトから複数の Web ページをクロールする
Web サイトからデータを抽出したい。たとえば、URL はhttp://www.example.com/です。そこで、この URL を入れました(ドキュメントのDMOZstart_urls
の例を参照してください)。しかし、文字列を入力してボタンをクリックすると、その文字列が追加され、このhttp://www.example.com/computer/page-のようにアクセスできるすべてのページが抽出される GUI も作成したいと思います。 1 . ループを使用してこれを行う方法を教えてください。動作するかどうかを確認するために手動でさらに URL を入力しようとしましたが、うまく応答しません。場合によっては、応答がありません。それについて何か考えはありますか?start_urls
start_urls
python - MySQL または SQLite への DMOZ RDF ダンプ
dmoz.org から最新の rdf ダンプをダウンロードしました。Python
で SQLite または MySQL データベース (できれば MySQL) を作成したいと考えています。python はデフォルトで MySQL をサポートしていないため、次のようにインストールする必要があります。
現在、rdf ダンプは巨大な醜い XML ファイルです。それを解析して、URL、タイトル、説明の 3 つの列を持つデータベース テーブルに保存する方法はありますか?
助けてくれてありがとう...