“dmoz”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

1053 参照

mysql - DMOZ ODP RDF を MySQL に変換するにはどうすればよいですか?

rdf.dmoz.orgからDMOZ ODP構造とコンテンツアーカイブをダウンロードしました。それらを RDF から MySQL に変換するにはどうすればよいですか?

問題は、ODP RDF にはバグがあり、厳密なパーサーでそれらを解析することが不可能なことです。

dmoz2mysqlを見つけましたが、30 分後に非常に長い SQL ダンプでクラッシュするため、エラーメッセージを表示できません。

2009-10-29T15:46:33.480

0 投票する

3 に答える

2433 参照

url - DmozODPからURLを取得する方法

DMOZODPに存在するURLのデータベースをアプリケーションに使用したいと思います。（URL文字列の配列または同じものを含むファイル）。（手動のコピー＆ペースト以外に）それを取得する方法はありますか？

編集：

rdfファイルを解析するためのスクリプト/コードはありますか？

url dmoz

2009-12-24T04:50:21.917

0 投票する

1 に答える

881 参照

php - PHP スクリプトを使用した dmoz rdf ファイルの解析

私はphpスクリプトを使用しました

http://sourceforge.net/projects/dmoz2mysql/files/

dmoz データを MySQL テーブルにダウンロード、抽出、クリーニング、解析、および挿入します。structure.rdf の処理中に問題は発生しません。

しかし、content.rdf の解析中に、3200000 行を挿入した後に突然一時停止し、その後何も起こりません。約 1 時間待ってから強制終了する必要がありました。このスクリプトを Windows コマンドプロンプトで実行します。私は PHP を知らないので、この問題の原因を見つけることができません。

php mysql dmoz

2010-03-08T08:37:26.507

0 投票する

2 に答える

334 参照

php - 各カテゴリとサブカテゴリの数を計算するためのDmoz/Monsterアルゴリズム？

monter.comやdmozディレクトリのようなブラウズページを作成する必要があります。私の問題は、各カテゴリのカウントです。同様のことをするための最良の実践は何ですか？PHP / MySQL Thxを使用しています！

php count dmoz

2010-06-23T09:20:07.197

0 投票する

1 に答える

262 参照

php - PHPを使用してODPDMOZ.orgからWebサイトの説明（メタ）を取得します

私はphpのウェブサイトに取り組んでいます。私がやりたいのは、ウェブサイトの説明やメタ情報を廃止することです。私がやりたいのはdmoz.orgから情報を入手することですが、そのようなことをする方法はありますか？

そうでない場合、他の選択肢は何ですか？cURL？

どうもありがとう、

編集：

どうやら私の質問は明確ではありませんでした。dmoz.orgは、Webサイトに関する情報を提供するオープンディレクトリです。提供される情報は、Webサイト自体のメタタグとは異なります。だから私がやりたいのはそのような情報を入手することです。

php curl dmoz

2011-09-21T17:42:39.797

0 投票する

1 に答える

1246 参照

mysql - mysql と php で dmoz の rdf データを利用する方法は?

Webで検索しましたが、まだ明確な答えを得ることができません。私の目標は、dmoz からのrdf データを利用することです。そのため、ここに 2 つの質問があります。

rdf を mysql にインポートする方法は? （どんな固い道具でも使えますか？）
SPARQL を介してデータをクエリ可能にする方法は? (どのコンポーネントまたはクエリエンジンを使用する必要があるか)

私が学んだことから、 Redland RDF ライブラリに基づいてストレージを構築する必要があり、それから SPARQL でクエリを実行できます。しかし、レッドランドをさらに読んでみると、彼らは php の適切なドキュメントを持っていません。私はrdfテクノロジーにかなり慣れていないので、これらの欠けているギャップは私を混乱させます。

mysql rdf sparql data-import dmoz

2012-01-09T13:20:08.953

0 投票する

2 に答える

1755 参照

php - PHPからDMOZディレクトリのサイトリストを検出する方法

特定のサイトがPHPのDMOZディレクトリでlistendであるかどうかをどのように検出できますか？

php detect dmoz

2012-02-06T15:12:36.983

0 投票する

2 に答える

335 参照

web-crawler - Web サイトから複数の Web ページをクロールする

Web サイトからデータを抽出したい。たとえば、URL はhttp://www.example.com/です。そこで、この URL を入れました(ドキュメントのDMOZstart_urlsの例を参照してください)。しかし、文字列を入力してボタンをクリックすると、その文字列が追加され、このhttp://www.example.com/computer/page-のようにアクセスできるすべてのページが抽出される GUI も作成したいと思います。 1 . ループを使用してこれを行う方法を教えてください。動作するかどうかを確認するために手動でさらに URL を入力しようとしましたが、うまく応答しません。場合によっては、応答がありません。それについて何か考えはありますか？start_urlsstart_urls

web-crawler dmoz

2012-04-15T07:23:03.443

0 投票する

0 に答える

27 参照

python - MySQL または SQLite への DMOZ RDF ダンプ

dmoz.org から最新の rdf ダンプをダウンロードしました。Python
で SQLite または MySQL データベース (できれば MySQL) を作成したいと考えています。python はデフォルトで MySQL をサポートしていないため、次のようにインストールする必要があります。

現在、rdf ダンプは巨大な醜い XML ファイルです。それを解析して、URL、タイトル、説明の 3 つの列を持つデータベーステーブルに保存する方法はありますか?

助けてくれてありがとう...

python mysql sqlite xml-parsing dmoz

2013-05-23T11:13:01.330

問題タブ [dmoz]

Reference