“wikimedia”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

3569 参照

php - ウィキページの最初の画像を取得する方法

任意のwikiページの最初の画像/メイン画像を取得する必要があります。これを行うには、スクレイピングツールを使用できます。しかし、私はcurlを使用してページをスクラップしています。ただし、インターネット接続が遅いことが原因である可能性があります。1つのwikiページだけを廃棄するには長い時間がかかります。それとは別に、ユーザーのクエリに応じて、少なくとも7〜8個の異なるWiki画像を同時に表示する必要があります。

したがって、これにcurlを使用しても意味がありません。wikiAPIを試しました

しかし、このリストをソートするために私が与えることができる他のパラメーターはありません。通常、このAPIが返す最初の画像は、ページの上部に表示されるメイン画像ではありません。画像がページのコンテキストから離れすぎている場合があります。

Wikiタイトルごとに1つの画像を表示する必要があります。前もって感謝します。

2012-04-20T14:47:41.127

0 投票する

3 に答える

155 参照

php - ウィキペディアサーバー gzip コンテンツ

ウィキメディア API は gzip エンコーディングをサポートしていますか。curl を使用してコンテンツを取得しています。私はaccept gzipエンコーディングを使用しました。しかし、それはうまくいかないようです..

php curl wikimedia

2012-05-04T11:15:26.767

0 投票する

1 に答える

86 参照

mediawiki - 自分のページ/サイトに実装できる WikiEditor 用のプラグインはありますか

私のクライアントは、WikiEditor と同じエディタとそのすべての機能を自分の Web サイトで使用したいと考えています (フレームワークはほとんど codeigniter に近いです)。MediaWiki を実装してエディタ "WikiEditor" を見たことがありますが、それを個別に自分のページに入れることはできませんでした。誰かがそこに答えてくれることを願っています。

よろしくお願いいたします。 Rajesh Mohan

mediawiki wikimedia

2012-05-21T06:50:52.813

0 投票する

2 に答える

160 参照

mediawiki - mediawiki のユーザー設定にユーザーの性別オプションを追加するには?

special:preferences では、メディアウィキのユーザーは 2 つの性別から選択できます。私の wiki では、さらにオプションを追加したいと考えています。例: 「トランスジェンダー」、または「あなたとは関係ありません」。これは実行可能ですか？

mediawiki wikimedia

2012-06-24T06:59:06.673

0 投票する

1 に答える

228 参照

mysql - JavaでWikiMediaデータベースからvarbinary値を読み取る

次のコードを使用して、MySQL クエリ (WikiMedia、「 varbinary フィールド」)の結果を取得しようとしています。

残念ながら、「タイトル」はすべてのドイツ語の「ウムラウト」 (ä、ü、ö など) を無効にします。

どうすればこの問題を解決できますか?

ありがとう：-）

mysql wikipedia wikimedia

2012-09-28T21:26:12.360

0 投票する

1 に答える

991 参照

hadoop - ウィキペディアのページ数データセットの Hadoop

基本的にwikipedia pagecount-statisticを入力として受け取り、次のようなリストを作成するHadoop-Jobを構築したい

そのためには、各言語に関連するさまざまな記事名が必要です。つまり、Brugge(en, fr)、Brügge(de) で、MediaWikiApi が記事ごとに照会します (http://en.wikipedia.org/w/api.php?action=query&titles =Bruges&prop=langlinks&lllimit=500)。

私の質問は、この問題を解決するための正しいアプローチを見つけることです。

私のスケッチしたアプローチは次のようになります。

pagecount ファイルを 1 行ずつ処理します (line-example 'de Brugge 2 48824')。
MediaApi にクエリを実行し、sth を書き込みます。like'en-Articlename: process-language-key:count'
すべての en-Articlename-values を 1 行に集約します (おそらく 2 番目のジョブで?)

今では、すべての行に対して MediaAPI を照会するのはかなり不便に思えますが、現在、より良い解決策について頭を悩ませることはできません。

の現在のアプローチは実現可能だと思いますか、それとも別のアプローチを考えられますか?

補足: 作成されたジョブチェーンは、私の (小さな) Hadoop-Cluster で時間を測定するために使用されるため、タスクを変更しても問題ありません。

編集：これは、私が今見つけた非常によく似た議論です..

hadoop mapreduce wikipedia concept wikimedia

2012-10-14T12:42:11.260

0 投票する

1 に答える

325 参照

php - wikisource.orgサイトからデータを取得する

このサイトから郵便番号を取得しようとしています。

http://pl.wikisource.org/wiki/Lista_kod%C3%B3w_pocztowych_w_Polsce

私のコードは単純です：

しかし、$ postalCodeを03-000に設定すると（01-000、05-000ですが、07-000、61-000、62-000は機能しています）、エラーが発生します。

ページアドレスは正しく、Webブラウザにコピーして貼り付けることができ、機能します。何か案は？

php wikimedia

2012-11-25T20:11:23.990

0 投票する

1 に答える

809 参照

wikipedia - wikimediaマークアップのWikipedia [[File:...]]タグから完全なURLを作成する方法は?

[[File:...]]ウィキメディアマークアップのタグまたはインフォボックス|image=...行を指定して、ウィキペディアが記事内の画像の完全な URL を生成するために使用するロジックは何ですか?

URL は常にで始まりhttp://upload.wikimedia.org/wikipedia/commons/、その後に予測できないように見える 2 つの URL セグメントと、タグから予測できる画像名が続きます。

例えば、

収量:

URLの一部をプログラムで判断する方法はあり/6/6aますか、それともWikipediaサーバーでのルックアップですか?

インフォボックスの別の例:

収量:

/b/b3URL の一部を予測できますか?

ありがとう！

wikipedia wikimedia

2012-11-30T03:29:54.447

0 投票する

3 に答える

643 参照

ruby - Xpath: ノードまでのすべてのノード ( Wikiquote.org )

ドキュメント: http://en.wikiquote.org/wiki/The_Matrix

最初のセクション (Neo の引用) のすべての引用 (//ul/li) を取得したいと思います。

//ul[1]/li一部のウィキクォートのページでは、引用がこの形式で表されているため、できません

それ以外の

最初のセクションを取得するためにこれを試しました

しかし、最初のセクションの引用のみを取得するのに問題があります。あなたは私を助けることができます？

ruby xpath nokogiri xpath-2.0 wikimedia

2012-12-16T16:33:51.887

0 投票する

1 に答える

47 参照

wikimedia - ウィキメディアのページダンプでセクションを検出する方法

私はこの質問に答えようとかなり見回しましたが、役に立ちませんでした。特定のページを処理するためにウィキメディアのページダンプを解析しています (はい、ウィキメディアのページダンプを解析するツールがいくつかあることは知っていますが、私のパーサーと同様に機能しません)。

質問は簡単です。セクションの開始を検出する方法を知っています (例: "==External References==")。簡単だ。明確に定義されていないのは、セクションの終了を検出する方法です。たとえば、ほとんどのセクションでは、次のセクションヘッダーの開始までスキャンできますが、これは信頼できません。セクションに関する wikimedia のヘルプページを見ましたが、セクションの終わりを検出する方法が記載されていません。

wikimedia

2013-01-05T23:33:59.280

問題タブ [wikimedia]

Reference