問題タブ [wikimedia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
3569 参照

php - ウィキページの最初の画像を取得する方法

任意のwikiページの最初の画像/メイン画像を取得する必要があります。これを行うには、スクレイピングツールを使用できます。しかし、私はcurlを使用してページをスクラップしています。ただし、インターネット接続が遅いことが原因である可能性があります。1つのwikiページだけを廃棄するには長い時間がかかります。それとは別に、ユーザーのクエリに応じて、少なくとも7〜8個の異なるWiki画像を同時に表示する必要があります。

したがって、これにcurlを使用しても意味がありません。wikiAPIを試しました

しかし、このリストをソートするために私が与えることができる他のパラメーターはありません。通常、このAPIが返す最初の画像は、ページの上部に表示されるメイン画像ではありません。画像がページのコンテキストから離れすぎている場合があります。

Wikiタイトルごとに1つの画像を表示する必要があります。前もって感謝します。

0 投票する
3 に答える
155 参照

php - ウィキペディア サーバー gzip コンテンツ

ウィキメディア API は gzip エンコーディングをサポートしていますか。curl を使用してコンテンツを取得しています。私はaccept gzipエンコーディングを使用しました。しかし、それはうまくいかないようです..

0 投票する
1 に答える
86 参照

mediawiki - 自分のページ/サイトに実装できる WikiEditor 用のプラグインはありますか

私のクライアントは、WikiEditor と同じエディタとそのすべての機能を自分の Web サイトで使用したいと考えています (フレームワークはほとんど codeigniter に近いです)。MediaWiki を実装してエディタ "WikiEditor" を見たことがありますが、それを個別に自分のページに入れることはできませんでした。誰かがそこに答えてくれることを願っています。

よろしくお願いいたします。 Rajesh Mohan

0 投票する
2 に答える
160 参照

mediawiki - mediawiki のユーザー設定にユーザーの性別オプションを追加するには?

special:preferences では、メディアウィキのユーザーは 2 つの性別から選択できます。私の wiki では、さらにオプションを追加したいと考えています。例: 「トランスジェンダー」、または「あなたとは関係ありません」。これは実行可能ですか?

0 投票する
1 に答える
228 参照

mysql - JavaでWikiMediaデータベースからvarbinary値を読み取る

次のコードを使用して、MySQL クエリ (WikiMedia、「 varbinary フィールド」)の結果を取得しようとしています。

残念ながら、「タイトル」はすべてのドイツ語の「ウムラウト」 (ä、ü、ö など) を無効にします。

どうすればこの問題を解決できますか?

ありがとう :-)

0 投票する
1 に答える
991 参照

hadoop - ウィキペディアのページ数データセットの Hadoop

基本的にwikipedia pagecount-statisticを入力として受け取り、次のようなリストを作成 するHadoop-Jobを構築したい

そのためには、各言語に関連するさまざまな記事名が必要です。つまり、Brugge(en, fr)、Brügge(de) で、MediaWikiApi が記事ごとに照会します (http://en.wikipedia.org/w/api.php?action=query&titles =Bruges&prop=langlinks&lllimit=500)。

私の質問は、この問題を解決するための正しいアプローチを見つけることです。

私のスケッチしたアプローチは次のようになります。

  • pagecount ファイルを 1 行ずつ処理します (line-example 'de Brugge 2 48824')。
  • MediaApi にクエリを実行し、sth を書き込みます。like'en-Articlename: process-language-key:count'
  • すべての en-Articlename-values を 1 行に集約します (おそらく 2 番目のジョブで?)

今では、すべての行に対して MediaAPI を照会するのはかなり不便に思えますが、現在、より良い解決策について頭を悩ませることはできません。

の現在のアプローチは実現可能だと思いますか、それとも別のアプローチを考えられますか?

補足: 作成されたジョブ チェーンは、私の (小さな) Hadoop-Cluster で時間を測定するために使用されるため、タスクを変更しても問題ありません。

編集: これは、が今見つけた非常によく似た議論です..

0 投票する
1 に答える
325 参照

php - wikisource.orgサイトからデータを取得する

このサイトから郵便番号を取得しようとしています。

http://pl.wikisource.org/wiki/Lista_kod%C3%B3w_pocztowych_w_Polsce

私のコードは単純です:

しかし、$ postalCodeを03-000に設定すると(01-000、05-000ですが、07-000、61-000、62-000は機能しています)、エラーが発生します。

ページアドレスは正しく、Webブラウザにコピーして貼り付けることができ、機能します。何か案は?

0 投票する
1 に答える
809 参照

wikipedia - wikimediaマークアップのWikipedia [[File:...]]タグから完全なURLを作成する方法は?

[[File:...]]ウィキメディア マークアップのタグまたはインフォボックス|image=...行を指定して、ウィキペディアが記事内の画像の完全な URL を生成するために使用するロジックは何ですか?

URL は常に で始まりhttp://upload.wikimedia.org/wikipedia/commons/、その後に予測できないように見える 2 つの URL セグメントと、タグから予測できる画像名が続きます。

例えば、

収量:

URLの一部をプログラムで判断する方法はあり/6/6aますか、それともWikipediaサーバーでのルックアップですか?

インフォボックスの別の例:

収量:

/b/b3URL の一部を予測できますか?

ありがとう!

0 投票する
3 に答える
643 参照

ruby - Xpath: ノードまでのすべてのノード ( Wikiquote.org )

ドキュメント: http://en.wikiquote.org/wiki/The_Matrix

最初のセクション (Neo の引用) のすべての引用 (//ul/li) を取得したいと思います。

//ul[1]/li一部のウィキクォートのページでは、引用がこの形式で表されているため、できません

それ以外の

最初のセクションを取得するためにこれを試しました

しかし、最初のセクションの引用のみを取得するのに問題があります。あなたは私を助けることができます?

0 投票する
1 に答える
47 参照

wikimedia - ウィキメディアのページ ダンプでセクションを検出する方法

私はこの質問に答えようとかなり見回しましたが、役に立ちませんでした。特定のページを処理するためにウィキメディアのページ ダンプを解析しています (はい、ウィキメディアのページ ダンプを解析するツールがいくつかあることは知っていますが、私のパーサーと同様に機能しません)。

質問は簡単です。セクションの開始を検出する方法を知っています (例: "==External References==")。簡単だ。明確に定義されていないのは、セクションの終了を検出する方法です。たとえば、ほとんどのセクションでは、次のセクション ヘッダーの開始までスキャンできますが、これは信頼できません。セクションに関する wikimedia のヘルプ ページを見ましたが、セクションの終わりを検出する方法が記載されていません。