過去 1 時間に編集された各記事 (xml 形式、テンプレートを含む) をダンプするソリューションを探しています。
私はFirefox用のimacroから始めました。記事のリストを取得できるようになりました。現在、スペースまたはドイツ語のウムラウトを含む記事名に問題があります。
egEidgen%C3%B6ssische_Konstruktionswerkst%C3%A4tte_K%2BW_C-35
i を「実際の」記事名に変換するにはどうすればよいですか?
表示されているタイトルは、URL で使用するためにエンコードされています。PHP の「urldecode」、JavaScript の「decodeURIComponent」、Python の「urllib2.quote」など、プログラミング言語はこれらをデコードするための標準的な方法を提供する必要があります。
しかし、変更されたページのタイトルを MediaWiki API 経由で取得する場合は、これを行う必要はまったくありません。たとえば、ウィキペディアのこのクエリを参照してください: https://de.wikipedia.org/w/api.php?action=query&list=recentchanges&format=xml