Wikipedia APIを使用して、英語版にない ''SQLTemplate:Infobox Scientifique'' を含むフランス語のページを見つけたいと考えています。したがって、私の考えは、次のドキュメントを xproc で処理することでした。
および次の xslt スタイルシート:
<?xml version='1.0' ?>
<xsl:stylesheet
xmlns:xsl='http://www.w3.org/1999/XSL/Transform'
version='1.0'
>
<xsl:output method='text' indent="yes"/>
<xsl:template match="/">
<xsl:apply-templates select="api"/>
</xsl:template>
<xsl:template match="api">
<xsl:for-each select="query/embeddedin/ei">
<xsl:variable name="title" select="translate(@title,' ','_')"/>
<xsl:variable name="english-title">
<xsl:call-template name="englishTitle"><xsl:with-param name="title" select="@title"/></xsl:call-template>
</xsl:variable>
<xsl:value-of select="$english-title"/><xsl:text>
</xsl:text>
</xsl:for-each>
</xsl:template>
<xsl:template name="englishTitle">
<xsl:param name="title"/>
<xsl:variable name="uri1" select="concat('http://fr.wikipedia.org/w/api.php?action=query&format=xml&prop=langlinks&lllimit=500&titles=',translate($title,' ','_'))"/>
<xsl:message><xsl:value-of select="$uri1"/></xsl:message>
<xsl:message>count=<xsl:value-of select="count(document($uri1,/api/query/pages/page/langlinks/ll))"/></xsl:message>
</xsl:template>
</xsl:stylesheet>
XSLT はテンプレートを含むすべての記事を抽出し、記事ごとにウィキペディアを呼び出してウィキ間のリンクを取得します。ここで、テンプレートenglishTitleは xpath 関数を呼び出しますdocument()
。
count(ll)=1
しかし、ノードがたくさんあるのに対して、それは常に言っています。(例: http://fr.wikipedia.org/w/api.php?action=query&format=xml&prop=langlinks&lllimit=500&titles=Carl_Sagan )。
document()
関数によって返されたノードを処理できませんか?