問題タブ [tei]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xml - 親ノード属性を使用して R のデータフレームに XML をロードする
R の data.frame に処理したい XML ファイル (TEI でエンコードされたプレイ) があります。ここで、data.frame のすべての行には、プレイの 1 行、行番号、その行のスピーカーが含まれています。シーン番号、シーンタイプ。XML ファイルの本文は次のようになります (ただし、より長くなります)。
この問題は、こことここで提起された質問に似ているように見えますが、私の XML ファイルの構造が少し異なるため、どちらも有効な解決策を提供していません。私はこれを行うことができました:
これにより、「シーン番号」、「シーン タイプ」、および「スピーカー」がそのままの状態で data.frame が返されますが、それを各行に分割する (および関連する行番号を取得する) 方法がわかりません。
(xmlToList を使用して) ファイルをリストとしてインポートしようとしましたが、リストのリストが非常に乱雑になり、for ループを使用してさまざまな要素にアクセスしようとすると、さまざまなエラーが発生しました (ひどいアイデア、私は知っています!)。
理想的には、ファイル全体がごちゃごちゃしていても機能し、同様に構造化された他の XML ファイルでも機能するソリューションを探しています。
Rを使い始めたばかりで、完全に途方に暮れています。あなたが提供できる支援は、非常に高く評価されます。
ご協力いただきありがとうございます!
編集: 完全な xml ファイルのコピーは、こちらから入手できます。
html - TEI 翻訳が認識されないタグ
TEI xml スプレッドシートを受け取ったので、そのレイアウトを作成する必要があります。現在の私の最大の問題は、フォーマットが p タグを使用してテキストを分割していることです。ただし、xml を html に解析すると、タグは存在せず、ドキュメント内にスペースが存在します。
以下は、出力しようとしているモデルです。はい、現在非常に不足しています。
ここに私が解釈しようとしているxmlがあります
これは翻訳されたhtmlです。以前は p タグがあった場所を確認できますが、現在は大きなスペースになっています。
望ましい出力ですが、quote、orig、reg、および name タグをすべて識別できるようにしたいです。
ここで本当に助けが必要です。また、TEI の解釈に関する優れたチュートリアルやドキュメントをご存じでしたら、よろしくお願いします。
html - 文字列の長さ条件を使用して XML を XSLT で HTML に変換する
次のような TEI ビルドを使用した XML ファイルがあります。
これを次の HTML 構造に変換する必要があります。
今のところ、次の XSLT ファイルを使用します。
私の問題は、新しい<div class="book-content">
foreach 900 文字を作成する必要があることです。しかし、私は自分の要素をカットしたくないので、900文字のようなものにするために1つに含めるs
必要がある要素の数を計算する必要があります.s
<div class="book-content">
xml - 2 つの xml tei ファイル間の相互参照
次のような最初の XML TEI ファイルがあります。
次に、次のような 2 番目の XML TEI ファイルがあります。
2 番目のファイルには、最初のファイルの説明がほとんど含まれていません。これら 2 つのファイル間で相互参照を行うことができるかどうかを知りたいですか? XMLでそれを行うための一般的/最良の方法は何ですか? そして、TEI に特有のものはありますか?
xml - 前の兄弟と次の兄弟が追加要素で機能しない
この質問が長くなってしまったことをまずお詫びしたいと思いますが、この情報が役に立てば幸いです。
複数の xml ドキュメントで単一の xsl を使用しようとしていますが、元のドキュメント (各壁が TEI surfaceGrp 要素として表される、部屋の 4 つの壁のテキスト) で機能します。ただし、今度は xsl を変更して、書かれたページの両面とページのコレクションを表す追加の TEI surfaceGrp 要素を処理する必要があります。
4 つの壁の元の xml コードは次のようなものです。
私は次のhtmlに変換します
このxsl経由:
追加の surfaceGrp 要素を含む新しいドキュメントでこれを実行すると、
1ページ分の情報しか得られません。ページは元のコードで壁が行うのと同じ surfaceGrp スロットに適合するため、これは理にかなっています。しかし、ページレベルのコレクションに移動するようにコードを変更しようとすると
同じ結果が得られます。そして、私には理由がわかりません。私は明らかに、私が思っていたように、先行兄弟と後続兄弟を理解していません。私が望むことを達成するためのよりクリーンな方法があれば、喜んでそれを使用します。
xml - 複数の XML ファイルを日付順にソートし、XSLT を使用して 1 つにマージする
TEI の歴史的な文字を含む単一の XML ファイルがいくつかあります。ここで、日付を基準としてそれらを 1 つのファイルにマージしたいと考えています。
A1.xml
2 番目のファイル A2.xml:
3 番目の A3.xml:
ファイル名は「A001.xml」から「A999.xml」まで連続したファイル名になっていますが、順不同です。したがって、私の好みの出力は、単一のファイルの letters.xml になります。
複数の XML ファイルを 1 つにマージする方法を見つけたとしても、並べ替え基準を使用してそれを機能させることはできません。これは可能ですか?
xml - 兄弟ノードのネストされたアイテム間を移動する最良の方法は?
実際にはかなり簡単に答えられると確信している問題がありますが、それを理解することはできず、以前にそれについて質問しようとしたのは過度に複雑でした.
画像ファイルに関連付けられたテキストを含む TEI XML から生成されるページがあります。
(余分な扱いを避けるために、ここの例からテキストを削除しました)
各テキストに関連付けられた画像のサムネイル画像に基づいて、ページの上部にヘッダーを生成します。www_test_1-thumbnail.jpg
などです。次の xsl を使用すると、ヘッダーを正しく表示できます (tei は tei 名前空間であり、で宣言できます) xmlns:tei="http://www.tei-c.org/ns/1.0"
。
<surfaceGrp>
私の問題は、ラップされた要素のセットから別のセットにジャンプする必要がある場合があることです。たとえば、「南の壁」があった場合、<surfaceGrp>
サムネイル画像の次のブロックにジャンプできるように、次の要素の URL を取得できる必要があります。
物事をさらに複雑にしている<surfaceGrp>
のは、要素が含まれる大きなブロックがあるため、すべてを別の要素でラップする必要がある場合があることです。これは次のようになります。
だから私の質問は2つあります:
<surfaceGrp>
xsl で最初のツリーにすべてを表示するにはどうすればよいですか? 私の現在のコードは、子の 2 つのサーフェスを表示します<surfaceGrp>
が、すべてではありません。- 上記の例で、Verse 66 から Verse 68 へのリンクを生成するにはどうすればよいですか? また、Verse 65 から Verse 66 へのリンクとは根本的に異なりますか? 私が持っているいくつかの複雑なコードを使用して、次のアイテムと次のアイテムにジャンプできます
<surfaceGrp>
が、それは信じられないほどバグのあるソリューションであり、2 番目の<surfaceGrp>
レイヤーが追加されると完全に機能しなくなります。標準的な解決策がある場合は、正しい方向にうなずいていただければ幸いです。
私が持っているコードで現在 xsl が生成する html コードは次のとおりです。