問題タブ [hxt]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
haskell - Hxt プログラムのコマンド ライン オプションを正しく収集するには?
論文のセクション 3 に到達しました。M. Ohlendorf のRDF ドキュメントを処理するための例を含む Haskell XML ツールボックスのクックブック。
ここに私が書いたプログラムがあります、
しかし、私はまだ次のエラーを経験しています
それは私の実装のようですが、cmdLineOpts
うまく適合していないようです。
ここで何が問題ですか?どうすれば修正できますか?
助けてくれてありがとう!
haskell - HXTでのリストの操作
ここで>>.
定義されているシンプルな>.
関数を使おうと夢中になっています。
HXTのノードのすべてのテキストの長さを取得したいと思います。私はこれを使用しています:
doc
私のXmlTree
矢はどこにありますか。
これにより、すべてのdivのすべてのテキスト(子を持つテキストを含む)が取得されます。を使用しているため、テキストを文字列として取得しますunlines
。今、私はその文字列の長さを取得したいので、私は試してみます:
そして、HXTは私の文字列を魔法のように配列に変換し直しているようです。
私が欲しいInt
のは、それらすべてをまとめたものです。どうすればいいですか?
更新:
テキスト関数は次のように定義されます。
ビットをスキップするとgetChildren
、これは正しく機能することがわかりました。
div
要素が1つしかない限り。複数のdiv
要素がある場合は、各要素の長さの配列が返されます。
haskell - HXT:最初の変換が成功した後に処理を停止するにはどうすればよいですか?
Control.Arrow.ArrowTreeを使用して、指定されたツリーで最初に変換が成功した後(深さ優先)に停止するHTML処理矢印を作成しようとしています。つまり、タイプの関数
たとえば、クラス「first」をHTMLドキュメントの最初のリスト項目に追加するには、矢印を作成します。
私はHXTにかなり慣れておらず、APIドキュメントを数時間読んで実装方法を理解しようとしprocessFirst
ていますが、すべてを組み合わせることができませんでした。processTopDownUntil
最初は有望に聞こえましたが、その関数は特定のサブツリーの処理を停止するだけなので、ネストされた要素を除くすべての要素を変換します。
haskell - HXT を使用して Haskell で RSS ファイルを解析するときにタグが見つからない場合
Haskell で RSS ファイルを解析する必要があり、次のようなことを行います。
私の問題は、1 つのタグが欠落している場合、空のリストを取得するよりも RSS ファイルから「lastBuildDate」としましょうが、その項目を「」に置き換えたいだけです。
どうやってやるの ??ありがとう、
orElse
EDIT1: where gotoAndTake a ... の最後に (constA "") を追加すること
で解決
haskell - hxtを使用して複数のhtmlテーブルを抽出します
私の問題は、htmlドキュメントからすべてのテーブルを抽出し、それらをテーブルのリストに配置する必要があることです。
したがって、終了関数の型は次のようになります。
たとえば、次のxmlを使用します。
1つのxmlTree(example1)またはタイプ[XmlTree]を提供するすべてのタグ "tables"からすべての行を取得する方法は知っていますが、test2の結果内に矢印example1をマップする方法がわかりません。
当たり前のことだと思いますが、見つかりません。
haskell - Haskell の HXT で Text または ByteString を使用することは可能ですか?
Haskell の XML/HTML 処理ライブラリである HXT には、矢印で DOM ツリーをトラバースおよび操作するための非常に柔軟で強力なメソッドがあると思います。 http://adit.io/posts/2012-04-14-working_with_HTML_in_haskell.html
ただし、HXT には DOM ノード コンテンツの文字列表現しかないようです。 http://hackage.haskell.org/packages/archive/hxt/9.1.6/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode
HXT に ByteString または Text のいずれかを使用することは可能ですか? 主にテキストを使用しているように見えるYesodでHXTを使用しているため、テキストが優先されます。
xml - Haskell HXT 解析条件
私はこのxmlを解析しようとしています:
下位の "name"-tag = "id" を持つ "<member>" タグのみを解析する方法は?
私は試した:
xml - HXT unpickler で XML 属性を無視する
私は、複数のサイトから XML をスクレイピングし、希望する方法でデータを処理することを目的とした小さなアプリケーションを作成しています。私は以前にそのようなアプリケーションを作成しましたが、異なる言語で、Haskell の練習用にこれを書いています。
とにかく、ポイントに。Web で何百万もの XML パーサーを調べた結果、HXT を使用することにしました。ページhttp://www.haskell.org/haskellwiki/HXT/Conversion_of_Haskell_data_from/to_XMLに従って、 XML ファイルを読み取り、それを定義した Haskell データ型に入れているように見えるものに到達しました。これを実現するために、XmlPickler のインスタンスを使用してファイルからデータを読み取ります。このエラーを除いて、うまくいくものにたどり着きました:
すべての属性を処理していないことは承知しています。すべての属性が必要なわけではありません。これらを無視する方法はありますか?すべての属性を処理し、それらを新しいデータ型に入れ、そこから属性を抽出して、実際に必要なデータを取得できると思います。私はこの小さなハックを避けたいので、ここに来て The Proper Way™ を求めています。
仕事に間違ったツールを使用していませんか? サードパーティのデータを unpickle することは安全ではありませんか (Python の場合のように)?
解決策を Web で調べましたが、Text.XML.HXT.Arrow.XmlState.SystemConfig
この動作を無効にするために必要なものがないようです。
xml - XMLでのUnicodeに対するHaskellの態度はどうですか?
HaskellでUnicodeXMLを処理するための公式の解決策は何か知りたいです。String
HXTがテキストに単純な表現(Unicode文字のリスト!!!)を使用していることに気付きました。
解析するときに、2つの表現からどのように選択しますか?ユーザーに文字のリストを使用させることは、特にXMLドキュメントに多くのテキストコンテンツが含まれている場合は、特に魅力的な機能のようには思えません。
また、 Googleでhttp://hackage.haskell.org/package/hxt-unicodeを見つけましたが、解析でどのように使用するのかわかりません。Unicodeのサポートも以前ははるかに明示的でした:http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html しかし、このモジュール明確な理由なしに最新バージョン(執筆時点では9.3.1.0)で削除されました。その背後にある動機は何でしたか?
また、HXTの使用目的のサンプルコードを教えてもらえますか?wikiページはこの点で深刻に欠けています。ありがとうございました。