“hxt”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

191 参照

haskell - Hxt プログラムのコマンドラインオプションを正しく収集するには?

論文のセクション 3 に到達しました。M. Ohlendorf のRDF ドキュメントを処理するための例を含む Haskell XML ツールボックスのクックブック。

ここに私が書いたプログラムがあります、

しかし、私はまだ次のエラーを経験しています

それは私の実装のようですが、cmdLineOptsうまく適合していないようです。

ここで何が問題ですか？どうすれば修正できますか？

助けてくれてありがとう！

2012-03-15T12:17:44.667

0 投票する

1 に答える

243 参照

haskell - HXTでのリストの操作

ここで>>.定義されているシンプルな>.関数を使おうと夢中になっています。

HXTのノードのすべてのテキストの長さを取得したいと思います。私はこれを使用しています：

doc私のXmlTree矢はどこにありますか。

これにより、すべてのdivのすべてのテキスト（子を持つテキストを含む）が取得されます。を使用しているため、テキストを文字列として取得しますunlines。今、私はその文字列の長さを取得したいので、私は試してみます：

そして、HXTは私の文字列を魔法のように配列に変換し直しているようです。

私が欲しいIntのは、それらすべてをまとめたものです。どうすればいいですか？

更新：

テキスト関数は次のように定義されます。

ビットをスキップするとgetChildren、これは正しく機能することがわかりました。

div要素が1つしかない限り。複数のdiv要素がある場合は、各要素の長さの配列が返されます。

haskell hxt

2012-04-15T05:16:10.987

0 投票する

1 に答える

307 参照

haskell - HXT：最初の変換が成功した後に処理を停止するにはどうすればよいですか？

Control.Arrow.ArrowTreeを使用して、指定されたツリーで最初に変換が成功した後（深さ優先）に停止するHTML処理矢印を作成しようとしています。つまり、タイプの関数

たとえば、クラス「first」をHTMLドキュメントの最初のリスト項目に追加するには、矢印を作成します。

私はHXTにかなり慣れておらず、APIドキュメントを数時間読んで実装方法を理解しようとしprocessFirstていますが、すべてを組み合わせることができませんでした。processTopDownUntil最初は有望に聞こえましたが、その関数は特定のサブツリーの処理を停止するだけなので、ネストされた要素を除くすべての要素を変換します。

haskell hxt

2012-04-21T17:01:02.797

0 投票する

1 に答える

109 参照

haskell - HXT を使用して Haskell で RSS ファイルを解析するときにタグが見つからない場合

Haskell で RSS ファイルを解析する必要があり、次のようなことを行います。

私の問題は、1 つのタグが欠落している場合、空のリストを取得するよりも RSS ファイルから「lastBuildDate」としましょうが、その項目を「」に置き換えたいだけです。

どうやってやるの？？ありがとう、

orElseEDIT1: where gotoAndTake a ... の最後に (constA "") を追加することで解決

haskell rss hxt

2012-05-19T14:32:20.743

0 投票する

1 に答える

350 参照

haskell - hxtを使用して複数のhtmlテーブルを抽出します

私の問題は、htmlドキュメントからすべてのテーブルを抽出し、それらをテーブルのリストに配置する必要があることです。

したがって、終了関数の型は次のようになります。

たとえば、次のxmlを使用します。

1つのxmlTree（example1）またはタイプ[XmlTree]を提供するすべてのタグ "tables"からすべての行を取得する方法は知っていますが、test2の結果内に矢印example1をマップする方法がわかりません。

当たり前のことだと思いますが、見つかりません。

haskell hxt

2012-06-06T09:54:27.570

0 投票する

1 に答える

979 参照

haskell - Haskell の HXT で Text または ByteString を使用することは可能ですか?

Haskell の XML/HTML 処理ライブラリである HXT には、矢印で DOM ツリーをトラバースおよび操作するための非常に柔軟で強力なメソッドがあると思います。 http://adit.io/posts/2012-04-14-working_with_HTML_in_haskell.html

ただし、HXT には DOM ノードコンテンツの文字列表現しかないようです。 http://hackage.haskell.org/packages/archive/hxt/9.1.6/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode

HXT に ByteString または Text のいずれかを使用することは可能ですか? 主にテキストを使用しているように見えるYesodでHXTを使用しているため、テキストが優先されます。

haskell text web-scraping bytestring hxt

2012-07-08T09:51:32.350

0 投票する

1 に答える

264 参照

xml - Haskell HXT 解析条件

私はこのxmlを解析しようとしています:

下位の "name"-tag = "id" を持つ "<member>" タグのみを解析する方法は?

私は試した：

xml haskell hxt

2012-08-02T09:50:39.150

0 投票する

2 に答える

389 参照

xml - HXT unpickler で XML 属性を無視する

私は、複数のサイトから XML をスクレイピングし、希望する方法でデータを処理することを目的とした小さなアプリケーションを作成しています。私は以前にそのようなアプリケーションを作成しましたが、異なる言語で、Haskell の練習用にこれを書いています。

とにかく、ポイントに。Web で何百万もの XML パーサーを調べた結果、HXT を使用することにしました。ページhttp://www.haskell.org/haskellwiki/HXT/Conversion_of_Haskell_data_from/to_XMLに従って、 XML ファイルを読み取り、それを定義した Haskell データ型に入れているように見えるものに到達しました。これを実現するために、XmlPickler のインスタンスを使用してファイルからデータを読み取ります。このエラーを除いて、うまくいくものにたどり着きました：

すべての属性を処理していないことは承知しています。すべての属性が必要なわけではありません。これらを無視する方法はありますか？すべての属性を処理し、それらを新しいデータ型に入れ、そこから属性を抽出して、実際に必要なデータを取得できると思います。私はこの小さなハックを避けたいので、ここに来て The Proper Way™ を求めています。

仕事に間違ったツールを使用していませんか? サードパーティのデータを unpickle することは安全ではありませんか (Python の場合のように)?

解決策を Web で調べましたが、Text.XML.HXT.Arrow.XmlState.SystemConfigこの動作を無効にするために必要なものがないようです。

xml haskell hxt

2012-08-22T19:59:07.240

0 投票する

1 に答える

166 参照

html - hxtで解析できますか with <a> in it?</h1> <div id="body"><p>I use hxt to parse some html. It hase unescaped html inside <code><textarea></code>. hxt gives invalid results (it stumbles upon a tag with content in t</a> </h3> <div class="s-post-summary--content-excerpt"> </div> <div class="s-post-summary--meta"> <div class="s-post-summary--meta-tags tags js-tags t-cñ t-ûnet t-aspûnet-mvc t-aspûnet-mvc-4 t-actionfilterattribute"> <a href="/tags/html" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">html</a><a href="/tags/haskell" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">haskell</a><a href="/tags/hxt" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">hxt</a> </div> <div class="s-user-card s-user-cardminimal"> <div class="s-user-card--info"> <div class="s-user-card--link d-flex gs4"> </div> </div> <time class="s-user-card--time" style="margin-left:5px;"> <span title="2022-04-18 08:34:11Z" class="relativetime"> 2012-10-01T09:07:35.193</span></time> </div> </div> </div> </div><div id="question-summary-71909431" class="s-post-summary js-post-summary" data-post-id="71909431" data-post-type-id="1"> <div class="s-post-summary--stats js-post-summary-stats"> <div class="s-post-summary--stats-item s-post-summary--stats-itememphasized" title="Score of 0"> <span class="s-post-summary--stats-item-number">0</span> <span class="s-post-summary--stats-item-unit">投票する</span> </div> <div class="s-post-summary--stats-item " title="1 answers"> <span class="s-post-summary--stats-item-number">1</span> <span class="s-post-summary--stats-item-unit">に答える</span> </div> <div class="s-post-summary--stats-item " title="252 views"> <span class="s-post-summary--stats-item-number">252</span> <span class="s-post-summary--stats-item-unit">参照</span> </div> </div> <div class="s-post-summary--content"> <h3 class="s-post-summary--content-title"> <a href="/questions/12750418" class="s-link">xml - XMLでのUnicodeに対するHaskellの態度はどうですか？</a> </h3> <div class="s-post-summary--content-excerpt"> <p>HaskellでUnicodeXMLを処理するための公式の解決策は何か知りたいです。<code>String</code>HXTがテキストに単純な表現（Unicode文字のリスト!!!）を使用していることに気付きました。</p> <p><a href="http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode" rel="noreferrer">http://hackage.haskell.org/packages/archive/hxt/9.3.1.0/doc/html/Text-XML-HXT-DOM-TypeDefs.html#t:XNode</a></p> <p>解析するときに、2つの表現からどのように選択しますか？ユーザーに文字のリストを使用させることは、特にXMLドキュメントに多くのテキストコンテンツが含まれている場合は、特に魅力的な機能のようには思えません。</p> <p>また、 Googleで<a href="http://hackage.haskell.org/package/hxt-unicode" rel="noreferrer">http://hackage.haskell.org/package/hxt-unicode</a>を見つけましたが、解析でどのように使用するのかわかりません。Unicodeのサポートも以前ははるかに明示的でした：http：<a href="http://hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html" rel="noreferrer">//hackage.haskell.org/packages/archive/hxt/8.5.2/doc/html/Text-XML-HXT-DOM-Unicode.html</a> しかし、このモジュール明確な理由なしに最新バージョン（執筆時点では9.3.1.0）で削除されました。その背後にある動機は何でしたか？</p> <p>また、HXTの使用目的のサンプルコードを教えてもらえますか？wikiページはこの点で深刻に欠けています。ありがとうございました。</p> </div> <div class="s-post-summary--meta"> <div class="s-post-summary--meta-tags tags js-tags t-cñ t-ûnet t-aspûnet-mvc t-aspûnet-mvc-4 t-actionfilterattribute"> <a href="/tags/xml" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">xml</a><a href="/tags/haskell" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">haskell</a><a href="/tags/unicode" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">unicode</a><a href="/tags/hxt" class="post-tag flex--item mt0 js-tagname-cñ" title="" rel="tag">hxt</a> </div> <div class="s-user-card s-user-card__minimal"> <div class="s-user-card--info"> <div class="s-user-card--link d-flex gs4"> </div> </div> <time class="s-user-card--time" style="margin-left:5px;"> <span title="2022-04-18 08:34:11Z" class="relativetime"> 2012-10-05T16:32:15.883</span></time> </div> </div> </div> </div> </div> <br class="cbt"> <div class="s-pagination site1 themed pager float-left"> <a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=1" rel="" title="Go to page 2">1</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=2" rel="" title="Go to page 2">2</a><a class="s-pagination--item js-pagination-item is-selected" href="/tags/hxt?p=3" rel="" title="Go to page 2">3</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=4" rel="" title="Go to page 2">4</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=5" rel="" title="Go to page 2">5</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=6" rel="" title="Go to page 2">6</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=7" rel="" title="Go to page 2">7</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=8" rel="" title="Go to page 2">8</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=9" rel="" title="Go to page 2">9</a><a class="s-pagination--item js-pagination-item " href="/tags/hxt?p=10" rel="" title="Go to page 2">10</a></div> </div> <div id="sidebar" class="show-votes" role="complementary" aria-label="sidebar"> <div class="module js-gps-related-tags" id="related-tags"> <h4 id="h-related-tags">Reference</h4> <div data-name="javascript"> <a href="https://php.github.net.cn" class="post-tag no-tag-menu js-gps-track" >php</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">1429865</span> </span> </div> <div data-name="javascript"> <a href="https://c-cpp.com" class="post-tag no-tag-menu js-gps-track" >c/c++</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">756500</span> </span> </div> <div data-name="javascript"> <a href="https://nginx.github.net.cn" class="post-tag no-tag-menu js-gps-track" target="_blank">nginx</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">49975</span> </span> </div> <div data-name="javascript"> <a href="https://mongodb.net.cn" class="post-tag no-tag-menu js-gps-track" >mongodb</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">159057</span> </span> </div> <div data-name="javascript"> <a href="https://mybatis.net.cn" class="post-tag no-tag-menu js-gps-track" >mybatis</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">3233</span> </span> </div> <div data-name="javascript"> <a href="https://anaconda.org.cn" class="post-tag no-tag-menu js-gps-track" >anaconda</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">13410</span> </span> </div> <div data-name="javascript"> <a href="https://pycharm.net.cn" class="post-tag no-tag-menu js-gps-track" >pycharm</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">14671</span> </span> </div> <div data-name="javascript"> <a href="https://python.github.net.cn" class="post-tag no-tag-menu js-gps-track" >python</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">1902243</span> </span> </div> <div data-name="javascript"> <a href="https://vscode.github.net.cn" class="post-tag no-tag-menu js-gps-track" >vscode</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">56040</span> </span> </div> <div data-name="javascript"> <a href="https://dockerdocs.cn" class="post-tag no-tag-menu js-gps-track" >docker</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">110988</span> </span> </div> <div data-name="javascript"> <a href="https://github.net.cn" class="post-tag no-tag-menu js-gps-track" >github</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">49000</span> </span> </div> <div data-name="javascript"> <a href="https://flask.github.net.cn" class="post-tag no-tag-menu js-gps-track" >flask</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">49129</span> </span> </div> <div data-name="javascript"> <a href="https://ffmpeg.github.net.cn" class="post-tag no-tag-menu js-gps-track" >ffmpeg</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">24037</span> </span> </div> <div data-name="javascript"> <a href="https://jmeter.net" class="post-tag no-tag-menu js-gps-track" >jmeter</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">16910</span> </span> </div> <div data-name="javascript"> <a href="https://matplotlib.net" class="post-tag no-tag-menu js-gps-track" >matplotlib</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">63493</span> </span> </div> <div data-name="javascript"> <a href="https://getbootstrap.net" class="post-tag no-tag-menu js-gps-track" >bootstrap</a> <span class="item-multiplier"><span class="item-multiplier-x">×</span> <span class="item-multiplier-count">54641</span> </span> </div> </div> </div> </div> </div> <footer id="footer" class="site-footer js-footer" role="contentinfo"> <div class="site-footer--container"> <div class="site-footer--logo"> <a href="https://stackoverflow.com"><svg aria-hidden="true" class="native svg-icon iconLogoGlyphMd" width="32" height="37" viewBox="0 0 32 37"><path d="M26 33v-9h4v13H0V24h4v9h22Z" fill="#BCBBBB"/><path d="m21.5 0-2.7 2 9.9 13.3 2.7-2L21.5 0ZM26 18.4 13.3 7.8l2.1-2.5 12.7 10.6-2.1 2.5ZM9.1 15.2l15 7 1.4-3-15-7-1.4 3Zm14 10.79.68-2.95-16.1-3.35L7 23l16.1 2.99ZM23 30H7v-3h16v3Z" fill="#F48024"/></svg></a> </div> <nav class="site-footer--nav"> <div class="site-footer--col"> <h5 class="-title"><a href="https://stackoverflow.jp" class="js-gps-track" data-gps-track="footer.click({ location: 3, link: 15})">Stack Overflow 日本語サイト</a></h5> <p>CC BY-SA知識共有ライセンス契約に従う。</p> </div> </nav> </div> </footer> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?709ff2ad9744e86b5b0eee677fc13ede"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>  <script async src="https://www.googletagmanager.com/gtag/js?id=G-1MW5BV8G8E"></script> <script> window.dataLayer = window.dataLayer || []; function gtag(){dataLayer.push(arguments);} gtag('js', new Date()); gtag('config', 'G-1MW5BV8G8E'); </script> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js?client=ca-pub-6117966252207595" crossorigin="anonymous"></script> </body> </html>

問題タブ [hxt]