1

読みたい次のxmlがあります。

  1. 中国語 xml - https://news.google.com/news/popular?ned=cn&topic=po&output=rss
  2. 韓国語 xml - http://www.voanews.com/templates/Articles.rss?sectionPath=/korean/news

現在、漢字を含むxmlで解析するためにluaxmlを使用しようとしています。ただし、コンソールを使用して印刷すると、漢字が正しく印刷されず、文字化けとして表示されます。

とにかく中国語または韓国語の文字を解析して lua テーブルにする方法があるかどうかを尋ねたいですか?

4

2 に答える 2

0

「ä¸ç¾Ž」を漢字に変換できました。このリンクからこのメソッドを使用して一連の文字列をすべて変換する必要がある追加の手順を 1 つ実行する必要があります。 xml 形式。

string.gsub(l,"&#([0-9]+);", function(c) return string.char(tonumber(c)) end)

LuaXML をお願いしたいのですが、このメソッド xml.registerCode(decoded,encoded) に遭遇しました

その方法の下で、それは言う

registers a custom code for the conversion between non-standard characters and XML character entities

非標準文字とは何を意味し、どのように使用するのですか?

于 2012-05-09T12:06:10.620 に答える
0

ここでLuaが問題になるとは思いません。リモート サイトが送信する生データは UTF-8 を使用してエンコードされており、Lua はそれを特別に解釈しません。つまり、(1) リモート サイトから読み取り、(2) 読み取りデータを保存するだけであれば、データは完全に保存されるはずです。ファイルに。ファイル内のデータには、リモート サイトが送り返すのと同じように、UTF-8 でエンコードされた CJK 文字が含まれます。

あなたが言及したような面白い結果が得られた場合、おそらくリモート サイトから読み取るために使用しているライブラリに問題があるか、コンソールに出力したときに結果をコンソールに表示する方法に問題がある可能性があります。

于 2012-05-09T04:11:52.140 に答える