CAT から R にデータをエクスポートする方法について、Solomon Messing のチュートリアル (以下のリンクを参照) を使用して大成功を収めました。しかし、3/4 のコーダーだけがデータセットのコーディングを完了すると、問題が発生します。すべてのコーダーによってコーディングされていないドキュメントを削除しても、R は XML ファイルを解析できないようです。私の推測では、CAT からの XML ファイルは最初の数のドキュメントとコーダー用に設定されているため、ドキュメントとコーダーが削除されると、R スクリプトは互換性がなくなります。XML ファイルを変更したり、特定のコーダーによるコーディングを削除したりする方法はありますか? コンソール出力は次のようになります。
doc <- xmlInternalTreeParse(doc, asText=T)
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
xmlParseCharRef: 無効な xmlChar 値 0
エラー: 1: xmlParseCharRef: 無効な xmlChar 値 0
2: xmlParseCharRef: 無効な xmlChar 値 0
3: xmlParseCharRef: 無効な xmlChar 値 0
4: xmlParseCharRef: 無効な xmlChar 値 0
5: xmlParseCharRef: 無効な xmlChar 値 0
6: xmlParseCharRef: 無効な xmlChar 値 0
http://solomonmessing.wordpress.com/2013/02/04/cat-r-for-content-analysislabels-for-text-mining/