Evernoteのメモをスケジュールに従ってOutlookにエクスポートするユーティリティを作成しています。Outlook APIにはプレーンテキストが必要であり、EvernoteはプレーンテキストノートのXHTMLドキュメントバージョンを出力します。必要なのは、すべてのタグを取り除き、Evernoteエクスポートファイルに埋め込まれているソースXHTMLドキュメントのエスケープを解除することです。
基本的に私は向きを変える必要があります。
<note>
<title>Test Sync Note 1</title>
<content>
<![CDATA[ <?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE en-note SYSTEM "http://xml.evernote.com/pub/enml.dtd">
<en-note bgcolor="#FFFFFF">
<div>Test Sync Note 1</div>
<div>This i has some text in it</div>
<div> </div>
<div> </div>
<div>and a second line</div>
</en-note>
]]>
</content>
<created>20081028T045727Z</created>
<updated>20081028T051346Z</updated>
<tag>Test</tag>
</note>
の中へ
テスト同期注1 これにはいくつかのテキストがあります と2行目
CDATAセクションを簡単に解析して、4行のテキストだけを取得できますが、divを削除し、エスケープを解除して、そこに潜んでいる可能性のある余分なHTMLを処理する信頼できる方法が必要です。
その仕事をするMSAPIコンボがあると思いますが、私にはわかりません。