parsing - 選択方法
nodejsでcheerio.jsを使用して、XBRLからエントリのテキスト(この場合は「10-Q」)を取得しようとしています。行は以下のとおりです。

`<dei:DocumentType contextRef="D2013Q3YTD" id="Fact-DB2A50C2A485F9CC21`

Question

nodejsでcheerio.jsを使用して、XBRLからエントリのテキスト(この場合は「10-Q」)を取得しようとしています。行は以下のとおりです。

<dei:DocumentType contextRef="D2013Q3YTD" id="Fact-DB2A50C2A485F9CC21D51934C6E61D42">10-Q</dei:DocumentType>

私はもう試した：

$('dei:DocumentType').text

そして他のいくつかは役に立たなかった。私が見ることができる一意のIDやその他のものはありません。

サンプルファイル:

http://www.sec.gov/Archives/edgar/data/1018724/000144530513002495/amzn-20130930.xml

では、このテキストを抽出するにはどうすればよいでしょうか。ありがとう。

score 5 · Accepted Answer

上記のファイルの解析は Cheerio で非常に可能であることがわかりました。

これは Cheerio を使用して動作します。

$('dei\\:CurrentFiscalYearEndDate').text().trim();

明らかに、特殊文字を2 回エスケープする必要があります。

parsing - 選択方法 nodejsでcheerio.jsを使用して、XBRLからエントリのテキスト(この場合は「10-Q」)を取得しようとしています。行は以下のとおりです。