0

Epubファイルを読み、タグを検索して見つける方法を知っている人はいますか?私はVB.Netを使用していますが、EPubの読み方がわかりません。

または、特定のファイルを解凍または抽出するのを手伝ってください

これらは私のコードです

Dim ZipToUnpack As String = txtPath.Text
Dim TargetDir As String = txtTXT.Text
Console.WriteLine("Extracting file {0} to {1}", ZipToUnpack, TargetDir)
Using zip1 As ZipFile = ZipFile.Read(ZipToUnpack)
'AddHandler zip1.ExtractProgress, AddressOf MyExtractProgress
Dim a As ZipEntry
For Each a In zip1
a.Extract(TargetDir, ExtractExistingFileAction.OverwriteSilently)
Next
MsgBox("Done")
getFiles()
End Using


For j As Integer = 0 To ListView1.Items.Count - 1
Dim k As StreamReader = New StreamReader(New FileStream(Path.Combine(ListView1.Items(j).Tag, ListView1.Items(j).Text), FileMode.Open, FileAccess.Read, FileShare.Read))
k.ReadLine()

次のステップで、すべてのhtmlを読み取り、imgタグをカウントする方法を教えてください。

4

1 に答える 1

1

言語に依存しない方法で実行したい手順:

  1. .epubファイルを解凍します

  2. META-INF / container.xmlファイルを読み取り、rootfileタグを見つけます。これにより、パッケージの内容を宣言する.opfファイルの場所がわかります。(これをcontent.opfと呼びますが、別の名前が付けられている場合があります。)

  3. content.opf(これもXMLです)を読み取って解析し、<manifest>セクション内のすべてのファイルとパスのリストを作成します。これは、パッケージ内のすべてのファイルのリストです。

  4. そのマニフェストリスト内の各.xhtmlファイル(つまり、メディアタイプが「application / xhtml + xml」のファイル)について、HTMLを解析し、<img>タグを探します。

于 2012-10-23T01:06:22.367 に答える