1

すべてのタグを削除したい、ウィキペディアから[show] [Hide]のものを削除したい、またはページをより読みやすい形式にするWebサイトがあります。

ウィキペディアの印刷可能なバージョンを知っていますが、他の用途があるので、その中にタグは必要ありません。したがって、Webページからタグを削除するためのphp / C#のWebサイト、Webサービス、またはコードスニペットについては、元の質問にのみ回答してください。

また、Firefoxからリストをコピーする<li>と、*に置き換えられます。Firefoxに何かを設定して、ある種のような他の読み取り不可能な文字を返すことは可能ですか。

  • ドット

  • 4

    4 に答える 4

    2

    まず、 strip_tags関数を見てみましょう。

    于 2009-11-24T08:23:09.597 に答える
    0

    たとえば、HTML パーサー、BeautifulSoup (Python)、またはSimple HTML DOMを使用できます。または、XML パーサーを使用してみてください。

    于 2009-11-24T10:31:29.743 に答える
    0

    すべてのタグを削除したい、ウィキペディアから [表示][非表示] を削除したい、またはページをより読みやすい形式にする Web サイトはありますか。

    DBpedia、Wikipedia を参照する必要がありますが、データだけを参照してください。

    http://dbpedia.org/概要

    于 2009-11-24T09:06:09.667 に答える
    -1

    htmlagilitypackはどうですか

    htmlagilitypackt

    stackoverflowで利用可能な同様のスレッド

    ウィキペディアAPIはありますか?

    この機能を試してください。

    Dim pattern As String = "<(.|\n)*?>"
    Return System.Text.RegularExpressions.Regex.Replace(strHtmlString, pattern, String.Empty).Trim()
    
    于 2009-11-24T08:44:12.250 に答える