-5
    HTML 1  I m getting this in string ->

    S=        
           "<html>  <head> <link rel='stylesheet' type='text/css'
             href='http://www.taxmann.com/css/taxmannstyle.css' /> 
                 </head>  <body ><html>
                <body style='background-color:Black;font-size:30px;color:#fff;'>
        <div id=\"digest\">\r\n   
                   <p class=\"threedigest\">ST : Extended period of limitation 
                cannot be invoked for not paying tax if there was divergence 
        of opinion during relevant 
                period and 
                some judgments were in favour of assessee, 
                as there could be no suppression/wilful mis-statement
         by assessee</p>\r\n   
                 </div></body></html></body></html>"

注:正しいHTMLを取得しています

BUT    String HTML 2 ->

            "<html> 
                     <head> <link rel='stylesheet
                    ' type='text/css' href='http://www.taxmann.com/css/taxmannstyle.css' /> 
                     </head>  <body ><html><body style='background-color:Black;font-size:30px;color:#fff;'>
                    <html>\r\n<head>
                    <link href='http://www.taxmann.com/TaxmannWhatsnewService/Styles/style.css' rel='stylesheet' type='text/css' />
                    \r\n<title>Rs.560-crore tax evasion detected</title>\r\n<style type=\"text/css\">
            \r\nbody
                    {font-family:Arial, Helvetica, sans-serif; font-size:12px; 
                line-height:18px;text-align:justify;}
                    \r\n.w100{width:100%;}\r\n.fl-l{float:left;}\r\n.ffla{font-family:Arial, 
                Helvetica, sans-serif;}
                    \r\n.fs18{font-size:18px;}\r\n.mart10{margin-top:10px;}\r\n.fcred{color:#c81616;}
                \r\n.tc{text-align:center;}\r\n.tu{text-transform:uppercase;}\r\n.lh18{line-height:18px;}\r\n</style>\r\n</head>\r\n<body>\r\n
                <div class=\"w100 fl-l\">\r\n<div class=\"w100 fl-l ffla fs18 mart10 fcred ttunderline tc tu\">
                    Rs.560-crore tax 
vasion detected</div>\r\n\r\n<div class=\"w100 fl-l lh18 mart10\">
                The Central Excise Intelligence, 
Chennai Zone, has detected 164 cases involving excise
                 and service tax evasion of Rs.560 crore in 2012- 13.
     A total of 166 show cause notices
                 have been issued involving Rs.500 crore for 
    various central excise and service 
                tax cases during the year.
 – www.business-standard.com</div>\r\n\r\n
            </div>\r\n</body>\r\n
                    </html>\r\n</body>
    </html></body>
    </html>"

Html1 形式と同じ HTML2 形式を変換したい いろいろ試しましたができませんでした。一部の HTML コンテンツも削除しようとしましたが、うまくいきませんでした。Html2 を Html1 と同じように変換する方法がわかりません Java を使用してこれを削除しようとしましたが、できません 助けてください! 任意のプログラミング言語で置換または削除コマンドを使用します。

4

1 に答える 1