0

ブックマークを FF から html ファイルにエクスポートしましたが、大きすぎて複雑なので、Firefox の行をいくつか削除して、より軽量でわかりやすくする必要があります。

Notepad ++の基本的なものを置き換えることができますが、これにはいくつかの演算子が必要であり、正しく機能させる方法がわかりません。

たとえば、以下は Logodesignlove へのリンクを含むファイルの行です。

<A HREF="http://www.logodesignlove.com/" ADD_DATE="1256428672" LAST_MODIFIED="1256428672" ICON_URI="http://www.logodesignlove.com/favicon.ico" ICON="data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAABAAAAAQCAYAAAAf8/9hAAABDUlEQVQ4jWNgGF7gy9a9iS88Yw4803F49a6oYfHn589FGRgYGD4vWZv70iX80HMrv9MfF6zMw6r5Q/ukjkcMUv+R8TNzn+sv/eNPoou/753ZhKL5x8OHSo/Y5P+gK8SFH3Io//j+7Jk8wum79scQqxmGv2zcFQM34Ouhk96kGvBp5cZUuAGfnz8Xfcil8otoA5hl//+8cU8PJRxeJxZtJtaAlz5xJxkYGBhRDPh1/77BQ26V7wQDkFPp+9crN02xRuWnxavL8RrAIvv/8+otWXgT0/vu6ZMfMclgtZmgZrhLlm9MfSKi/Rmm+bm517VvF69ZEKUZBr68fCn+oWNK68cpC+qePXvGRZJmUgAAVs4XULOHB/oAAAAASUVORK5CYII=">Logo Design Love</A>

LAST_MODIFIED="1256428672"、ICON_URI="bunch of digits" ICON="bunch of characters" など、気にしないタグをすべて削除する必要があります。もちろん、すべてのリンクでこれらのタグをすべて削除する必要があります。リストで。

だから私は、「すべてのタグ LAST_MODIFIED="anynumbers" を見つけて、何も置き換えない/削除する」のようなものを使用するように考えていましたが、うまくいきません。

例:
<A HREF="http://www.logodesignlove.com/">Logo Design Love</A>

これまでのところ、Aleksandr のおかげで LAST_MODIFIED と ADD_DATE の行を削除しました。したがって、 LAST_MODIFIED="\d+" は問題なく機能しました。しかし、ICON と ICON_URI はまだ存在します。ICON="\w+" を試しましたが、うまくいきません。スラッシュと関係があると思います。

4

2 に答える 2

1

欲しいものを手に入れてがらくたを捨てる方が簡単なのに、なぜ欲しくないものを探すのですか?

(<A HREF=".*?").*?(>.*?>)

$1$2

Notepad++ に合わせて編集されたコードは、特別な文字をエスケープする必要がないことがわかりました。ありがとうアレクサンドル。

于 2013-01-05T21:08:15.690 に答える
0

正規表現の使用についてよく読んでください (Java 正規表現のチュートリアルは良い出発点ですhttp://docs.oracle.com/javase/tutorial/essential/regex/ )。オンラインの正規表現ツールの 1 つを試して、作成とテストに役立ててください。このようなhttp://gskinner.com/RegExr/

たとえば、正規表現で「LAST_MODIF...」を削除しますLAST_MODIFIED="\d+"

それ以外の場合は、XML 固有のツールが必要になるか、XSL を作成することさえできます。しかし、私はそれについてあまり知りません。

于 2013-01-05T21:01:53.907 に答える