0

私はここstackoverflowで、大きなテキスト内の文字列部分をどのように検索できるかを調べてきました。しかし、Java を使用してスクリプト内の属性の特定の値を取得する方法を見つけることができませんでした。目的は、ファイル (スクリプト) を 1 行ずつ読み取り、属性 "src" の値を抽出することです。

たとえば、ファイルには次の構造を含む多くの行があります。

<script src="js/vendor/modernizr-2.6.2.min.js"></script>
<script data-main="js/" src="js/require.min.js"></script>
<script data-main="js/" src="js/main.js"></script>
<script src="js/vendor/modernizr-2.6.2.min.js"></script>
<script data-main="js/" src="js/require.min.js"></script>

したがって、Javaを使用してクラスを使用してこの方法でファイルを読み取り、各行BufferedReaderの「src」の値を取得したい、たとえば、最初の行では取得したい: js/vendor/modernizr-2.6.2.min.js、2行目では取得したいjs/require.min.jsなど、正規表現を使用するなどのいくつかの提案を見ましたが、この場合に最も効果的かどうかはわかりません:

public Helper(String scriptPath) {
        File scriptFile = null;
        try {
            scriptFile = new File(scriptPath);
            String relativePath = scriptFile.getParent();
            System.out.println(relativePath);
            BufferedReader reader = new BufferedReader(new FileReader(scriptFile));
            String readLine;

            while ((readLine = reader.readLine()) != null) {
                // How to match the src?
            }

            reader.close();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

誰かが私を助けてくれたら、本当に感謝します。または、これに対する答えがすでにあることを誰かが知っている場合は、これを閉じるために知らせてください。まだ問題のようなもの。

事前にどうもありがとうございました。

4

1 に答える 1

0

あなたのファイルは、Html パーサーの使用を検討する html のように見えます。 http://jsoup.org/は CSS のようなセレクターで非常に使いやすい

于 2013-04-29T12:57:30.107 に答える