0

PHPを使用して、テキストの段落のJSON表現を作成し、リンク/フォーマットなどに関する情報を保持しようとしています。

基本的に、私はこの文字列を変換したいと思います:

"Hello <a href='www.google.com'>World!</a>.  How are <b>you</b> today?"

これらの7つのJSONオブジェクトに:

"1": {
    "_id": "1",
    "_type": "TEXT",
    "value": "Hello "
},
"2": {
    "_id": "2",
    "_type": "TEXT",
    "value": "World!",
    "_attributes": {
        "3": {
            "_id": "3",
            "_type": "LINK",
            "src": "www.google.com"
        }
    }
},
"4": {
    "_id": "4",
    "_type": "TEXT",
    "value": " How are "
},
"5": {
    "_id": "5",
    "_type": "TEXT",
    "value": "you",
    "_attributes": {
        "6": {
            "_id": "6",
            "_type": "FORMATTING",
            "bold": true,
        }
    }
},
"7": {
    "_id": "7",
    "_type": "TEXT",
    "value": " today?"
}

私はインターネット/グーグルを探して、HTMLを分割することについてたくさん見つけましたが、私が欲しいものを説明することができないようです。リンク/フォーマットからプレーンテキストを分離し、それぞれに単一のエンティティを作成する必要があります。

「FORMATTING」属性は、必要に応じて「太字」/「下線」/「添え字」などのフィールドを追加するだけです。

ネストされたタグは、テキストエンティティに複数の属性を作成するだけです。

1つの単語が太字になっている2単語のハイパーリンクをどのように処理するかはまだわかりません...おそらく2つのハイパーリンク属性が必要になるでしょう。

どんな助けでも大歓迎です!!

4

1 に答える 1

0

A DOMDocument is what you need. If you can live with slightly different names, you barely have to do any work, too.

于 2012-11-02T06:03:14.897 に答える