PHPを使用して、テキストの段落のJSON表現を作成し、リンク/フォーマットなどに関する情報を保持しようとしています。
基本的に、私はこの文字列を変換したいと思います:
"Hello <a href='www.google.com'>World!</a>. How are <b>you</b> today?"
これらの7つのJSONオブジェクトに:
"1": {
"_id": "1",
"_type": "TEXT",
"value": "Hello "
},
"2": {
"_id": "2",
"_type": "TEXT",
"value": "World!",
"_attributes": {
"3": {
"_id": "3",
"_type": "LINK",
"src": "www.google.com"
}
}
},
"4": {
"_id": "4",
"_type": "TEXT",
"value": " How are "
},
"5": {
"_id": "5",
"_type": "TEXT",
"value": "you",
"_attributes": {
"6": {
"_id": "6",
"_type": "FORMATTING",
"bold": true,
}
}
},
"7": {
"_id": "7",
"_type": "TEXT",
"value": " today?"
}
私はインターネット/グーグルを探して、HTMLを分割することについてたくさん見つけましたが、私が欲しいものを説明することができないようです。リンク/フォーマットからプレーンテキストを分離し、それぞれに単一のエンティティを作成する必要があります。
「FORMATTING」属性は、必要に応じて「太字」/「下線」/「添え字」などのフィールドを追加するだけです。
ネストされたタグは、テキストエンティティに複数の属性を作成するだけです。
1つの単語が太字になっている2単語のハイパーリンクをどのように処理するかはまだわかりません...おそらく2つのハイパーリンク属性が必要になるでしょう。
どんな助けでも大歓迎です!!