HTMLドキュメントのテーブルセルにコンマ区切りのリストがありますが、リスト内のいくつかの項目がリンクされています。
<table>
<tr>
<td>Names</td>
<td>Fred, John, Barry, <a href="http://www.example.com/">Roger</a>, James</td>
</tr>
</table>
私は美しいスープを使用してhtmlを解析してきましたが、テーブルにアクセスできますが、それを分割してデータ構造を返すための最良の方法は次のようになります。
[
{'name':'Fred'},
{'name':'John'},
{'name':'Barry'},
{'name':'Roger', 'url':'http://www.example.com/'},
{'name':'James'},
]