0

特定のURLのタグを識別しようとしています。

タグ指定の慣例はありますか?一般的な使用法に基づくヒューリスティックはありますか?

コンテンツを分類するインサイトタグを指します。たとえば、各TC記事では、最後に「タグ」セクションを見つけることができます。ほとんどのコンテンツサイトにも同じことが言えます。

4

1 に答える 1

1

私はあなたの質問を理解したと思います. 質問の最後にあるように、「html」「regex」などのタグを参照していると思います。

rel="xyz"理論的には、ページは タグ リンクに を使用すると想定できます。Stackoverflow はそれを行っており、私が知っている他のいくつかのサイトもそれを行っています。

http://microformats.org/wiki/rel-tag

しかし、私はそれが非常に信頼できるとは思わない. 「必須」はなく、そのようなタグは保証されていません。

とにかく、それを試してコンテンツを解析したい場合は、ゼロから行うことはお勧めしません。たとえば、 Jsoupは非常に洗練されたライブラリで多くの機能を提供します。特定の属性を持つリンク タグを見つけることもできます。

于 2012-07-28T16:41:08.567 に答える