特定のURLのタグを識別しようとしています。
タグ指定の慣例はありますか?一般的な使用法に基づくヒューリスティックはありますか?
コンテンツを分類するインサイトタグを指します。たとえば、各TC記事では、最後に「タグ」セクションを見つけることができます。ほとんどのコンテンツサイトにも同じことが言えます。
特定のURLのタグを識別しようとしています。
タグ指定の慣例はありますか?一般的な使用法に基づくヒューリスティックはありますか?
コンテンツを分類するインサイトタグを指します。たとえば、各TC記事では、最後に「タグ」セクションを見つけることができます。ほとんどのコンテンツサイトにも同じことが言えます。
私はあなたの質問を理解したと思います. 質問の最後にあるように、「html」「regex」などのタグを参照していると思います。
rel="xyz"
理論的には、ページは タグ リンクに を使用すると想定できます。Stackoverflow はそれを行っており、私が知っている他のいくつかのサイトもそれを行っています。
http://microformats.org/wiki/rel-tag
しかし、私はそれが非常に信頼できるとは思わない. 「必須」はなく、そのようなタグは保証されていません。
とにかく、それを試してコンテンツを解析したい場合は、ゼロから行うことはお勧めしません。たとえば、 Jsoupは非常に洗練されたライブラリで多くの機能を提供します。特定の属性を持つリンク タグを見つけることもできます。