Dive Into Accessibility のIdentifying your language ページでは、doctype に応じて、できるだけ多くのスクリーン リーダーを処理できるように、できるだけ多くを追加することをお勧めします。
HTML 4 のバリアントを使用している場合は、タグを次のように変更します (英語でない場合は独自の言語コードを使用してください)。
<html lang="en">
XHTML 1.0 のバリアントを使用している場合は、タグを次のように変更します (両方の場所で言語コードを使用してください)。
<html xmlns="http://www.w3.org/1999/xhtml" lang="en" xml:lang="en">
XHTML 1.1 を使用している場合は、タグを次のように変更します (ここでも独自の言語コードを挿入します)。
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en">
同じ記事では、 ISO 639.2も参照して xml:lang の値がどうあるべきかを判断していますが、XML 仕様では別のドキュメントRFC4646 Best Current Practice - Tags For Identifying Languagesが参照されていますが、これは「en-GB」の値を示しているようです。有効です。
Google のWeb Authoring Statistics (2005) には、それについて次のように書かれています。
次は Content-Language 値です (http-equiv 属性で使用されます)。html 要素で lang 属性を指定するのとほぼ同じくらい多くの人がこれを使用します。HTML5 仕様では、現在 http-equiv 属性は、上のグラフが示すように、実際には削除できない文字エンコーディングを設定する 1 つのケースに対してのみ許可されています。ただし、http-equiv="Content-Language" は少なくとも 1 つのブラウザーでサポートされており、ここでわかるように広く使用されています。
さらに、webproworld のスレッドでは、ドキュメントの言語を記述するために http-equiv=content-language と name=language を使用することの違いについて話し、両方が必要であることを暗示しています。
最後に、W3C のHTML Techniques for Web Content Accessibility Guidelines 1.0ドキュメントを参照して、その他の推奨事項、具体的には Identitying the Primary Languageを参照してください。
結論として、スクリーン リーダーはコンテンツ言語のメタ情報よりも lang 属性を見ているように見えますが、私が見たほとんどの推奨事項では、とにかくメタ データを使用することを勧めています。特に Google の統計は適切なように思われるので、おそらく両方を残した方がよいでしょう。