短くて簡単なシステム ユーザビリティ スケール(SUS) は、Tullis と Stetson (2004)によって、有名な QUIS を含む他の主観的なスケールよりも心理測定的に優れていることがわかりました。ほとんどの SUS 項目は、効率性のためのいくつかとともに、学習可能性または記憶可能性に関連しているようです。ただし、サブスケールに分割しようとはしません。すべての項目は高度に相互相関しており、このスケールが単一の基礎となる構造を測定していることを示唆しています。
ニールセンの各次元を個別に測定するスケールを入手できるとは思えません。ユーザーは製品が「使いにくい」かどうかを判断できますが、それをさらに分解するのははるかに困難です。彼らは何かをするのに大変な労力がかかることを知っていますが、それはもっと簡単な方法 (学習可能性) を見つけられなかったからでしょうか? それとも、前のタスクでより良い方法を学んだのに、それを忘れてしまったのでしょうか (記憶力)? それとも、それはあるべき姿ですか(効率)?ユーザーは、区別するのに十分な情報を持っていません。
ニールセンの各次元に特に関心がある場合は、それらを個別に直接評価してください。エラーの数やクリック間の時間を記録することで、学習可能性を大まかに測定できます。正確には、ユーザーが規範的な対話シーケンスを学習するのに必要な試行回数によって測定できます。効率を高めるために、規範的な対話シーケンスを行うようにユーザーをトレーニングした後、それを行うのにかかった時間を記録します。また、GOMS-KLM などを使用して分析的にかなり良い答えを得ることができます。覚えやすいように、1 週間ほど後に同じユーザーを集めて、そのパフォーマンスを効率測定トライアルのパフォーマンスと比較します。
ほぼすべての主観的尺度と同様に、SUS は主に、さまざまな製品の全体的な主観的経験を比較するのに役立ちます。比較するものがなければ、単一のスコアから何を作るかを知るのは困難です。これらの尺度では、製品に具体的にどのような問題があるか、またその理由はわかりません (たとえば、改善点を判断するのに役立ちます)。そのためには、テスト参加者の定性的な観察と報告が最適です。