たとえば、クアッドコアコンピューターを使用することの利点は、全体的に増加していると思います。しかし、通常の日常的なコンピューティングのどの段階でこれが起こっているのか、私は疑問に思っています。
行列乗算 (並列コンピューティングの "Hello World") を行う C コードを記述した場合、システムのコンパイラは 4 つのコアすべてに対してこれを最適化する方法を自動的に認識しますか? または、4 つのコアすべてを利用するには、プログラムで明示的に複数のスレッドを作成する必要がありますか?
基本的に私が知りたいのは、プログラムが自動的に並列化される量と、スケジューラーが異なるコアに送信する複数のスレッドを作成することでプログラマーが最適化できる量です。