私は通常、死んだ馬を殴り続けることはありませんが、他の質問を解決するためのベクトル化されていないアプローチには、物事が大きくなったときにいくつかのメリットがあります。実際に係数行列を一度に1項目ずつ埋めていたので、COOのスパース行列形式に変換するのは非常に簡単で、効率的にCSCに変換して解決できます。以下はそれを行います:
import scipy.sparse
def sps_solve(n) :
# Solution vector is [N[0], N[1], ..., N[n - 2], M[1], M[2], ..., M[n - 1]]
n_pos = lambda p : p
m_pos = lambda p : p + n - 2
data = []
row = []
col = []
# p = 0
# n * N[0] + (1 - n) * M[n-1] = n
row += [n_pos(0), n_pos(0)]
col += [n_pos(0), m_pos(n - 1)]
data += [n, 1 - n]
for p in xrange(1, n - 1) :
# n * M[p] + (1 + p - n) * M[n - 1] - 2 * N[p - 1] +
# (1 - p) * M[p - 1] = n
row += [m_pos(p)] * (4 if p > 1 else 3)
col += ([m_pos(p), m_pos(n - 1), n_pos(p - 1)] +
([m_pos(p - 1)] if p > 1 else []))
data += [n, 1 + p - n , -2] + ([1 - p] if p > 1 else [])
# n * N[p] + (1 + p -n) * M[n - 1] - p * N[p - 1] = n
row += [n_pos(p)] * 3
col += [n_pos(p), m_pos(n - 1), n_pos(p - 1)]
data += [n, 1 + p - n, -p]
if n > 2 :
# p = n - 1
# n * M[n - 1] - 2 * N[n - 2] + (2 - n) * M[n - 2] = n
row += [m_pos(n-1)] * 3
col += [m_pos(n - 1), n_pos(n - 2), m_pos(n - 2)]
data += [n, -2, 2 - n]
else :
# p = 1
# n * M[1] - 2 * N[0] = n
row += [m_pos(n - 1)] * 2
col += [m_pos(n - 1), n_pos(n - 2)]
data += [n, -2]
coeff_mat = scipy.sparse.coo_matrix((data, (row, col))).tocsc()
return scipy.sparse.linalg.spsolve(coeff_mat,
np.ones(2 * (n - 1)) * n)
もちろん、TheodorosZellekeのように、ベクトル化されたブロックから構築するよりもはるかに冗長ですが、両方のアプローチの時間を計ると、興味深いことが起こります。

まず、これは(非常に)素晴らしいことです。スパースアプローチを使用することから予想されるように、時間は両方のソリューションで直線的にスケーリングしています。しかし、私がこの回答で示した解決策は常に高速であり、sが大きいほど高速n
です。楽しみのために、他の質問からのTheodorosZellekeの密なアプローチのタイミングも調整しました。これにより、両方のタイプのソリューションのさまざまなスケーリングを示すこの素晴らしいグラフが得られ、非常に早い段階で、どこかでn = 75
、ここでのソリューションを選択する必要があります。

scipy.sparse
LIL形式のスパース行列の使用を強く疑っていますが、2つのスパースアプローチの違いを実際に理解するのに十分な知識はありません。TheodorosZellekeの回答をCOO形式に変換することにより、コードはかなりコンパクトになりますが、パフォーマンスがわずかに向上する可能性があります。しかし、それはOPの演習として残されています!