0 投票する

1 に答える

2221 参照

opengl - nvEncRegisterResource() が -23 で失敗する

NVEnc を使用して OpenGL フレームを H264 としてストリーミングしようとして、完全なレンガの壁にぶつかりました。私はこの特定の問題に8時間近く取り組んできましたが、何の進展もありませんでした。

問題はへの呼び出しnvEncRegisterResource()です。コード -23 で必ず失敗します (enum 値 NV_ENC_ERR_RESOURCE_REGISTER_FAILED、「リソースの登録に失敗しました」と記載されています - NVidia に感謝します)。

私はオスロ大学のこのドキュメント(54 ページ、「OpenGL 相互運用」) で概説されている手順に従おうとしているので、残念ながらこのドキュメントではコード自体が提供されていませんが、これが機能するはずであるという事実を知っています。 .

アイデアはかなり単純です。

OpenGL フレームバッファオブジェクトによって生成されたテクスチャを CUDA にマップします。
テクスチャを (以前に割り当てられた) CUDA バッファにコピーします。
そのバッファを NVEnc 入力リソースとしてマップします
その入力リソースをエンコードのソースとして使用します

私が言ったように、問題はステップ（3）です。関連するコードスニペットを次に示します (簡潔にするために、エラー処理は省略しています)。

これにより、デバイス上の CUDA メモリが割り当てられるはずです (「ピッチ付き」の種類ですが、ピッチなしも試しましたが、結果は変わりません)。

これがレンガの壁です。何をしようとしても、nvEncRegisterResource()失敗します。

私は、必要な初期化をすべて行ったと考えています (間違っているかもしれませんが)。CUDA コンテキストを作成してアクティブ化するコードは次のとおりです。

.. エンコーディングセッションの作成が続きます。

最後に、エンコーダーを初期化するコード:

上記の初期化はすべて成功を報告します。

このハードルを乗り越えてくれる人には本当に感謝しています。

編集:問題を再現するための完全なコードは次のとおりです。元のコードとの唯一の違いは、cuPopContext()ここでエラー (無視できます) を返すことです。おそらく、私の元のプログラムは、OpenGL を使用することの副作用として、このようなコンテキストを作成します。それ以外の場合、コードは元のコードとまったく同じように動作します。Visual Studio 2013 でコードをビルドしました。次のライブラリファイルをリンクする必要があります (C: でない場合はパスを調整します)。C:\Program Files (x86)\NVIDIA GPU Computing Toolkit\CUDA\v7.5\lib\Win32\cuda.lib

C:\Program Files (x86)\NVIDIA GPU Computing Toolkit\CUDA\v7.5\include\また、 (または類似の) がインクルードパスにあることを確認する必要があります。

新しい編集: ランタイム API と混合する代わりに、CUDA ドライバーインターフェイスのみを使用するようにコードを変更しました。それでも同じエラーコードです。

2015-10-03T15:07:44.710

0 投票する

1 に答える

6335 参照

video - NVidia NVEnc ハードウェアエンコーダを使用して UDP 経由で H.264 ビデオをストリーミングする方法は?

これは自己回答型の質問になるでしょう。なぜなら、丸 1 週間にわたって私は気が狂ってしまったからです。私が経験したフラストレーションを仲間のプログラマーに惜しみなく与えたいと思っています。

状況は次のとおりです: NVidia の NVEnc ハードウェアエンコーダー (Kepler および Maxwell カード、つまりそれぞれ GT(x) 7xx および GT(x) 9xx で使用可能) を使用して、グラフィックスアプリケーションの出力を UDP 経由でストリーミングしたいと考えています。これは取るに足らない方法ではありませんが、NVEnc にはビデオメモリに直接アクセスする機能があるため、エンコーディングステージの後まで、ビデオメモリからシステムメモリにフレームを「ダウンロード」する必要がなくなるため、非常に効率的です。

NVEncの出力バッファをフレームごとに書き込むだけで.h264ファイルを生成する限り、私はすでにこの作業を行うことができました。VLC は、タイミングがずれていたことを除いて、そのようなファイルの再生に問題はありませんでした (デバッグ目的でのみそのファイルが必要だったので、これを修正しようとしませんでした)。

エンコードされたフレームを UDP 経由でストリーミングしようとしたときに問題が発生しました。VLC も MPlayer もビデオをレンダリングできませんでした。それには 2 つの理由があることがわかりました。これについては、私の回答で説明します。

video h.264 nvidia video-encoding nvenc

2015-10-17T11:13:43.437

0 投票する

1 に答える

2743 参照

ffmpeg - ffmpeg nvenc GPU メモリ使用量

Ubuntu のNVIDIA QUADRO K4200でビデオをトランスコードしています( ffmpeg バージョンは 2.7.1、NVENC SDK 5.0.1 です)。1 つのストリームの GPU メモリ使用量は 100 MB です。nvidia-smi コマンドの出力を参照してください。

しかし、 NVIDIA GTX 980 TI ( ffmpeg バージョンは 3.0、NVENC SDK 5.0.1) を搭載した別のコンピューターで同じ ffmpeg パラメーターを使用して同じトランスコーディングプロセスを実行すると、 1 つのストリームの GPU メモリ使用量は 170 MB になります。以下のスクリーンショットをご覧ください。

なぜメモリ使用量にこのような違いがあるのでしょうか? QUADRO K4000 のように、GTX 980 TI の GPU メモリ使用量を 1 回のトランスコードプロセスで 100MB に減らすことはできますか?

ffmpeg gpu nvidia transcoding nvenc

2016-03-04T08:48:32.990

0 投票する

1 に答える

866 参照

opengl - 計算段階と CUDA によるデータアクセスの間でメモリバリアが同期に失敗する

次のパイプラインがあります。

カスタム FBO へのテクスチャアタッチメントにレンダリングします。
そのテクスチャアタッチメントをイメージとしてバインドします。
imageLoad/Store を使用して、上記の画像からコンピューティングシェーダーサンプリングを実行します。
結果を SSBO またはイメージに書き込みます。
SSBO (または画像) を CUDA CUgraphicsResourceとしてマップし、CUDAを使用してそのバッファーからのデータを処理します。

さて、問題はステージ 4 と 5 の間のデータの同期にあります。私が試した同期ソリューションは次のとおりです。

glFlush - すべてのコマンドの実行の完全性を保証しないため、実際には機能しません。

glFinish - これは機能します。ただし、ドライバーに送信されたすべてのコマンドをファイナライズするため、お勧めしません。

ARB_sync ここでは、パフォーマンスに大きく影響するため、推奨されないと言われています。

glMemoryBarrierこれは興味深いものです。しかし、それは単に機能しません。

コードの例を次に示します。

また、試しました：

コードの実行は次のようになります。

さらに、計算を起動する前にコンテキストから FBO とテクスチャのバインドを解除しようとしglMemoryBarrierました。それらの間にセットを置いて次々と計算を起動し、最初の計算起動からターゲットイメージを CUDA にフェッチすることさえ試みました。まだ同期していません。(まあ、2 つの計算が互いに同期していないので、これは理にかなっています)

計算シェーダー段階の後。同期しない！glFinish、またはパイプラインを完全に失速させる他の操作に置き換えた場合のみ。glMapBuffer()たとえば、のように。

それでは、glFinish() を使用する必要がありますか、それともここに何かが欠けていますか? CUDA が制御を引き継ぐ前に glMemoryBarrier() が計算シェーダーの動作を同期しないのはなぜですか?

アップデート

元の質問がかなり古いので、質問を少しリファクタリングしたいと思います。それにもかかわらず、最新の CUDA および Video Codec SDK (NVENC) を使用しても問題は解決していglMemoryBarrierません。したがって、同期しない理由は気にしません。私が知りたいのは：

レンダリングパイプライン全体 (私の場合は OpenGL イメージ) を停止することなく、OpenGL コンピューティングシェーダーの実行を CUDA の共有リソースの使用と同期させることができる場合。
答えが「はい」の場合、どのように？

opengl cuda nvenc

2016-06-01T12:45:48.357

0 投票する

1 に答える

2496 参照

ffmpeg - NVENC コーデックを使用した 60 fps での FFmpeg によるデスクトップグラビング

最新の Windows でコンパイルされた FFmpeg と NVENC コーデックを使用してデスクトップを 60FPS で記録するのに問題があります。メタデータによると、ファイルは 60 fps ですが、再生すると 60 FPS ではないことがはっきりとわかります。

私が使用するコマンドラインは次のとおりです。

リアルタイムバッファを使用したり、別の DirectShow デバイスを使用したり、プロファイルを変更したり、ビットレートを強制したりしてみましたが、ビデオは常に 30fps のようです。

NVIDIA の ShadowPlay を使用した画面の記録はうまく機能するので、私のマシンで実行可能であることはわかっています。

FFprobe を使用して ShadowPlay の出力ファイルを確認すると、次のことがわかります。

ストリーム #0:0(und): ビデオ: h264 (高) (avc1 / 0x31637661), yuv420p(tv, smpte170m/smpte170m/bt470m), 1920x1080 [SAR 1:1 DAR 16:9], 4573 kb/s, 59.38 fps、240 tbr、60k tbn、120 tbc (デフォルト)

しかし、出力に同じビットレートとプロファイルを強制すると、次のようになります。

ストリーム #0:0(und): ビデオ: h264 (高) (avc1 / 0x31637661)、yuv420p、1920x1080 [SAR 1:1 DAR 16:9]、5519 kb/s、60 fps、60 tbr、15360 tbn、120 tbc (デフォルト)

私は見ることができ、異なっtbrてtbnいるので、出力がフレームを複製していることがわかります。

テストのために、すべての録画の背景にこの 60 フレームレートのテストページがあり、違いがはっきりとわかりました。

ShadowPlay はおそらく、同じコーデックを使用する FFmpeg よりも内部で多くのことを行うことを知っています。OBS で簡単に実行できることはわかっていますが、何が間違っているのかを理解したいと思います。多分それはFFmpegの制限ですか？

完全なコンソール出力

-v trace コマンドの使用:

ffmpeg nvenc

2016-07-05T11:21:00.423

0 投票する

1 に答える

423 参照

c++ - HVEC を使用した Nvidia NvEnc により Div by Zero が発生する

Nvidias NvEnc API を使用してハードウェアエンコーダーを構築しようとしています。この API は、任意のデータをエンコードするために、H264 と HEVC の 2 つのコーデックを使用します。したがって、最初に 2 つのコードのいずれかを選択し、その後、エンコードセッションを構成するか、さまざまなプリセットのいずれかを使用する必要があります。Nvidias NvEnc Programming Guideで説明されているようにやっています。

HVECコーデックを使用しているときに問題を引き起こす次のコードがあります：

繰り返しになりますが、私は H264 GUID を使用しており、すべてが実行されます。HEVC を使用すると、Div by Zero が表示されます... API 呼び出しからエラーコードが表示されず、単純な div by zero エラーが表示されます。私の質問は次のとおりです: HEVC には、プリセットを使用して提供していない情報が必要ですか? もしそうなら、どのような情報ですか？

どうもありがとう！

編集：解決しました。プログラミングガイドには、これらのフィールドを設定する必要があるとは記載されていませんでしたが、NV_ENC_INITIALIZE_PARAMSはframeRateNumとframeRateDenで構成されているため、div がゼロになりました... H264 を使用しているときにこれが発生しない理由はわかりません。誰かがこれを閉じるかもしれません..

c++encoding h.264 hevc nvenc

2016-07-16T13:38:20.670

0 投票する

1 に答える

647 参照

nvenc - nvencで最もビジーでないGPUを見つける方法は?

C プロジェクトで nvenc lib を使用して複数の GPU をサポートする作業を行っています。最も使用率の低い GPU を見つけて、次のエンコーダセッションに使用したいと思います。それを行うためのAPIはありますか？

ありがとう。

nvenc

2016-09-13T14:08:35.137

0 投票する

1 に答える

925 参照

codec - NVENC SDK の例

ハードウェアアクセラレーションビデオエンコーディングを提供できる NVENC エンコーダー SDK サンプルを実行しようとしています。

nvencoderここで見つけたデータセットでサンプルを実行しようとしています: http://www.sunrayimage.com/download/image_examples/yuv420/tulips_yuv420_inter_planar_qcif.yuv

次のコマンドラインで実行しました。

生成された結果のファイルは、実際にはどのメディアプレーヤーでも再生できません。VLC はそれをロードしますが、期待していたイメージを生成しません。

ヘルプメッセージを見ると、次のように書かれています。

このファイルが再生可能であることを確認するために他に何かする必要があるのでしょうか、それともこの例を正しく使用していないのでしょうか? ビットストリームファイルが有効な H.264 エンコードファイルではない可能性がありますか?

codec video-encoding nvenc

2016-09-30T17:14:15.187

問題タブ [nvenc]

完全なコンソール出力

Reference