私はこれを学術的に尋ねます。非常に重要な質問を声に出して尋ね、コミュニティに答えてもらいたいと思います。入力されたテキストを読み取り、チャットボットで応答できる、ライブの匿名グループ ビデオ チャットルームに沿って再生するシーンを生成するシステムを構築できますか?
ライブのインターネット ビデオは、ぼやけて解像度が低いことがよくあります。遠くのパーティーのシーンでは、多くの詳細を理解することはできません. シーンは、動いていないときに非常にリアルに見える最新のソフトウェア ツールでレンダリングできます。それらをリアルに動かすことは、大きなシミュレーション ソフトウェアです。
顔は、毎秒 1 フレームが可能な 24 のシステムのクラスターによって、毎秒 24 フレームでレンダリングできます。ビデオには、どの表情を生成するかが決定された時点から 1 秒のラグがあります。これらの表情とその生成は重要な問題です。スキン リアリズムの要件は、グラフィックス コミュニティによって解決された問題です。
顔の表情は、複数の研究者によって分類されています。それらはレンダリングすることもできます。これは、最新のコンピューター グラフィックスの文献で示されています。どちらが特定の状況に適しているかを知ることができれば、それらを行うことができます。
チャットボットは何十年も使用されています。現在では、尋ねられたことを読み、適切な方法で応答する、非常に「スマートな」チャット プログラムが存在します。彼らは常にこれをテキストで行ってきましたが、テキストリーダーソフトウェアは人間のような声で話すことができ、音声認識ソフトウェアは毎年改善されています.
私が提案するのは、ソフトウェア開発のこれらの異なる部分をすべて結び付けて、真に驚くべきチューリングテストビーターを作成することは、非常に初歩的であるべきだという事実です。
このプログラムは仮想空間に入り、他の参加者と同じようにウェブカメラのようにリアルな環境を表示できます。顔の表情を見ることができ、スピーチを聞くことができ、テキストを読むことができます。次に、応答を作成し、グループに入力または発声することができます。何を応答するかを選択することは、ほとんどの人間でさえ習得していない難しい問題です。多くの作業を行うことで、それに近づけることができます。
チューリング テストは、コミュニケーターが人間であることを証明することを目的としていますが、「証明」は、人間の判断者をだますのに十分であるという意味でのみです。人間の審査員が全員である場合、厳格な正式な手順を適用することはほとんどありません。推測するか、トリックに引っかかるだけで十分です。
これができると思いますか?
この計画は間違っていますか?平均的な視聴者をこのようにだますことには、道徳的な意味がありますか? パーソナル インテリジェント アシスタントを生成することで、何百万ドルも稼ぐことができるでしょうか?