私のコードは、音声からテキストへの全二重 Google 音声 API のこの php バージョンに触発されています: http://mikepultz.com/2013/07/google-speech-api-full-duplex-php-version/

マイクの投稿で説明されているように、機能して配列出力を提供するflacファイルはほとんどありません。ただし、一部のflacファイルでは、出力として何も返されません。例: http://gavyadhar.com/video/upload/Pantry_Survey.flac、出力は返されません。

ただし、同じコードがこの flac ファイル ( http://gavyadhar.com/video/upload/pantry_snack_video.flac ) に対して機能し、次のような配列出力を返します。

---------response 1 : あなたの顔はパントリーで、メイン スタックの 1 つ 私は通常、Wesley Rd rasa マルチグレイン クラッカーを食べています。など 5 つの応答。

一部のflacファイルが機能しないのはなぜですか? または、Google API によって作成された例外をキャッチし、トラブルシューティングのために表示する方法はありますか?

ありがとう。ここに 2 つの php ファイルのコードを添付します。

PHP file which passes the API key and the FLAC file with its sample rate. 

include 'GoogleSpeechToText.php';


// Your API Key goes here.
$speech = new GoogleSpeechToText($apiKey);


$file = realpath('upload/Pantry_Survey.flac'); // Full path to the file.

echo "<BR><BR>file : ", $file ;


$bitRate = 44100; // The bit rate of the file.
$result = $speech->process($file, $bitRate, 'en-US');


echo "<BR><BR>-------------";

$responses = $result[0]['alternative'];

$i = 0;
foreach ($responses as $response) {
	$i = $i + 1;
	#echo $response['transcript'];
	echo "<br><br> ---------response $i : ", $response['transcript'];



 * Convert FLAC files to Text using the Google Speech API
 * Credit due to Mike (mike@mikepultz.com) for his first version of this.
 * @version 0.1
 * @author Roger Thomas
 * @see
class GoogleSpeechToText
     * URL of the Speech API
     * @var string
    const SPEECH_BASE_URL = 'https://www.google.com/speech-api/full-duplex/v1/';

     * A 'unique' string to use for the requests
     * @var string
    private $requestPair;

     * The Google Auth API Key
     * @var string
    private $apiKey;

     * CURL Upload Handle
     * @var resource
    private $uploadHandle;

     * CURL Download Handle
     * @var resource
    private $downloadHandle;

     * Construct giving the Google Auth API Key.
     * @param string $apiKey
     * @throws Exception
    public function __construct($apiKey)
        if (empty($apiKey)) {
            throw new Exception('$apiKey should not be empty.');
        $this->apiKey = $apiKey;
        $this->requestPair = $this->getPair();

     * Setup CURL requests, both up and down.
    private function setupCurl()
        $this->uploadHandle = curl_init();
        $this->downloadHandle = curl_init();
		curl_setopt($this->downloadHandle, CURLOPT_URL, self::SPEECH_BASE_URL . 'down?pair=' . $this->requestPair );
		#echo "<br>downloadHandle :: ", self::SPEECH_BASE_URL . 'down?pair=' . $this->requestPair;

        curl_setopt($this->downloadHandle, CURLOPT_RETURNTRANSFER, true);


		//----added by asmi shah - 7 jan 2015
		curl_setopt($this->uploadHandle, CURLOPT_MAX_SEND_SPEED_LARGE, 30000);
		curl_setopt($this->uploadHandle, CURLOPT_LOW_SPEED_TIME, 9999);
		curl_setopt($this->downloadHandle, CURLOPT_LOW_SPEED_TIME, 9999);


     * Generate a Pair for the request. This identifies the requests later.
     * @return string
    private function getPair()
        $c = '0123456789';
        $s = '';
        for ($i=0; $i<16; $i++) {
            $s .= $c[rand(0, strlen($c) - 1)];
		echo "pair : ",$s;
        return $s;

     * Make the request, returning either an array, or boolean false on
     * failure.
     * @param string $file the file name to process
     * @param integer $rate the bitrate of the flac content (example: 44100)
     * @param string $language the ISO language code
     *      (en-US has been confirmed as working)
     * @throws Exception
     * @return array|boolean false for failure.
    public function process($file, $rate, $language = 'en-US')
        if (!$file || !file_exists($file) || !is_readable($file)) {
            throw new Exception(
                '$file must be specified and be a valid location.'
		else { echo "<br>file exists"; }

        $data = file_get_contents($file);
        if (!$data) {
            throw new Exception('Unable to read ' . $file);
		else { echo "<br>file is readable"; }
		$upload_data = array(
					"Content_Type"  =>  "audio/x-flac; rate=". $rate,
					"Content"       =>  $data,

        if (empty($rate) || !is_integer($rate)) {
            throw new Exception('$rate must be specified and be an integer');
		else { echo "<br>sample rate is received :" . $rate ; }

        curl_setopt($this->uploadHandle,CURLOPT_URL,self::SPEECH_BASE_URL . 'up?lang=' .$language . '&lm=dictation&timeout=20&client=chromium&pair=' .$this->requestPair . '&key=' . $this->apiKey);
		curl_setopt($this->uploadHandle,CURLOPT_HTTPHEADER,array('Transfer-Encoding: chunked','Content-Type: audio/x-flac; rate=' . $rate));
		#echo "<br><br>------ data : ", $data;
		#echo "<br><br>------";
		#echo "<BR><BR> URL made up : ", self::SPEECH_BASE_URL . 'up?lang=' .$language . '&lm=dictation&client=chromium&pair=' .$this->requestPair . '&key=' . $this->apiKey;

        $curlMulti = curl_multi_init();

        curl_multi_add_handle($curlMulti, $this->downloadHandle);
        curl_multi_add_handle($curlMulti, $this->uploadHandle);
        $active = null;
        do {
            curl_multi_exec($curlMulti, $active);
        } while ($active > 0);

        $res = curl_multi_getcontent($this->downloadHandle);

		#echo "resource type ::".get_resource_type($this->downloadHandle);
		$output = array();
        $results = explode("\n", $res);
		#$i = 0;
        foreach ($results as $result) {
			#$i = $i + 1;
			#echo "<BR><BR><BR>--------------- string ||$i|| : ", $result;
            $object = json_decode($result, true);
            if (
                (isset($object['result']) == true) &&
                (count($object['result']) > 0)
            ) {
                foreach ($object['result'] as $obj) {
                    $output[] = $obj;

        curl_multi_remove_handle($curlMulti, $this->downloadHandle);
        curl_multi_remove_handle($curlMulti, $this->uploadHandle);

        if (empty($output)) {
			echo "<BR><br>output is empty<BR>";
            return false;
		echo "<BR><BR>";
        return  $output;

     * Close any outstanding connections in the destruct
    public function __destruct()



2 に答える 2


あなたが提供した音声ファイルは 2 つのチャンネルを使用しています。スピーチは現在、シングル チャネル オーディオのみをサポートしているため、シングル チャネルに変換する必要があります。すべてのエンコーディングは、1 チャネル (モノラル) オーディオのみをサポートします。 Google Speech API の音声エンコードの詳細

音声ファイルを 1 チャンネルに変換した後、提供された音声ファイルで正常に応答を得ることができました。

于 2017-01-09T09:45:23.870 に答える