1

SQLダンプの形式で英語の単語リストをどこで見つけることができるか知っている人はいますか?

オンラインで単語リストを見つけましたが、それは大きなプレーンテキストファイルです。単語は改行文字で区切られます。単語をループしてデータベースに挿入するPHPスクリプトを作成しようとしましたが、大きなファイルを読み取るだけでメモリの問題が発生しました。ファイルを4つの小さなファイルに分割しましたが、それでもメモリエラーが発生します。私の現在のファイルをよりインポートした友達の形式に変換する方法を知っている人がいたら、私に知らせてください。

4

4 に答える 4

5

LOADDATAINFILEを使用します。ドキュメントから:

LOAD DATA INFILEステートメントは、テキストファイルからテーブルに行を非常に高速に読み取ります。

このようなものが機能するはずです:

LOAD DATA INFILE 'your/path/your_file.txt' INTO TABLE your_table (your_column_name);
于 2009-12-14T03:32:14.163 に答える
0

http://corpora.uni-leipzig.de/download.html

異なる言語(英語を含む)のコーパスのカップル..。

于 2009-12-14T03:31:19.323 に答える
0

あなたのアプローチはうまくいくはずです、あなたはあなたがファイルを読む方法を変える必要があるだけです。file_get_contents行ごとにそれを実行してメモリの問題を回避できる場合は、ファイル全体を読み込むために使用している、またはそれに類似したものを使用していると思います。fscanf()のようなものを試してください:

$handle = fopen("yourfile.txt", "r");
while ($info= fscanf($handle, "%s\t%s\t%s\n")) {
    list ($field1, $field2, $field3) = $info;
    //... do something with the values
}

fclose($handle);
于 2009-12-14T03:35:15.513 に答える
0

ミックスでPythonを使用することに抵抗がない場合は、次の記事を参照してください。

ウィキペディアのダンプを処理および使用する方法

(ウィキペディアのデータ(英語のテキストがあります)をプルし、MySQLデータベースにプッシュします)

于 2009-12-14T05:07:19.333 に答える