ダウンロードしたコーパスから語学学習ツールを作りたいです。私が達成したいのは、ユーザーがその使用法を確認したい単語を入力すると、php クエリの出力にキーワードを含むリストが表示されることです。言語学習者にとって非常に有益です。sentences
sentences
そのために、すべてのテキストを mysql データベースにインポートしてから、PHPを使用してアクセスします。私は実際にそれを行いましたが、効果的でsentences
はなく、適切に入力されておらず、クエリ時間が長すぎます。quotes.list のフォーマットは以下のテキストの通りです。
# "Andromeda" (2000) {Pitiless as the Sun (#2.4)}
Tyr Anasazi: Am I mistaken
strangers unlimited access to this ship?
Captain Dylan Hunt: Why yes
closely and see what they do with it. There's something not quite
trust worthy about them
Tyr Anasazi: You occassion bouts of deviousness never fail to
surprise me
# "Andromeda" (2000) {Point of the Spear (#3.16)}
Tyr Anasazi: Well even crippled I would much prefer to assume the
offensive than instruct the crew to make peace with their various
and sundry dieties!
ハッシュ間のテキストをmysql テーブルの各行にインポートするにはどうすればよいですか? 私のプロジェクトを容易にする他のアイデアを投稿していただけますか?
EDIT : Perl センテンス セグメンタ スクリプト「文-boundary.pl」を使用して、テキストを文に整列させました。テーブルを作成し、「整列されたテキスト」をテーブルにロードする最良の方法がわかりません。私は次のようないくつかのことを試しました:
CREATE TABLE text
(
body TEXT
)ENGINE = MYISAM
を使用して「整列テキスト」をロードすると
LOAD DATA LOCAL INFILE '/home/user/Desktop/quotes' INTO TABLE text;
を使用してクエリを作成し、
SELECT * FROM `text` WHERE MATCH(body) AGAINST('freedom' IN BOOLEAN MODE)
クエリ時間は約 2 分です。
以下で試しindexed table
ましたが、テキストを読み込めませんでした。 body フィールドはNULLでいっぱいです。
CREATE TABLE IF NOT EXISTS text ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `body` VARCHAR(140) NOT NULL, PRIMARY KEY (`id`) ) ENGINE=MyISAM AUTO_INCREMENT=5000000 DEFAULT CHARSET=utf8;
EDIT2:
本文フィールドにテキストをロードすることはできましたが、クエリ時間はまだ長すぎます。
LOAD DATA LOCAL INFILE '/home/user/Desktop/quotes' INTO TABLE text (body);
手伝ってくれませんか?