11

TRECフォーマットの仕様を探しています。私はたくさんグーグルで調べてきましたが、手がかりが見つかりませんでした。

それに関する情報がどこにあるか知っている人はいますか?

4

4 に答える 4

6

AFAIK TREC は、NIST の Text REtrieval Conference の略です。インデクサーがドキュメント境界がファイル内のどこにあるかを知るために、各ドキュメントにはドキュメント開始タグとドキュメント終了タグが必要です。これらのタグは、HTML または XML タグに似ており、実際には TREC ドキュメントの形式です。

TrecParser: このパーサーは、TEXT、HL、HEAD、HEADLINE、TTL、および LP フィールドのテキストを認識します。

出典:TRECウィキペディア

出典:キツネザルガイド

于 2013-06-02T10:31:31.490 に答える
1

これは、TechSmith Camtasia の新しい録画ファイル形式でもあります。https://feedback.techsmith.com/techsmith/topics/mac_upgrade-ri5ox

于 2014-05-23T11:17:14.450 に答える
0

これは、IBM Watson がナレッジの取り込みに使用するファイル形式でもあります。

于 2014-11-17T12:41:52.893 に答える
0

見つかりました: http://sourceforge.net/apps/trac/lemur/wiki/Indexer%20File%20Formats

于 2012-05-09T09:04:54.173 に答える