組み込みのデータローダー機能 (マルチプロセス読み込みパイプライン、データ拡張など) を利用しながら、Pytorch に読み込みたい画像へのパスを含むファイルがあります。
def create_links():
data_dir = "/myfolder"
full_path_list = []
assert os.path.isdir(data_dir)
for _, _, filenames in os.walk(data_dir):
for filename in filenames:
full_path_list.append(os.path.join(data_dir, filename))
with open(config.data.links_file, 'w+') as links_file:
for full_path in full_path_list:
links_file.write(f"{full_path}\n")
def read_links_file_to_list():
config = ConfigProvider.config()
links_file_path = config.data.links_file
if not os.path.isfile(links_file_path):
raise RuntimeError("did you forget to create a file with links to images? Try using 'create_links()'")
with open(links_file_path, 'r') as links_file:
return links_file.readlines()
だから私はファイル(またはジェネレータ、または何でも動作するもの)のリストを持っていますfile_list = read_links_file_to_list()
.
その周りに Pytorch データローダーを構築するにはどうすればよいですか? また、どのように使用しますか?