私はこのようなプレーンテキストの表を持っています。データがそれぞれの列にまとめられるように、結果行をグループ化する必要があります。
文字列(1行)をスペースで分割すると、次のような配列が得られます。
["2", "1/47", "M4044", "25:03*", "856", "12:22", "12:41", "17.52", "Some", "Name", "Yo", "Prairie", "Inn", "Harriers", "Runni", "25:03"]
また、2つのスペースに分割することもできます。これにより、私は近くになりますが、名前でわかるように、一貫性がありません。
["2", " 1/47", "M4044", " 25:03*", "856", " 12:22", " 12:41", "17.52 Some Name Yo", "", "", "", "", "", "", "Prairie Inn Harriers Runni", " 25:03 "]
結合するインデックスを指定することはできますが、このように数千のファイルを取得する必要があり、列が常に同じ順序になるとは限りません。
1つの定数は、列データが列名とデータの間の仕切り(====
)より長くなることはないということです。私はこれを自分の利益のために使おうとしましたが、いくつかの抜け穴を見つけました。
名前の列に何が残っているのか、他の「単語」の列に何が残っているのかを検出するアルゴリズムを作成する必要があります。何かご意見は?