これらの二重引用符の文字列は、実際には文字コードのリストです。次に、DCG が解析を処理する適切な方法です。
:- use_module(library(http/dcg_basics), [string//1]).
%% split input on Sep
splitter(Sep, [Chunk|R]) -->
string(Chunk),
( Sep -> !, splitter(Sep, R)
; [], {R = []}
).
Sep
上記は、リテラルまたは非終端記号にすることができます。次のようなものが必要です
not_in_word --> [C], {\+code_type(C, alpha)}.
そのような定義で:
?- phrase(splitter(not_in_word, X), "stack,overflow!rocks.").
X = [[115, 116, 97, 99, 107], [111, 118, 101, 114, 102, 108, 111|...], [114, 111, 99, 107, 115], []] .
delete/3 を使用して空の文字列を取り除くことができます:
?- phrase(splitter(not_in_word, X), "? stack,overflow!rocks."), delete(X, [], Y).
X = [[], [], [115, 116, 97, 99, 107], [111, 118, 101, 114, 102|...], [114, 111, 99, 107|...], []],
Y = [[115, 116, 97, 99, 107], [111, 118, 101, 114, 102, 108, 111|...], [114, 111, 99, 107, 115]] .
edit単語をアトムとして簡単に視覚化できます。
?- phrase(splitter(not_in_word, X), "? stack,overflow!rocks."),
delete(X, [], Y),
maplist(atom_codes, Z, Y).
X = [[], [], [115, 116, 97, 99, 107], [111, 118, 101, 114, 102|...], [114, 111, 99, 107|...], []],
Y = [[115, 116, 97, 99, 107], [111, 118, 101, 114, 102, 108, 111|...], [114, 111, 99, 107, 115]],
Z = [stack, overflow, rocks] .
maplist(atom_codes, Atoms, Codes) 内の「出力」単語の位置に注意してください...