私たちが持っているという意味で、DefaultStyledDocument サブクラスを「正規化」しようとしていますorg.w3c.dom.Node.normalize()
。つまり、隣接するテキスト「葉」をマージします。DefaultStyledDocument の場合、隣接する 2 つのリーフが同じ属性を持つ (または属性がない) 場合、これらのリーフはマージ対象として識別されます。
以下は単純なバージョンです (実際の属性はチェックしていません。これは、プレーン テキストまたは 1 つの可能なマークアップ スタイルを持つテキストのユース ケースです)。
def normalise( self ):
# recursive function:
def normalise_structure( el, depth = 0 ):
indent = ' ' * depth
start = el.startOffset
print( '%s# el %s |%s|' % ( indent, el, self.getText( start, el.endOffset - start )))
prev_attr_set = None
for i in range( el.elementCount ):
subelement = el.getElement( i )
normalise_structure( subelement, depth + 1 )
if subelement.leaf:
curr_attr_set = subelement.attributes
print( '%s # this is a leaf, attribs %s' % ( indent, curr_attr_set, ))
# this is a simple version: only works if there is only one possible attribute
if prev_attr_set and curr_attr_set and prev_attr_set.attributeCount == curr_attr_set.attributeCount:
print( '%s # %s leaf needs to be merged with previous leaf' % (
indent, 'marked-up' if prev_attr_set.attributeCount == 1 else 'plain'))
attr_set = prev_attr_set.getElement( 0 ) if prev_attr_set.attributeCount else None
prev_subelement = el.getElement( i - 1 )
prev_start = prev_subelement.startOffset
curr_end = subelement.endOffset
merged_element = javax.swing.text.AbstractDocument.LeafElement(
javax.swing.text.DefaultStyledDocument(), el, attr_set, prev_start, curr_end )
el.replace( prev_start, curr_end - prev_start, [ merged_element ] )
prev_attr_set = curr_attr_set
else:
print( '%s # NOT a leaf...' % ( indent, ))
prev_attr_set = None
for self_el in self.rootElements:
normalise_structure( self_el )
これを実行すると、次のエラーが発生します。
スレッド「AWT-EventQueue-0」での例外 java.lang.ArrayIndexOutOfBoundsException at java.lang.System.arraycopy(Native Method) at javax.swing.text.AbstractDocument$BranchElement.replace(AbstractDocument.java:2290)
javax.swing.text.DefaultStyledDocument()
LeafElementコンストラクターでparam 1として試す前に、 「 self
」(つまり、normalise
1行目で呼び出すDefaultStyledDocument)を試しました:同じエラー。