3

Python を使用して、単語のセンテンスを、そのセンテンス内のすべての個別の文字のフラットなリストに変換しようとしています。

これが私の現在のコードです:

words = 'She sells seashells by the seashore'

ltr = []

# Convert the string that is "words" to a list of its component words
word_list = [x.strip().lower() for x in words.split(' ')]

# Now convert the list of component words to a distinct list of
# all letters encountered.
for word in word_list:
    for c in word:
        if c not in ltr:
            ltr.append(c)

print ltr

このコードは を返しますが['s', 'h', 'e', 'l', 'a', 'b', 'y', 't', 'o', 'r']、これは正しいですが、おそらくリスト内包表記を使用して、この答えにもっと Pythonic な方法がありsetますか?

リスト内包表記のネストとフィルタリングを組み合わせようとすると、フラットなリストではなく、リストのリストが表示されます。

最後のリスト ( ) 内の個別の文字の順序はltr重要ではありません。重要なのは、それらが一意であることです。

4

7 に答える 7

13

セットは、シンプルで効率的なソリューションを提供します。

words = 'She sells seashells by the seashore'

unique_letters = set(words.lower())
unique_letters.discard(' ') # If there was a space, remove it.
于 2010-02-11T16:53:04.800 に答える
3
set([letter.lower() for letter in words if letter != ' '])

編集:試してみたところ、これも機能することがわかりました(おそらく、これは SilentGhost が言及していたものです):

set(letter.lower() for letter in words if letter != ' ')

セットではなくリストが必要な場合は、

list(set(letter.lower() for letter in words if letter != ' '))
于 2010-02-11T16:31:51.433 に答える
3

セットltrを作成し、ループ本体を少し変更します。

ltr = set()

for word in word_list:
    for c in word:
       ltr.add(c)

または、リスト内包表記を使用します。

ltr = set([c for word in word_list for c in word])
于 2010-02-11T16:32:04.430 に答える
2
>>> set('彼女は海辺で貝殻を売っています'.replace(' ', '').lower())
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])
>>> set(c.lower() for c in '彼女は海辺で貝殻を売っている' if not c.isspace())
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])
>>> itertoolsインポートチェーンから
>>> set(chain(*'彼女は海辺で貝殻を売っている'.lower().split()))
set(['a', 'b', 'e', 'h', 'l', 'o', 's', 'r', 't', 'y'])
于 2010-02-11T16:43:37.473 に答える
2

ここにpy3kで作られたいくつかのタイミングがあります:

>>> import timeit
>>> def t():                    # mine (see history)
    a = {i.lower() for i in words}
    a.discard(' ')
    return a

>>> timeit.timeit(t)
7.993071812372081
>>> def b():                    # danben
    return set(letter.lower() for letter in words if letter != ' ')

>>> timeit.timeit(b)
9.982847967921138
>>> def c():                    # ephemient in comment
    return {i.lower() for i in words if i != ' '}

>>> timeit.timeit(c)
8.241267610375516
>>> def d():                    #Mike Graham
    a = set(words.lower())
    a.discard(' ')
    return a

>>> timeit.timeit(d)
2.7693045186082372
于 2010-02-11T16:44:23.167 に答える
0
set(l for w in word_list for l in w)
于 2010-02-11T16:35:07.330 に答える
0
words = 'She sells seashells by the seashore'

ltr = list(set(list(words.lower())))
ltr.remove(' ')
print ltr
于 2010-02-11T17:01:01.773 に答える