問題タブ [defaultdict]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 一致する文字列をdefaultdict(set)に抽出する方法は?Python
そのような行を含むテキストファイルがあり(以下を参照)、英語の文の後にスペイン語の文が続き、同等の翻訳テーブルが「{##}
」で区切られています。(あなたがそれを知っているなら、それはの出力ですgiza-pp
)
あなたは、このパートセッションの間に、次の数日の間にこの主題についての討論を要求しました。{##}susseñoríashansolicitadoundebatesobre el tema paralospróximosdías、en elcursodeesteperíododesesions。{##} 0-0 0-1 1-2 2-3 3-4 4-5 5-6 6-7 7-8 8-9 12-10 13-11 14-11 15-12 16-13 17 -14 9-15 10-16 11-17 18-18 17-19 19-21 20-22
翻訳表は0-0 0-1
、英語の0番目の単語(つまり)がスペイン語の0番目と1番目の単語(つまり)と一致することを意味しますyou
。sus señorías
文からスペイン語の翻訳が何であるか知りたいとしましょうcourse
、通常私はそれをこのようにします:
上記を行う簡単な方法はありますか?かもしれませregex
んか?line.find()
?
いくつかの試みの後、MWEや欠落している翻訳のような他の多くの問題をカバーするためにこれをしなければなりません:
python - defaultdict(list) を再調整する方法 - Python
finaldict
最初のファイルから特定のクエリ単語のリストを取得できる defaultdict が必要です。
最後の dict は、同じ ID を共有する両方のファイルからの単語のペアの辞書です。たとえば、同じIDfoo, oof
を共有し1243
ます。1453
後で単語ペア検索を容易にするためです。検索しようとすると('foo','oof')
、 が返され['1243','1453']
ます。finaldict で を検索する('foo','duh')
と、単語ペアが同じ ID を共有していないため、何も返されません。
私は以下のようにしていますが、より簡単に達成する方法はありfinaldict
ますか?
上記のコードは次を出力します。
python - defaultdictを使用したファイルIO
私はしようとしています:
- 辞書を読み込む
- 辞書を更新/変更する
- 保存
- (繰り返す)
問題: 1 つのディクショナリ (players_scores) だけで作業したいのですが、defaultdict 式は完全に別のディクショナリを作成します。1 つの辞書をロード、更新、および保存するにはどうすればよいですか?
コード:
python - 大きくネストされた defaultdict で物を数えるより Python 的な方法
私のコードは現在、別のものに大きくネストdict
されたものをカウントする必要があります。3 つの値でインデックスを作成してからカウントする必要があるアイテムがあります。したがって、ループの前に、ネストされたものを次のdefaultdict
ように初期化します。
これにより、次のようにタイトループ内のアイテムをカウントできます。
これらすべてのdefaultdict
s を初期化するのは、Java などで型宣言を行うのとよく似ているように感じます。このようなことを行うためのより慣用的/Python的な方法はありますか?
google-app-engine - GAE ndb での酸洗
次のように、構造化データをピクルして ndb.PickleProperty() プロパティにピクル解除しようとしています。
ここで、モデル MonthRecord は次のように定義されます。
および list_list として:
最初の実行は正常に機能します (get_or_insert で大文字と小文字の挿入がヒットし、新しい MonthRecord エンティティが作成されます)。ただし、後続の実行中 (つまり、記録される当月内の新しい費用)、次のエラーが発生します。
エラーの原因に関するアイデアはありますか?
python - Pythonを使用して、区切られた文字列のリストをツリー/ネストされたdictに変換します
ドット区切りの文字列のリストを変換しようとしています。
ツリーに入れます (ネストされたリストまたは辞書 - 歩きやすいものなら何でも)。実際のデータには、たまたま長さの異なるドット区切りの部分が 1 ~ 4 個あり、合計で 2200 レコードあります。私の実際の目標は、最初の QComboBox が最初のセット項目 ['one', 'five', 'twelve'] (重複なし) で満たされるように、このデータで 4 つの QComboBox のセットを埋めることです。次に、選択した項目に応じて、2 番目の QComboBox に関連する項目が入力されます。別のネストされたレベルがある場合、'one' の場合は ['two', 'six'] のようになります。
これまでのところ、作業リスト -> ネストされた dicts ソリューションを取得しましたが、通常の dict() を使用しているため、非常に遅いです。そして、ComboBoxesを適切に埋めることが簡単にできるように、defaultdictに再設計するのに苦労しているようです。
私の現在のコード:
python - defaultdict python を使用してキーに従ってセットを集約する
この形式の名前とチームを含むテキストの行がたくさんあります。
例えば
など、数年といくつかのチーム。重複した名前を削除して、チーム (年) の組み合わせに従って選手の名前を集計したいと思います (元のデータベースに冗長な情報が含まれている可能性があります)。この例では、出力は次のようになります。
私はこれまでにこのコードを書きました:
最終的に、キー (チーム名と年) と値のセットで構成される大きな辞書が作成されます。しかし、物事を集計する方法が正確にはわかりません。
また、最終的な値のセットを比較することもできます (たとえば、1993 年と 1994 年のヤンキーのチームに共通する選手は何人ですか?)。これどうやってするの?
どんな助けでも大歓迎です