問題タブ [mbox]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mbox - 大きな mbox を送信者別に分割する
非常に大きな mbox ファイルを複数の mbox ファイル (送信者ごとに 1 つ) に分割する方法を探しています。
または、指定した送信者によるメッセージのみを抽出します。
インターネットを調べてみましたが、何も見つかりませんでした (または間違った検索用語を使用しました)。
bash - ターミナルを使用して mbox ファイルを n MB の大きなチャンクに分割する方法は?
SOでこの質問を読みましたが、まったく役に立ちません。Gmail で生成された mbox ファイルを別の Web メール サービスにインポートしたいのですが、インポートごとに 40 MB の巨大なファイルしか許可されないという問題があります。
だから私はどういうわけかmboxファイルを最大に分割する必要があります. 40 MB の大きなファイルを次々とインポートします。これをどのように行いますか?
私が最初に考えたのは、他のスクリプト ( formail) を使用して各メールを 1 つのファイルとして保存し、後でスクリプトを実行してそれらを 40 MB の巨大なファイルに結合することでしたが、端末を使用してこれを行う方法はまだわかりません。
私もsplitコマンドを見ましたが、メールを遮断するのではないかと心配しています。助けてくれてありがとう!
python - Python メールボックス モジュールを使用して IMAP メッセージを保存する
IMAP からimaplibmbox (mailboxモジュール付き) にメッセージをダウンロードしています:
UID = のメールをダウンロードしましょう1 .. 1000。次回は1通目からではなく、1001通目から始めたいと思います。ただし、どこmailbox.mbox にも保存しませんUID。そのため、次に mbox ファイルを開くときに、どこで停止したかを知ることは不可能です。
モジュールにメールmailboxを保存する自然な方法はありますか?UID
それとも、私はmailbox+を本来imaplibあるべき方法で使用していないのでしょうか?
ruby - Google Takeout MBOX メールを Google ドキュメントに抽出する方法は?
mboxGoogle Takeoutアーカイブから特定の送信者とスレッドによるメールを、リッチ テキスト/HTML 形式とスレッド全体を 1 つのドキュメントに保持する複数ページの Google ドキュメントに抽出する必要があるシナリオがあります。
たとえば、件名が「X」の「John Smith」からのすべてのメールは、スレッドの最初のメールから始まり、すべてのメールがこのドキュメントに取り込まれるまで、返信ごとに新しいページを作成する複数ページの Google ドキュメント ドキュメントに移動する必要があります。同様に、「John Smith」の他のすべてのサブジェクトについても、これを行う必要があります。これらのドキュメントはすべて、Google Docs フォルダー内の特定のフォルダーにも配置されます。
私は当初、単一の件名スレッドでそのユーザーのすべてのメッセージを検索するmbox 解析アプローチから始め、次にそれらをGoogle Docにプッシュすることを計画していましたが、おそらくいくつかあると考えるようになりましたこれを処理する他のより効率的な方法。
以前に似たようなことを効率的な方法で行った経験のある方はいらっしゃいますか?
python - Python、メモリ消費を削減し、このコードをより効率的にしますか?
私はこのコードを書きました (動作します - MBOX ファイルの小さなバッチで試しました)。しかし、2.9GB の MBOX ファイルで約 50,000 通のメールを試してみると、メモリ消費量が急増し、コンピューターが使用できなくなりました。メモリ消費に関してこのコードの何が問題になっていますか?全体ではなく増分でコード処理を行うなど、それを修正する方法はありますか? このスクリプトの目的は、x を日付として、Y をその日付ごとに受信したメッセージの数として CSV ファイルを生成し、それらをプロットして電子メールの統計的表現を生成することです。 将来のために: 私はこれを拡張して、電子メールメッセージを読み、pdfで時系列に出力を生成することを計画しているので、ソートする必要があります(メモリ消費が急増する場所)