1

PERCPU: 割り当てに失敗しました。サイズ = 256 整列 = 256、新しいチャンクの割り当てに失敗しました。

CPU 割り当てごとのスペースの量は制限されていますか?

Linux カーネル モジュールのプログラミングで使用できる percpu スペースはどれくらいですか?


今、私はworkqueue_structできるだけ多くを作成しようとしています。私のカーネルは 3.10 です。

私の結果: 約 100000workqueue_structの s を作成でき、コマンドを使用するとエラー情報 (タイトルと同じ) が見つかりますdmesg

私のコード:

#include <linux/module.h>
#include <linux/kernel.h>
#include <linux/init.h>
#include <linux/kthread.h>//kthread_create is_err
#include <linux/slab.h>//kfree
#include <linux/sched.h>//schedule
#include <linux/delay.h>
#include <linux/list.h>
#include <linux/workqueue.h>

u64 i = 0;
static LIST_HEAD(myworkqueuehead);
static struct task_struct *task;

struct MyworkqueueType {
    struct list_head entry;
    struct workqueue_struct *wq;
    u64 number;
};

void myfree(void)
{
    struct MyworkqueueType *tempwqtype,*n;
    list_for_each_entry_safe(tempwqtype, n, &myworkqueuehead, entry)
    {
        if(tempwqtype)
        {
            if(tempwqtype->wq){
                //printk("myfree():number=%lld\n",tempwqtype->number);
                //printk("list_del()\n");
                list_del(&(tempwqtype->entry));
                //printk("destroy_workqueue()\n");
                destroy_workqueue(tempwqtype->wq);
                //printk("free tempwqtypetype:kfree(tempwqtype)\n");
                kfree(tempwqtype);
                //printk("after free tempwqtypetype\n");
            }else{  
                printk("tempwqtype->wq is null\n");
            }
        }else{
            printk("tempwqtype is null\n");
        }
    }
    printk("has freed all the workqueue space...\n");
}


static int test(void *data)
{
    printk("kthread  create_wq start to run test()...\n");
    while(1)
    {
        struct MyworkqueueType *myworkqueue;
        if(kthread_should_stop())
        {
            printk("create_wq kthread begin to do myfree()...\n");
            myfree();
            printk("create_wq kthread stop...\n");
            return 0;
        }
        myworkqueue = kzalloc(sizeof(*myworkqueue), GFP_KERNEL);
        if(myworkqueue){
            struct workqueue_struct *wq = alloc_workqueue("myworkqueue",0,0);
            //struct workqueue_struct *wq = create_workqueue("myworkqueue");
            if(!wq)
            {
                struct MyworkqueueType *mytype;
                kfree(myworkqueue);
                printk("\ncreate workqueue fail...\n");
                mytype = list_entry(myworkqueuehead.prev, struct MyworkqueueType, entry);
                printk("current workqueue number=%lld.start to sleep...\n",mytype->number);
                msleep(5000);
                schedule();
                continue;
            }
            ++i;
            myworkqueue->number = i;
            myworkqueue->wq = wq;
            INIT_LIST_HEAD(&myworkqueue->entry);
            list_add_tail(&myworkqueue->entry,&myworkqueuehead);
            printk("%lld ",i);
        }
        else
        {
            printk("\nalloc struct MyworkqueueType fail...\n");
            printk("current workqueuenum = %lld",i);
            kfree(myworkqueue);
            msleep(5000);
            schedule();
            continue;
        }

    }
}

static int __init maxwqnum_init(void)
{
    printk("-----------maxwqnum-------------\n");
    task=kthread_create(test,NULL,"create_wq");
    if(IS_ERR(task))
    {
        printk("create task_struct create_wq fail...\n");
        kfree(task);
        return 0;
    }
    printk("create task_struct create_wq success...\n");
    wake_up_process(task);
    return 0;
}

static void __exit maxwqnum_cleanup(void)
{
    kthread_stop(task);
    printk("-----------leaving maxwqnum-------------\n");
}

module_init(maxwqnum_init);
module_exit(maxwqnum_cleanup);
MODULE_LICENSE("GPL");
MODULE_AUTHOR("mjq");
MODULE_DESCRIPTION("just a test!");
MODULE_SUPPORTED_DEVICE("WORKQUEUE");
4

1 に答える 1

2

CPU ごとのプールのモジュールから利用できる最大のチャンクは、Linux カーネルに既に読み込まれている他のモジュールによる現在の使用量に依存します。

percpu プールのサイズは、次の構成がカーネル構成で定義されているかどうかによって異なります。

  • CONFIG_HAVE_SETUP_PER_CPU_AREA
  • CONFIG_SMP

起動時の CPU ごとのプールの一般的な初期サイズは、CPUごとに 32KBです。

アーキテクチャ固有のsetup_per_cpu_area()関数が定義されている場合は、異なる場合があります。percpu プール用に予約されたメモリの正確な量は、Linux カーネルの起動中にコンソールに記録されます。たとえば、 Intel Core 2 Duo P8700マシン上のLinux カーネル 3.2は、次のログを記録します。

PERCPU: Embedded 13 pages/cpu @f77d1000 s31616 r0 d21632 u53248

percpu プールは 13 ページ、つまり各 CPU に 52KB、合計 104KBです。他の番号はbase address、それぞれプール、static_sizereserved_sizedyn_sizeおよびunit_sizeです。


更新

(上記の質問のコードから) Linux カーネル モジュールをコンパイルしてinsmoding すると、次のエラーが発生します。

[867955.300798] create workqueue fail...
[867955.300804] current workqueue number=198634.start to sleep...
[867960.315934] PERCPU: allocation failed, size=92 align=256, failed to allocate new chunk
[867960.315948] Pid: 26103, comm: create_wq Tainted: G           O 3.2.0-51-generic #77-Ubuntu
[867960.315955] Call Trace:
[867960.315973]  [<c1563ac4>] ? printk+0x2d/0x2f
[867960.315986]  [<c110335e>] pcpu_alloc+0x30e/0x340
[867960.315995]  [<c110339f>] __alloc_percpu+0xf/0x20
[867960.316032]  [<c10641b0>] __alloc_workqueue_key+0xd0/0x430
[867960.316047]  [<c1122f75>] ? kmem_cache_alloc_trace+0x105/0x140
[867960.316065]  [<f93e50e6>] test+0x56/0x194 [kmod]
[867960.316078]  [<f93e5090>] ? myfree+0x90/0x90 [kmod]
[867960.316091]  [<c1069ddd>] kthread+0x6d/0x80
[867960.316104]  [<c1069d70>] ? flush_kthread_worker+0x80/0x80
[867960.316118]  [<c158033e>] kernel_thread_helper+0x6/0x10

基本的に、追加の CPU ごとのブロックが要求されると、 への呼び出しをdyn_size使用して必要に応じて拡張できます。これは、標準呼び出しを内部的に使用して、必要に応じて追加のメモリを取得します。これは、必要なサイズとアライメントのメモリ ブロックが利用可能である限り継続します。最終的に、これはシステム メモリの使用状況/断片化に応じて失敗し、エラーが表示されます。pcpu_alloc_chunk()kmalloc()


どのようにpcpu_alloc()動作しますか?

最初の起動時に、CPU ごとのサブシステムは、Linux カーネルが使用できるグローバル メモリから小さなメモリ プールを予約します。

PERCPU: Embedded 13 pages/cpu @f77d1000 s31616 r0 d21632 u53248  

これがログの説明です。

静的31616 + 動的21632 = 合計53248、つまり 52KB (それぞれ 4KB の 13 ページ)。

を使用して CPU ごとの割り当てがpcpu_alloc()増えるにつれて、動的プールのサイズが大きくなり続けます。連続していない可能性があり、メモリ内でまばらになることさえあります。ただし、要求された配置とサイズの要件が満たされている限り、これは正常に続行されます。これは、割り当てが を使用して行われるためkmalloc()/vmalloc()です。

最終的に、要求されたサイズ/アライメントを満たすメモリ ホールが利用できないため、これらの呼び出しの 1 つが失敗します。それはほとんどそれです。呼び出しが成功するかどうかを予測できないのと同様に、いつ失敗するmemalign()かを正確に判断することは困難です。pcpu_alloc()特に、他のモジュール (および Linux カーネル自体) でさえ を呼び出すことができるためpcpu_alloc()です。

詳細については、Linux-kernel/mm/percpu.cを参照してください。

于 2013-08-14T15:30:41.077 に答える