Компилирование версии ядра>= 2.6.34 в CentOS 5: RAID-набор "ddf1_foo" не был активирован?
Я хочу смонтировать Ceph FS на некоторых серверах CentOS 5. Поскольку ceph-fuse
не удалось с ошибками ниже:
# ceph-fuse --no-fuse-big-writes -m 192.168.2.15:6789 /mnt/ceph/
ceph-fuse[7528]: starting ceph client
ceph-fuse[7528]: starting fuse
fuse: unknown option `atomic_o_trunc'
2013-04-04 13:51:21.128506 2b82d6e9e8f0 -1 fuse_lowlevel_new failed
ceph-fuse[7528]: fuse finished with error 33
ceph-fuse[7526]: mount failed: (33) Numerical argument out of domain
Google указал на это, но CentOS 5.x поставляется с ядром 2.6.18, я собираюсь скомпилировать более новое ядро, которое поддерживает Ceph.
.config
был скопирован с работающего ядра с 2 дополнительными настройками:
CONFIG_SYSFS_DEPRECATED_V2=y
CONFIG_CEPH_FS=m
Но оба они дают мне следующую ошибку:
Первое предупреждение можно устранить, отредактировав скрипт init после распаковки образа ядра и удаления 2 строк:
echo "Loading dm-region-hash.ko module"
insmod /lib/dm-region-hash.ko
http://funky-dennis.livejournal.com/3290.html
Как насчет второй ошибки:
device-mapper: table: 253:0: mirror: Error creating mirror dirty log
RAID set "ddf1_bar" was not activated
- Сценарий инициализации 2.6.18: http://fpaste.org/byZ3/
- 2.6.34.14: http://fpaste.org/8COr/
Они в основном одинаковы, за исключением того, что в новое ядро не загружены следующие модули:
echo "Loading dm-mem-cache.ko module"
insmod /lib/dm-mem-cache.ko
echo "Loading dm-message.ko module"
insmod /lib/dm-message.ko
echo "Loading dm-raid45.ko module"
insmod /lib/dm-raid45.ko
Это причина RAID set "ddf1_foo" was not activated
?
ОБНОВЛЕНИЕ Чт 4 апреля 21:40:32 ИКТ 2013
http://alistairphipps.com/wiki/index.php?title=Notes
Странное сообщение об ошибке, похожее на "зеркальный журнал: нераспознанный аргумент синхронизации с зеркальным журналом: 2", "таблица: зеркало: ошибка создания зеркального журнала грязных сообщений" означает, что вы не соответствовали версиям средства отображения устройств ядра и средств пользовательского пространства: возможно, ваше ядро слишком свежо для ваша версия инструментов lvm. Установите последнюю версию устройства отображения и lvm2 из источников, и он должен работать.
Я попытался скомпилировать последнюю версию LVM2:
# /usr/sbin/lvm version
LVM version: 2.02.98(2) (2012-10-15)
Library version: 1.02.67-RHEL5 (2011-10-14)
Driver version: 4.11.6
но ничего не изменится.
ОБНОВЛЕНИЕ Сб 6 апреля 18:51:31 ИКТ 2013
/lib/modules/2.6.18-274.el5/kernel/drivers/md/
|-- dm-crypt.ko
|-- dm-emc.ko
|-- dm-hp-sw.ko
|-- dm-log.ko
|-- dm-mem-cache.ko
|-- dm-message.ko
|-- dm-mirror.ko
|-- dm-mod.ko
|-- dm-multipath.ko
|-- dm-raid45.ko
|-- dm-rdac.ko
|-- dm-region_hash.ko
|-- dm-round-robin.ko
|-- dm-snapshot.ko
|-- dm-zero.ko
|-- faulty.ko
|-- linear.ko
|-- multipath.ko
|-- raid0.ko
|-- raid1.ko
|-- raid10.ko
|-- raid456.ko
`-- xor.ko
/lib/modules/2.6.34.14/kernel/drivers/md/
|-- dm-crypt.ko
|-- dm-log.ko
|-- dm-mirror.ko
|-- dm-mod.ko
|-- dm-multipath.ko
|-- dm-region-hash.ko
|-- dm-round-robin.ko
|-- dm-snapshot.ko
|-- dm-zero.ko
|-- faulty.ko
|-- linear.ko
|-- multipath.ko
|-- raid0.ko
|-- raid1.ko
|-- raid10.ko
|-- raid456.ko
`-- raid6_pq.ko
ОБНОВЛЕНИЕ Ср 10 апреля 11:22:54 ИКТ 2013
Сделав поиск в исходной папке, я нашел это:
# grep -lr 'Error creating mirror dirty log' /usr/src/linux-2.6.34.14
/usr/src/linux-2.6.34.14/drivers/md/dm-raid1.c
dm-raid1.c
:
static struct dm_dirty_log *create_dirty_log(struct dm_target *ti,
unsigned argc, char **argv,
unsigned *args_used)
{
unsigned param_count;
struct dm_dirty_log *dl;
if (argc < 2) {
ti->error = "Insufficient mirror log arguments";
return NULL;
}
if (sscanf(argv[1], "%u", ¶m_count) != 1) {
ti->error = "Invalid mirror log argument count";
return NULL;
}
*args_used = 2 + param_count;
if (argc < *args_used) {
ti->error = "Insufficient mirror log arguments";
return NULL;
}
dl = dm_dirty_log_create(argv[0], ti, mirror_flush, param_count,
argv + 2);
if (!dl) {
ti->error = "Error creating mirror dirty log";
return NULL;
}
return dl;
}
dm-log.c
:
struct dm_dirty_log *dm_dirty_log_create(const char *type_name,
struct dm_target *ti,
int (*flush_callback_fn)(struct dm_target *ti),
unsigned int argc, char **argv)
{
struct dm_dirty_log_type *type;
struct dm_dirty_log *log;
log = kmalloc(sizeof(*log), GFP_KERNEL);
if (!log)
return NULL;
type = get_type(type_name);
if (!type) {
kfree(log);
return NULL;
}
log->flush_callback_fn = flush_callback_fn;
log->type = type;
if (type->ctr(log, ti, argc, argv)) {
kfree(log);
put_type(type);
return NULL;
}
return log;
}
3 ответа
Благодаря помощи моего друга, проблема решена.
С первой попытки он закомментировал строчку ti->error = "Error creating mirror dirty log";
в dm-raid1.c
и вставил несколько строк отладки в dm-log.c
Чтобы определить, что вызвало вышеуказанную ошибку:
log = kmalloc(sizeof(*log), GFP_KERNEL);
if (!log)
ti->error = "kmalloc error";
return NULL;
type = get_type(type_name);
if (!type) {
kfree(log);
ti->error = "get_type error";
return NULL;
}
log->flush_callback_fn = flush_callback_fn;
log->type = type;
if (type->ctr(log, ti, argc, argv)) {
kfree(log);
put_type(type);
ti->error = "ctr error";
return NULL;
}
затем перекомпилируем ядро и получаем:
Со второй попытки он хочет получить значение type_name
:
if (type->ctr(log, ti, argc, argv)) {
kfree(log);
put_type(type);
char* typeN = kmalloc(1000, GFP_KERNEL);
char* pTypeN = typeN;
char* ptype_name = type_name;
while (*ptype_name != '\0') {
*pTypeN = *ptype_name;
++pTypeN;
++ptype_name;
}
ti->error = typeN;
return NULL;
}
Продолжить трассировку до core_ctr
и create_log_context
используя вышеуказанный метод:
static int create_log_context(struct dm_dirty_log *log, struct dm_target *ti,
unsigned int argc, char **argv,
struct dm_dev *dev)
{
enum sync sync = DEFAULTSYNC;
struct log_c *lc;
uint32_t region_size;
unsigned int region_count;
size_t bitset_size, buf_size;
int r;
if (argc < 1 || argc > 2) {
DMWARN("wrong number of arguments to dirty region log");
ti->error = "argc < 1 or > 2";
return -EINVAL;
}
if (argc > 1) {
if (!strcmp(argv[1], "sync"))
sync = FORCESYNC;
else if (!strcmp(argv[1], "nosync"))
sync = NOSYNC;
else {
DMWARN("unrecognised sync argument to "
"dirty region log: %s", argv[1]);
ti->error = "unrecognised sync argument to";
return -EINVAL;
}
}
if (argc < 1 || argc > 2) {
DMWARN("wrong number of arguments to dirty region log");
char* argcStr = kmalloc(1000, GFP_KERNEL);
char* pArgc = argcStr;
unsigned int temp = argc;
do {
*pArgc = temp % 10;
++pArgc;
temp = temp / 10;
} while (temp > 0);
*pArgc = ' ';
++pArgc;
//copy argv;
int i = 0;
for (i; i < argc; ++i) {
char* pArgv = argv[i];
while (*pArgv != '\0') {
*pArgc = *pArgv;
++pArgc;
++pArgv;
}
*pArgc = ' ';
++pArgc;
}
*pArgc = '\0';
ti->error = argcStr;
return -EINVAL;
}
Обратите внимание, что ASCII-код символа черного сердца... 3.
Не знаю, почему автор путает core_ctr
с disk_ctr
, type_name
является core
но количество аргументов равно 3, поэтому он обрезает последний аргумент (block_on_error
), вставив следующее в dm_dirty_log_create
структура:
struct dm_dirty_log *dm_dirty_log_create(const char *type_name,
struct dm_target *ti,
int (*flush_callback_fn)(struct dm_target *ti),
unsigned int argc, char **argv)
{
struct dm_dirty_log_type *type;
struct dm_dirty_log *log;
log = kmalloc(sizeof(*log), GFP_KERNEL);
if (!log) {
ti->error = "kmalloc error";
return NULL;
}
char* core = "core";
char* pCore = core;
int is_core = 1;
char* ptype_name = type_name;
while (*ptype_name != '\0') {
if (*pCore != *ptype_name) {
is_core = 0;
}
++pCore;
++ptype_name;
}
if (is_core && *pCore == *ptype_name && argc == 3) {
--argc;
}
type = get_type(type_name);
Давай посмотрим что происходит:
# uname -r
2.6.34.14
# dmraid -s
*** Group superset .ddf1_disks
--> Active Subset
name : ddf1_VCBOOT
size : 489971712
stride : 128
type : mirror
status : ok
subsets: 0
devs : 2
spares : 0
# modprobe ceph
# lsmod | grep ceph
ceph 176676 0
# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/mapper/ddf1_VCBOOTp3
219G 17G 191G 8% /
/dev/mapper/ddf1_VCBOOTp1
99M 64M 30M 69% /boot
tmpfs 48G 16M 48G 1% /dev/shm
192.168.2.13:6789,192.168.2.14:6789,192.168.2.15:6789:/
72T 28T 45T 39% /mnt/ceph
Почему вы используете raid-массив в формате ddf? Вы, кажется, пытаетесь активировать его с dmraid
, который не видел развития в течение нескольких лет и более или менее обесценился. mdadm
гораздо лучше поддерживается, и последние версии поддерживают формат ddf, хотя предпочитается его собственный формат.
Убедитесь, что вы загрузили модуль dm-log.
В соответствии с ошибкой Ceph 4286, FUSE требуется как минимум ядро 2.6.24 для atomic_o_trunc. Я нашел RPM для 2.6.25. Это ядро предназначено для кластера HPC.
Я думаю, что ваша проблема связана с серьезной модификацией, которую Red Hat вносит в свои выпуски ядра. Это затрудняет работу с новыми ядрами в зависимости от конфигурации оборудования и требований к программному обеспечению.