🐍 😶 🆕 Algunas palabras sobre Alter Table, o cómo no hacerlo 😳 👸 🙆🏻

Probablemente este no sea un artículo, sino una breve nota sobre algunas características del trabajo con tablas grandes en MySQL.

La razón para escribir fue la adición aparentemente cotidiana de una nueva columna a la tabla. Pero todo resultó no ser tan simple como se esperaba.

Entonces, una noche, para no molestar a nuestros queridos clientes, tuvimos que agregar una columna a la mesa.

Para que quede más claro, las características de la tabla y la base:

tamaño de la mesa 110Gb
número de filas: 7.5 millones
motor de almacenamiento: InnoDB
hay dos servidores sql conectados de acuerdo con el esquema maestro-esclavo, mientras que el maestro está en el SSD y el esclavo está en el HDD

Parece ser una solución obvia para agregar una columna: Alterar tabla.

alter table table_name add source varchar(32)

Lo usamos (sí, entendimos que era malo, pero en este caso particular los riesgos eran mínimos).

Los resultados fueron bastante desagradables:

en el asistente, el proceso de agregar una columna tomó aproximadamente una hora (!)
en el esclavo, comenzó después del final del proceso en el maestro y duró aproximadamente 8 horas (!!)
durante la tabla alter, la replicación de datos (!!!) se detuvo por completo en el esclavo

Pero hay un lado positivo: una pequeña ventaja fue que después de agregar una columna, el tamaño de la tabla disminuyó en un 10%.

En los gráficos a continuación es claramente visible.

Gráfico de carga de CPU en el asistente.

Gráfico de carga de CPU en el esclavo.

Retraso en la replicación.

¿Qué problemas les esperan a quienes hacen esto en las mesas de batalla?

Primero, durante la duración de Alter Table, no puede escribir datos en la tabla (pero puede leerlos). De hecho, depende de la versión de MySQL, en el último no lo es, pero debe comprender de qué es exactamente su versión para evitar problemas.

En consecuencia, si la tabla es grande, entonces el tiempo de indisponibilidad será significativo (como con nosotros, cuando se usa el SSD, tomó una hora y en un disco normal, 8 horas), lo que es poco probable que sus clientes esperen.

En segundo lugar, como en nuestro caso, durante la ejecución de Alter Table, la sincronización de todas las tablas , no solo la que cambiamos, se detuvo por completo en el esclavo. Por lo tanto, si sus datos en el segundo servidor son críticos y deben estar actualizados, corre el riesgo de quedarse sin actualizaciones con todas las consecuencias resultantes.

Otro punto no obvio que encontramos al agregar una columna (pero esta fue otra vez): se necesita espacio en disco adicional .

El hecho es que algunos cambios en las tablas recrean la tabla desde cero, por lo que no necesita menos espacio que una tabla existente. Para mesas grandes, respectivamente, se necesita mucho espacio, por decirlo suavemente. Según la documentación, se crea una tabla temporal en el mismo directorio que el original.

Además, durante la ejecución de todo tipo de Alter Table, todos los cambios se escriben en el archivo de registro, de modo que después de los cambios, los datos se pueden transferir durante el tiempo durante el cual se realizó la operación. Y aquí, también, puede esperar una sorpresa desagradable: si la tabla cambia durante mucho tiempo y el volumen de operaciones es grande, entonces no solo puede finalizar el espacio en disco, sino que también se puede exceder el límite de tamaño de archivo especificado en la configuración de SQL. En cualquier caso, "la operación DDL en línea falla y las operaciones DML concurrentes no confirmadas se revierten" le espera.

Nos enfrentamos al hecho de que el directorio para archivos temporales era pequeño, como resultado tuvimos que redefinir innodb_tmpdir .

Para ver hacia dónde apunta actualmente la variable, puede hacer esto:

 select @@GLOBAL.innodb_tmpdir;

Tenga en cuenta que el tamaño del directorio temporal también puede ser necesario el tamaño de una tabla + índices. En general, abastecerse de espacio.

Para no repetir la documentación, lea con más detalle en https://dev.mysql.com/doc/refman/5.7/en/innodb-online-ddl-space-requirements.html

¿Pero cómo hacerlo? De hecho, no existe una receta única para todas las ocasiones.

Una de las opciones posibles, como lo hacemos para las tablas que no son críticas para la actualización:

Cree una nueva tabla con la estructura deseada.
Rellene los campos de la tabla anterior.
Eliminar o renombrar una tabla antigua
Renombrar el nuevo

Repito que esto funciona para tablas de actualización no críticas. Y al mismo tiempo evita el bloqueo de replicación. Debe tenerse en cuenta que completar una nueva tabla debe hacerse de tal manera que permita que la replicación continúe, y dado que se ejecuta secuencialmente, no puede hacerlo con una sola expresión sql, debe dividirla en varias consultas pequeñas entre las cuales se realizará la replicación de otros datos. En otros casos, son posibles otras opciones, tal vez alguien comparta los comentarios.

UPD Syavadee sugirió usar el cambio de esquema en línea percona. De hecho, implementa el algoritmo descrito anteriormente con extras adicionales.

UPD Arheops recomienda habilitar la replicación paralela / gtid para resolver problemas de replicación.

Bueno, por cierto, a veces, para comprender qué tan grande es la tabla y cuántas filas hay, debe hacer

 select count(*) from table_name

Pero en tablas grandes y cargadas, esta tampoco es la operación más rápida, especialmente cuando tiene medio millón de filas o más.

Por lo tanto, para una estimación aproximada del volumen, puede usar el siguiente método:

 SHOW TABLE STATUS FROM express where name='table_name'

Desafortunadamente, en el motor InnoDB, el tamaño resultante puede diferir en un 50 por ciento (en nuestro caso, con la tabla anterior, el número real de registros es de aproximadamente 7,5 millones, y este método mostró solo 5 millones), pero esto es bastante adecuado para una estimación indicativa.

Eso es todo, espero que esta nota ayude a alguien a evitar grandes problemas con comandos SQL supuestamente inofensivos.

Algunas palabras sobre Alter Table, o cómo no hacerlo

More articles: