Am 15. September fand in Avito ein Treffen statt, bei dem wir über die Skalierung von Anwendungen auf PostgreSQL sprachen. Heute möchte ich Materialien von ihm teilen - Videos, Präsentationen von Rednern, Fotos zeigen. Außerdem veröffentliche ich unter dem Schnitt eine Diskussion der Quizfragen , die wir hier auf Habré vor dem Mitap durchgeführt haben. Und ich spreche über meine Eindrücke des Treffens.

Berichte

Verteilte Transaktionen und Zeitreisen. Stas Kelvich, Postgres Professional

Stas sprach über verteilte Transaktionen und Zeitreisen.

Präsentation

Bewertungen:

Stas und sein Team haben hervorragende Arbeit geleistet! Ich hoffe, dass ihre Entscheidung von der Community genehmigt wird und wir diese Lösung in der neuen Version von Postgres sehen werden.

Skalieren einer Anwendung auf PostgreSQL in Avito: Tipps und Tricks. Konstantin Evteev, Avito

Ich hielt eine Präsentation über die Skalierung einer Anwendung auf PostgreSQL in Avito und teilte unsere Tipps und Tricks mit.

Präsentation

Bewertungen:

Ein interessanter Ansatz: Kostantin erklärte sehr interessant und verständlich, auf welche Probleme Sie bei der Arbeit mit Daten in einer Microservice-Architektur stoßen könnten, und schlug auch Lösungen für die Skalierung von IP vor. Saga wird erinnert :)

Isolationsstufen für logische Replikation und PostgreSQL-Transaktionen. Mikhail Tyurin

Michael hat einen Bericht über die Isolationsstufen für logische Replikation und PostgreSQL-Transaktionen erstellt.

Präsentation

Bewertungen:

Michael hob die subtilen Momente von Transaktionen hervor, die nicht nur für Anfänger sofort sichtbar sind. Jeder muss darüber Bescheid wissen.

OZO ist eine asynchrone typsichere PostgreSQL-Clientbibliothek nur für Header für C ++ 17. Sergey Handrikov, Yandex

Sergey erzählte dem Publikum, wie OZO, die asynchrone typsichere PostgreSQL-Clientbibliothek für C ++ 17, angeordnet ist, und lud ein, dazu beizutragen.

Präsentation

Bewertungen:

Meiner Meinung nach gelang es dem Autor, die Probleme in vorhandenen Bibliotheken und die Lösungen in den neuen C ++ - Bibliotheken in kurzer Zeit schnell aufzudecken. Daher bin ich froh, wenn diese Bibliotheken in OpenSource entwickelt werden, die grundlegenderen Dinge sind bereits implementiert, die sich nur freuen können.

Antworten auf die Quizfragen

Vor dem Treffen haben wir Sie eingeladen, Fragen zu Postgres zu beantworten. Heute möchte ich die richtigen Antworten zeigen. Sie sind unter den Spoilern (nur für den Fall).

Es gibt eine leere Tabelle ohne Benutzerdatensätze ("UserId" int, "balance" int). Was wird als Ergebnis der Abfrage zurückgegeben?

with ins as ( insert into users select gs, gs * 10 from generate_series(1, 4) gs where gs%2 = 0) select * from users;

Die Antwort

Nichts.

Was gibt die Anfrage zurück select * from users where UserId = 10; beim Zugriff auf die Benutzertabelle nach Abschluss des vorherigen Jobs?

Die Antwort

FEHLER: Spalte "Benutzer-ID" existiert nicht.

Definiert durch Enum CREATE TYPE Status AS ENUM ('wait', 'init', 'run', 'stop'); Welcher Befehl kann den Wert von 'init' entfernen?

Die Antwort

Es gibt keine Standardmethode zum Entfernen eines Werts aus der Aufzählung.

Wie kann ich eine Liste der Funktionen in PostgreSQL erhalten?

Die Antwort

Wählen Sie * From pg_proc;

Was wird als Ergebnis der Abfrage zurückgegeben?

 select null = null, null is null, 1::smallint::boolean is true, null::bigint > 1

Die Antwort

FEHLER: Typ smallint kann nicht in Booleschen Wert umgewandelt werden.

Der Junior-Entwickler Vasya wurde angewiesen, eine Abfrage zu schreiben, in der alle Datensätze aus der parent Tabelle angezeigt werden, für die die parent Tabelle keine Datensätze enthält.

Datenschema:

 create table parent (parent_id serial primary key, payload text); create table child (child_id serial primary key, parent_id integer unique references parent (parent_id));

Vasya war sehr bemüht und wollte sich nicht dem Dreck stellen. Deshalb stellte er acht verschiedene Fragen, um das Problem zu lösen:

 -- 0 select p.parent_id, p.payload from parent p where not exists(select from child c where c.parent_id = p.parent_id); -- 1 select p.parent_id, p.payload from parent p where not (array[p.parent_id] && array(select c.parent_id from child c)); -- 2 select distinct p.parent_id, p.payload from parent p full join child c on (c.parent_id = p.parent_id) where c.parent_id is null; -- 3 select p.parent_id, p.payload from parent p where p.parent_id not in (select c.parent_id from child c); -- 4 select p.parent_id, p.payload from parent p left join child c on (c.parent_id = p.parent_id) where c.parent_id is null; -- 5 with w_child_with_parents as ( select c.parent_id, ( select count(*) from parent p where c.parent_id = p.parent_id) = 1 as parent_exists from child c) select p.parent_id, p.payload from parent p where p.parent_id in (select pc.parent_id from w_child_with_parents pc where not pc.parent_exists); -- 6 select p.parent_id, p.payload from parent p full join child c on (c.parent_id = p.parent_id) group by p.parent_id, p.payload having count(c) = 0; -- 7 select p.parent_id, p.payload from parent p where p.parent_id in ( select p2.parent_id from parent p2 except all select c2.parent_id from child c2);

Vasya stellte Ihnen seine Optionen vor, damit Sie ihm bei der Auswahl der besten helfen können. Er behauptet, dass alle Abfragen auf die gleiche Weise funktionieren: Tabellen werden im Speicher abgelegt und der Leistungsunterschied ist nicht signifikant (oder sogar unsichtbar). Als erfahrener Entwickler haben Sie jedoch festgestellt, dass möglicherweise nicht alle Anforderungen die Aufgabe lösen. Listen Sie die Abfragen auf, die die Aufgabe nicht lösen (und erklären Sie, warum).

Kurze Antwort

Die Aufgaben 2, 3 und 5 lösen dieses Problem nicht (in einigen Fällen auch Anforderung 1).

Die Antwort auf das Ergebnis des Experiments

Testdaten:

Die "Unrichtigkeit" des Verhaltens zeigt sich, wenn die untergeordnete Tabelle Datensätze enthält, deren parent_id null ist.

 insert into parent (parent_id, payload) values (1, 'payload 1'), (2, 'payload 2'), (3, 'payload 3'), (4, 'payload 4'), (5, 'payload 5'); insert into child (child_id, parent_id) values (1, 1), (2, 3), (3, null), (5, 5);

Auf die angegebenen Testdaten

Abfrage 1 funktioniert möglicherweise, je nachdem, ob die Intarray-Erweiterung installiert ist oder nicht.
Abfrage 2 gibt eine zusätzliche Zeichenfolge zurück (null, null).
Die Abfragen 3 und 5 geben eine leere Ergebnismenge zurück.

Interpretation der experimentellen Ergebnisse

Anforderung 1: Wenn die Intarray-Erweiterung in der Datenbank installiert ist ( https://www.postgresql.org/docs/current/static/intarray.html ), stürzt die Anforderung mit dem Fehler "FEHLER: Array darf keine Nullen enthalten" ab. Dieses Verhalten ist darauf zurückzuführen, dass die Erweiterung die Standardoperatoren überschreibt und das Verhalten für Arrays mit Nullelementen ändert.

In der Dokumentation heißt es:

Die Operatoren &&, @> und <@ entsprechen den gleichnamigen integrierten Operatoren von PostgreSQL, außer dass sie nur für ganzzahlige Arrays funktionieren, die keine Nullen enthalten, während die integrierten Operatoren für jeden Array-Typ funktionieren. Diese Einschränkung macht sie in vielen Fällen schneller als die eingebauten Operatoren.

Anforderung 2: Aufgrund der vollständigen Verknüpfung wird eine zusätzliche Zeichenfolge (null, null) angezeigt.

Anforderung 3: Gibt eine leere Ergebnismenge zurück, da die von der Unterabfrage gebildete Menge Nullelemente enthält.

Dokumentation ( https://www.postgresql.org/docs/current/static/functions-subquery.html#FUNCTIONS-SUBQUERY-NOTIN ):

Beachten Sie, dass das Ergebnis des NOT IN-Konstrukts null und nicht true ist, wenn der linke Ausdruck null ergibt oder wenn es keine gleichen rechten Werte gibt und mindestens eine rechte Zeile null ergibt. Dies entspricht den normalen SQL-Regeln für boolesche Kombinationen von Nullwerten.

Abfrage 5: Gibt eine leere Ergebnismenge zurück, da der Abschnitt w_child_with_parents aufgerufen wird, die Tabellen child und parent_id leer sind oder im Abschnitt überhaupt nicht wiedergegeben werden.

Alle Fragen des Quiz wurden von drei Teilnehmern richtig beantwortet. Wir gaben dem Preis beim Treffen einen, zwei weitere Souvenirs gingen per Post.

Nachwort

Mehr als hundert Menschen kamen zu dem Treffen. Es war sehr schön, ein solches Publikum zu treffen. Laut einer Umfrage haben mehr als 60% der Mitap-Gäste mehr als fünf Jahre Erfahrung in der Arbeit mit Datenbanken. Und es ist sehr schön, wenn die Berichte vom Publikum so lebhaft aufgenommen werden:

Am Rande der Meetings wurde viel darüber gesprochen, dass PostgreSQL ein zunehmend verbreitetes Tool wird. Das ist tatsächlich so. Ich nutze diese Gelegenheit, um zu sagen, dass wir in Avito planen, das DBA-Team zu erweitern. Wenn Sie an ehrgeizigen Aufgaben für ein großes Projekt interessiert sind, schauen Sie sich die Stelle bei My Circle an oder schreiben Sie mir.

Abschließend möchte ich mich bei Kollegen von Yandex, Postgres Professional und natürlich Avito für die wunderbaren Berichte bedanken, die wir gehört haben. Vielen Dank an die Gäste, die an diesem Samstag zu uns gekommen sind und an die Live-Zuschauer. Und natürlich die # RuPostgres-Community für Vertrauen.

Playlist mit allen Berichten hier .
Wir haben Fotoberichte auf Facebook und VKontakte veröffentlicht .

Bis bald!

Materialien vom Treffen #RuPostgres - Videos, Präsentationen, Analyse des Quiz und Fotobericht

Berichte

Verteilte Transaktionen und Zeitreisen. Stas Kelvich, Postgres Professional

Skalieren einer Anwendung auf PostgreSQL in Avito: Tipps und Tricks. Konstantin Evteev, Avito

Isolationsstufen für logische Replikation und PostgreSQL-Transaktionen. Mikhail Tyurin

OZO ist eine asynchrone typsichere PostgreSQL-Clientbibliothek nur für Header für C ++ 17. Sergey Handrikov, Yandex

Antworten auf die Quizfragen

Testdaten:

Auf die angegebenen Testdaten

Interpretation der experimentellen Ergebnisse

Nachwort

More articles: