Entretien avec Zabbix: 12 réponses franches

En informatique, il y a une telle superstition: "Ça marche, ne touchez pas". Cela peut être dit à propos de notre système de surveillance. Chez Southbridge, nous utilisons Zabbix - quand nous l'avons choisi, c'était très cool. Et, en fait, il n'avait pas d'alternative.


Au fil du temps, notre écosystème a envahi les instructions, les liaisons supplémentaires et l'intégration avec Redmine est apparue. Zabbix a un concurrent puissant qui a excellé dans de nombreux aspects: vitesse, HA presque hors de la boîte, belle visualisation, optimisation du travail dans les environnements kubernethes.


Mais nous ne sommes pas pressés de traverser. Nous avons décidé de jeter un œil au scintillement dans Zabbix et de demander quelles puces ils envisagent de faire dans les prochaines versions. Nous ne nous sommes pas tenus sur la cérémonie et avons posé des questions inconfortables à Sergey Sorokin, directeur du développement de Zabbix, et Vitaly Zhuravlev, architecte de la solution. Qu'est-il advenu de cela, lisez la suite.



1. Parlez-nous de l'histoire de l'entreprise. Comment est née l'idée du produit?


L'histoire de l'entreprise a commencé en 1997, lorsque le fondateur et propriétaire de l'entreprise, Alexey Vladyshev, a travaillé comme administrateur de base de données dans l'une des banques. Il a paru inefficace à Alexey de gérer les bases sans disposer des données sur les valeurs historiques de divers paramètres, sans comprendre l'état actuel et historique de l'environnement.


Dans le même temps, la solution de surveillance présente à ce moment sur le marché est très coûteuse, lente et nécessite des ressources importantes. Par conséquent, Alex commence à écrire divers scripts qui lui permettent de surveiller efficacement la partie de l'infrastructure qui lui est confiée. Cela devient un passe-temps. Alexey change de travail, mais l'intérêt pour le projet demeure. En 2000-2001, le projet était en cours de réécriture à partir de zéro - et Alexei envisageait de donner à d'autres administrateurs la possibilité d'utiliser les meilleures pratiques. Dans le même temps, la question s'est posée sous quelle licence délivrer le code existant. Alex a décidé de le publier sous la licence GPLv2. L'outil a été immédiatement remarqué dans un environnement professionnel. Au fil du temps, des demandes d'assistance, de formation et d'extension des capacités logicielles ont commencé à arriver à Alexey. Le nombre de ces commandes est en constante augmentation. Alors, naturellement, la décision a été prise de créer une entreprise. L'entreprise a été fondée le 12 avril 2005.



2. Quels points clés pouvez-vous souligner dans l'histoire de Zabbix?


Il existe actuellement plusieurs points de ce type:
a. Le début du travail d'Alexey sur les scripts - 1997.
b. Publication du code GPLv2 - 2001.
c. Création de Zabbix - 2005
La conclusion des premiers accords de partenariat, la création d'un programme d'affiliation - 2007.
e. Fondation de Zabbix Japan LLC - 2012.
e. Fondation de Zabbix LLC (États-Unis) - 2015
g. Fondation de Zabbix LLC - 2018


3. Combien de personnes avez-vous?


Actuellement, le groupe d'entreprises Zabbix emploie un peu plus de 70 employés: développeurs, testeurs, chefs de projet, ingénieurs support, consultants, vendeurs et employés marketing.


4. Comment rédigez-vous la feuille de route, recueillez-vous les commentaires des utilisateurs? Comment déterminez-vous où aller ensuite?


Lors de la création de la feuille de route pour la prochaine version de Zabbix, nous nous concentrons sur les facteurs importants suivants, plus précisément, nous collectons la feuille de route dans les catégories suivantes:


a. Améliorations stratégiques de Zabbix. Quelque chose que Zabbix lui-même considère comme très important. Par exemple, l'agent Zabbix écrit en Go.
b. Ce que les clients et partenaires de Zabbix veulent voir sur Zabbix. Et pour lesquels ils sont prêts à payer.
c. Souhaits / suggestions de la communauté Zabbix.
d. Dettes techniques. :) Les choses que nous avons publiées dans les versions précédentes, mais qui ne fournissaient pas toutes les fonctionnalités, ne le rendaient pas suffisamment flexible, n'offraient pas toutes les options.



5. Pouvez-vous comparer Zabbix et prometheus? Quoi de mieux et de pire dans Zabbix?


La principale différence, à notre avis, Prometheus est principalement un système de collecte de mesures - et afin de collecter une surveillance complète dans l'entreprise, vous devez ajouter de nombreux autres composants au prometeus, tels que graphane pour la visualisation, un stockage séparé à long terme, gérer séparément quelque part problèmes, travailler séparément avec les journaux ...


Il n'y aura pas de modèles de surveillance typiques dans Prometheus, après avoir reçu toutes les milliers de métriques des exportateurs, vous devrez y trouver indépendamment des signaux problématiques. Configuration de Prometheus - fichiers de configuration. Quelque part c'est plus pratique, quelque part non.


Zabbix est une plate-forme universelle pour créer une surveillance «de et vers», nous avons notre propre visualisation, la corrélation des problèmes et leur affichage, la distribution des droits d'accès au système, l'audit des actions, de nombreuses options pour collecter des données via un agent, un proxy, en utilisant des protocoles complètement différents, la possibilité de rapidement étendre le système avec des plugins, des scripts, des modules ...


Et vous pouvez simplement collecter des données, comme c'est le cas, par exemple, en utilisant le protocole HTTP, puis transformer les réponses en mesures utiles en utilisant des fonctions de prétraitement telles que JavaScript, JSONPath, XMLPath, CSV et similaires. De nombreux utilisateurs apprécient Zabbix pour la possibilité de configurer et de gérer le système via une interface Web, pour la possibilité de décrire des configurations de surveillance typiques sous la forme de modèles pouvant être partagés entre eux et contenant non seulement des mesures, mais aussi des règles de détection, des seuils, des graphiques, des descriptions - Un ensemble complet d'objets pour surveiller les objets standard.


Beaucoup apprécient également la possibilité d'automatiser la gestion et la configuration via l'API Zabbix. En général, je ne veux pas organiser un holivar. Il nous semble que les deux systèmes sont bien adaptés à leurs tâches et peuvent se compléter harmonieusement, par exemple, Zabbix de la version 4.2 peut prendre des données provenant ou des exportateurs de Prometheus.


6. Avez-vous pensé à faire des saas zabbix?


Nous avons pensé et le ferons à l'avenir, mais nous voulons rendre une telle solution aussi pratique que possible pour les clients. Dans ce cas, le Zabbix standard doit être proposé avec des outils de communication, des outils avancés de collecte de données, etc.


7. Quand attendre zabbix ha? Et s'il fallait attendre?


Zabbix HA attend définitivement. Nous espérons vraiment voir quelque chose dans Zabbix 5.0 LTS, mais la situation deviendra plus claire en novembre 2019, lorsque la feuille de route Zabbix 5.0 sera pleinement confirmée.


8. Pourquoi le type de support a-t-il un choix si maigre hors de la boîte? Vous ne prévoyez pas d'ajouter Slack, un télégramme, etc.? Quelqu'un d'autre utilise-t-il du jabber?


Jabber dans la version Zabbix 4.4 a été supprimé, mais Webhooks a été ajouté. En ce qui concerne les types de supports, je ne voudrais pas créer des applications spécifiques à partir du système, mais des outils de messagerie standard. Ce n'est un secret pour personne que bon nombre de ces chats ou services de bureau disposent d'API via HTTP - par conséquent, cette année, la situation changera avec la sortie de la version 4.4.


Avec l'avènement des webhooks dans Zabbix, vous pouvez vous attendre à l'intégration la plus populaire prête à l'emploi dans un avenir proche. Dans cette intégration sera bidirectionnelle, et pas seulement de simples notifications unidirectionnelles. Et ces types de médias que nous n'obtiendrons pas seront créés par notre communauté - car maintenant le type de média entier peut être exporté vers le fichier de configuration, publié sur share.zabbix.com ou github. Et les autres utilisateurs n'auront qu'à importer le fichier pour commencer à utiliser une telle intégration. En même temps, vous n'avez pas besoin d'installer de scripts supplémentaires!


9. Pourquoi la direction de la découverte de machine virtuelle ne se développe-t-elle pas? Il n'y a que vmware. Beaucoup attendent une intégration avec ec2, openstack.


Non, la direction se développe. Par exemple, dans 4.4, la découverte du magasin de données est apparue via la clé vm.datastore.discovery. Des clés wmi.getall très cool sont également apparues dans 4.4 - nous nous attendons à ce que, avec la clé perf_counter_en, vous puissiez faire une bonne surveillance Hyper-V. Eh bien, il y aura d'autres changements importants dans cette direction dans Zabbix 5.0.



10. N'a pas pensé à abandonner les modèles et à faire comme prometeus, quand tout ce qui est donné est enlevé?


Prometheus prend automatiquement toutes les métriques, c'est pratique. Un modèle est plus qu'un simple ensemble de métriques, c'est un «conteneur» qui contient toute la configuration de surveillance de type nécessaire pour un type de ressource ou de service donné. Il dispose déjà d'un ensemble de déclencheurs importants, de graphiques, de règles de détection, il contient des descriptions de mesures et de valeurs de seuil qui aident l'utilisateur à comprendre ce qui se passe, quels seuils sont vérifiés et pourquoi. Dans le même temps, les modèles sont faciles à partager avec d'autres utilisateurs - et ils obtiendront une bonne surveillance de leur système, sans même être un expert en la matière.


11. Pourquoi y a-t-il si peu de mesures prêtes à l'emploi? Cela complique grandement la configuration en termes de fonctionnement.


Si hors de la boîte vous voulez dire des modèles prêts à l'emploi, alors en ce moment nous travaillons sur l'expansion et l'amélioration de nos modèles. Zabbix 4.4 est sorti avec un nouvel ensemble amélioré et de meilleures fonctionnalités.


Pour Zabbix, vous pouvez toujours trouver share.zabbix.com un modèle prêt à l'emploi pour presque tous les systèmes. Mais nous avons décidé que nous devions faire les modèles de base nous-mêmes, en montrant un exemple aux autres, et en libérant également les utilisateurs d'écrire à nouveau un modèle pour certains MySQL. Par conséquent, maintenant dans Zabbix, il n'y aura plus de modèles officiels avec chaque version.



12. Quand il sera possible de construire des déclencheurs qui ne sont pas liés à des hôtes, mais par exemple sur la base d'étiquettes. Par exemple, nous surveillons un site à partir de n points différents, et nous voulons un déclencheur simple qui se déclenche lorsque le site n'est pas accessible à partir de 2 points ou plus.


En fait, une telle fonctionnalité est présente dans Zabbix depuis plusieurs années, écrite pour l'un des clients. Le client est l'ICANN. Des contrôles similaires peuvent être effectués, par exemple, via des éléments agrégés ou en utilisant l'API Zabbix. Maintenant, nous travaillons activement à simplifier la création de ces chèques.


PS : Lors de l'un des Slurms, les développeurs de Zabbix nous ont demandé ce que nous voulions voir dans le produit afin de surveiller les clusters Kubernetes en utilisant Zabbix, et non Prometheus.


C'est génial lorsque les développeurs vont à la rencontre des clients, plutôt que de rester une chose pour eux-mêmes. Et maintenant, nous rencontrons chaque version avec un intérêt sincère - la bonne nouvelle est que de plus en plus de fonctionnalités dont nous avons parlé acquièrent de la chair et du sang.


Alors que les développeurs ne se replient pas sur eux-mêmes, mais s'intéressent aux besoins des clients, le produit vit et se développe. Nous suivrons les nouvelles versions de Zabbix.


PPS : Dans quelques mois, nous lancerons un cours de monitoring en ligne. À qui c'est intéressant, abonnez-vous, afin de ne pas manquer l'annonce. En attendant, vous pouvez passer par notre Kubernetes Slurm .

Source: https://habr.com/ru/post/fr472320/


All Articles