Bagaimana kami menggunakan sistem pemantauan ritel Zabbix

Sistem pemantauan seperti Zabbix tidak mengejutkan bagi pengguna yang canggih. Namun, di ritel mereka tidak sering menjadi tamu, dan jika digunakan, maka semakin banyak untuk kontrol server. Kami melangkah lebih jauh dan menggunakannya untuk memantau perangkat lunak dan peralatan mesin kasir.



Mengapa sistem pemantauan jarang ditemukan di ritel


Semuanya sangat transparan di sini: pengecer dan perusahaan jasa jarang menggunakan sistem pemantauan, karena sulit untuk mengevaluasi efisiensi ekonomi mereka. Dengan diperkenalkannya proses bisnis, semuanya sederhana - uang X dan upaya X. Tetapi untuk menghitung berapa banyak mereka menyelamatkan pengecer di masa depan lebih sulit.

Kontraktor layanan biasanya tidak menerapkan sistem pemantauan juga karena mereka tidak mengurangi pentingnya pekerjaan mereka. Ini logis: Zabbix memungkinkan Anda mengidentifikasi masalah sebelum klien melihatnya. Di satu sisi, ini meningkatkan kualitas layanan yang diberikan. Di sisi lain, klien terkadang memiliki kesan keliru bahwa proses bisnisnya diatur dengan sempurna dan bekerja tanpa bantuan pihak luar. Tetapi ini dapat diselesaikan dengan memberikan pelaporan tepat waktu.

Namun, bahkan pengecer yang setuju untuk menerapkan sistem pemantauan biasanya berakhir dengan kontrol server, komputer kantor, catu daya tak terputus, dan peralatan jaringan aktif. Kami melakukan ini juga:

  • dari server kami memperoleh data tentang pemanfaatan prosesor, kinerja kipas, hard drive, memori, suhu prosesor, dan motherboard;

  • dari sumber daya yang tidak pernah terputus - status, tingkat pengisian daya, informasi tentang berapa banyak waktu mereka akan bekerja jika listrik padam;

  • dari peralatan jaringan - lalu lintas di pelabuhan, pemanfaatan sumber daya.

Sebagai bagian dari informasi yang diterima, permintaan otomatis dibuat di Service Desk. Sejumlah data lain membantu kami dalam menyelidiki insiden. Contoh klasik: pengguna mengeluh bahwa komputernya lambat. Tanpa sistem pemantauan, sulit untuk dilacak - baik ketika insinyur menghubungkan semuanya akan baik-baik saja, atau karyawan memiliki kesan subyektif (PC yang bekerja lemah secara objektif bekerja lebih lambat daripada komputer game mewah yang ada di rumah). Oleh karena itu, kami mempelajari retrospektif - grafik untuk saat seseorang mengamati masalah.

Tetapi semua hal di atas adalah hal biasa, bukan hal baru. Kebetulan kami melangkah lebih jauh dan dengan bantuan Zabbix mulai memantau kinerja perangkat lunak mesin kasir dan peralatan mesin kasir. Kami melakukan ini untuk pengecer internasional besar yang secara luas terwakili di pasar Rusia baik di segmen makanan maupun non-makanan. Juga, sistem pemantauan regional kami diperoleh oleh beberapa penggiat jejaring regional, yang sekarang dapat secara independen mengontrol kinerja proses bisnis mereka.

Mengapa kami mulai melakukan ini?


Terus terang, sistem pemantauan dilaksanakan di Pilot secara spontan, tanpa proyek dan sebagian. Jika keputusan tentang ini datang dari atas, mungkin kita akan mengikuti jalur kontraktor layanan lain dan tidak akan repot. Tapi kami telah memulai pengenalan karyawan linier - insinyur. Dihadapkan dengan gangguan khusus pada peralatan mesin kasir atau gangguan perangkat lunak, mereka mencari cara untuk mencegahnya di masa depan. Dan mereka datang dengan ide sistem pemantauan.

Dengan itu, kami mendapatkan tiga opsi untuk menyelesaikan masalah:

  • preventif - perbaiki masalah sebelum terjadi. Misalnya, ketika memantau hard disk, kita melihat bahwa ruang di dalamnya telah berkurang ke level kritis. Dan kami mengambil tindakan dalam hal ini;

  • setelah fakta - kami menyelesaikan masalah setelah itu terjadi. Misalnya, kipas pada prosesor gagal. Prosesornya masih memanas, tetapi sedang bekerja. Cepat atau lambat, tentu saja, itu akan gagal, tetapi sejauh ini kami memiliki kesempatan untuk mengganti kipas. Artinya, pengguna belum memperhatikan kejadian itu, tetapi dia sudah melakukannya. Dari sudut pandangnya, kami memecahkan masalah secara proaktif, tetapi dari sudut pandang peralatan - setelah fakta;

  • analitis - kami mendapatkan sejumlah besar data dalam retrospeksi untuk mengurai insiden.




Tentu saja, sistem pemantauan kami tidak mempengaruhi semua mesin kas karena tidak selalu masuk akal. Ambil pemindai barcode. Mereka bekerja atau tidak. Dan dalam kasus kedua, karyawan toko akan melaporkan masalah kepada kami jauh lebih cepat daripada sistem pemantauan. Oleh karena itu, kami fokus pada kontrol terminal POS dan cash register (CCP) .

Pemantauan Kesehatan CCT


CCP memberikan informasi yang cukup kepada pengemudi untuk memungkinkan Anda menilai kinerjanya. Sebagai contoh:

  • Berbagai data inventaris - versi perangkat keras, firmware, driver, nomor seri. Secara umum, komposisi peralatan pada layanan ditetapkan dalam lampiran kontrak dan disimpan dalam CMDB, namun, pelanggan bebas untuk memindahkan dan mengganti peralatan sesuai keinginannya. Tentu saja, dia tidak selalu ingat bahwa akan menyenangkan untuk memberi tahu perusahaan jasa tentang hal ini. Di sinilah sistem pemantauan datang untuk menyelamatkan, yang melacak perubahan dalam konfigurasi peralatan. Kami menulis modul integrasi yang mengoreksi CMDB sesuai dengan data inventaris dari Zabbix. Selain melacak konfigurasi peralatan yang sebenarnya di fasilitas layanan, itu, ditambah dengan fungsi deteksi otomatis dari sistem pemantauan, dengan cepat mengurangi waktu untuk memulai inventaris klien baru, jika pekerjaan tersebut disediakan oleh kontrak.


Studi kasus: banyak yang mungkin mengingat kasus bug di firmware salah satu produsen KKT pada bulan Desember 2017? Segera setelah informasi pertama tentang masalah muncul, kami menyiapkan pemicu di Zabbix, memberi sinyal versi firmware yang mengandung bug, dan mendapatkan daftar CCP yang perlu ditangani segera.

  • Kode status CCP adalah parameter yang sangat baik yang memungkinkan Anda untuk melacak hampir semua kerusakan, mulai dari mengatur waktu yang tidak tepat atau kepanasan kepala printer hingga adanya data fiskal yang tidak terkirim pada drive fiskal.

Kontrol Perangkat Lunak Tunai


Sebagai bagian dari kontrol program tunai, kami memantau berbagai tanda:

  • kemampuan layanan - apakah perangkat lunak dihidupkan atau tidak, apakah membuka beberapa port jaringan atau sedang menunggu koneksi;

  • entri dalam log - biasanya perangkat lunak menulis ke log tentang masalah yang dihadapi, menghasilkan serangkaian kesalahan. Sebagai tanda tidak langsung, jika log berubah, maka perangkat lunak berfungsi, jika tidak ada entri baru di dalamnya, maka Anda perlu membuat permintaan;

  • pada kenyataannya, log itu sendiri - jika ada pesan kesalahan, pemicunya akan menyala. Setelah diproses, catatan ditransfer ke ELK: Logstash log dihapus melalui API Zabbix;

  • hasil perangkat lunak integrasi yang mengunduh, mengonversi, dan mengirim data (misalnya, mentransfer informasi ke EGAIS, OFD, menerima sejumlah barang). Jadi, paket data yang baru-baru ini salah terbentuk dengan nomenklatur menonaktifkan perangkat lunak terminal pembayaran mandiri, melumpuhkan pekerjaan mereka di salah satu toko klien kami. Berkat sistem pemantauan, kami berhasil melokalisasi masalah tepat waktu;

  • versi perangkat lunak dan driver - kadang-kadang situasi muncul ketika, misalnya, versi dua program tidak kompatibel, tetapi agar perangkat lunak tunai dapat berfungsi, mereka perlu berinteraksi;

  • Basis data - kami memantau kemudahan layanan, ketersediaan port jaringan, jumlah basis data, versinya, dan jumlah basis data yang dimatikan;

  • layanan eksternal (misalnya, EGAIS, yang dengannya kami berinteraksi melalui jaringan IP dalam mode otomatis).




Masalah yang paling sering masuk ke sistem pemantauan


Paling sering, Zabbix memberi sinyal kepada kami tentang masalah jaringan: tidak dapat diaksesnya perangkat, waktu respons yang terlalu lama. Lebih lanjut ada kesulitan dalam pemanfaatan sumber daya: PC berdaya rendah biasanya digunakan untuk mesin kasir. Masalah ketiga yang paling umum adalah validitas data dari sistem eksternal.

Cukup sering, pesan tentang waktu setempat yang salah datang. PC tunai biasanya tidak masuk ke dalam AD dan layanan ntp harus dikonfigurasi di sana secara terpisah, yang kadang-kadang dilupakan. Dan waktu yang salah di kasir penuh dengan masalah besar bagi toko: misalnya, menjual alkohol ketika dilarang, yang dapat menyebabkan denda atau kehilangan lisensi.

Penipuan dan downtime


Bidang kegiatan lain di mana Zabbix, yang kebetulan, ternyata cukup berguna, adalah perang melawan penipuan. Kebetulan kontraktor di wilayah atau insinyur lapangan individu, yang dibayar secara terpisah, mengadakan konspirasi dengan pengguna pelanggan dan menyelesaikan masalah yang sebenarnya tidak ada. Kita dapat membawanya ke air bersih dengan menganalisis indikasi sistem pemantauan. Meskipun ini dilakukan secara manual, ketika lonjakan aktivitas yang mencurigakan direkam di lokasi tertentu, tetapi kami sedang bekerja untuk memverifikasi aplikasi secara otomatis dengan pembacaan Zabbix dalam semua kasus di mana hal ini dimungkinkan.

Sekarang dari sistem pemantauan kami menerima 15 hingga 25% aplikasi. Ini adalah jumlah yang cukup kecil, tetapi pada akhir tahun ini kami ingin membawanya hingga 50% untuk pelanggan yang telah menandatangani perjanjian layanan dengan kami.

Source: https://habr.com/ru/post/id442044/


All Articles