En 2013, j'ai écrit le site
VPS Search , et au moment de la
première publication sur Habré, le catalogue contenait des informations sur 150 hébergeurs et plus de 1200 tarifs. L'ajout d'un tel ensemble d'informations n'a pas pris beaucoup de temps, car dans la première version du site, je ne montrais que les principaux paramètres tarifaires (coût, capacité du disque, taille de la RAM, fréquence du processeur, volume de trafic, pays de localisation et type de virtualisation). Toutes ces informations ont été présentées sur les sites des hébergeurs, donc, à part la copie de routine de ces données dans le panneau d'administration du site, rien n'a dû être fait.

Fin janvier 2014, j'ai présenté la
deuxième version de VPS Search, et le nombre de paramètres pour chaque tarif a fortement augmenté, les éléments suivants ont été ajoutés: type de disque, liste des systèmes d'exploitation installés, méthodes de paiement, disponibilité du panneau de contrôle inclus dans le prix, type d'administration, prise en charge IPv6. Toutes ces informations n'étaient pas disponibles sur les sites des hébergeurs, j'ai donc dû demander à chacun des hébergeurs du catalogue de mettre à jour leurs tarifs, ce qui a pris pas mal de temps.
Cependant, il s'est avéré que le remplissage du catalogue n'était pas le plus difficile: les tarifs des hébergeurs changeaient constamment, et il fallait répondre rapidement à ces changements et faire des changements.
À mon avis, les changements de tarifs doivent être surveillés très attentivement, car des données non pertinentes nuisent à la réputation du catalogue. Par exemple, un utilisateur s'est rendu sur le site, a trouvé une sorte de tarif pour 100 roubles, s'est rendu sur le site de l'hébergeur et a vu que ce tarif coûte 150 roubles. L'utilisateur peut penser que les informations du catalogue sont très obsolètes et ne sont plus utilisées. Pour exclure une telle situation, vous devez mettre à jour les informations aussi rapidement et correctement que possible.
Au moment de la rédaction du catalogue, je supposais le modèle suivant de mise à jour des informations: les hébergeurs, s'étant enregistrés sur leur compte personnel, pourront contrôler indépendamment leurs tarifs. Si l'hébergeur n'a pas une telle opportunité, je suivrai moi-même les tarifs. Cependant, par la suite, j'ai décidé de refuser de fournir un compte personnel aux hébergeurs et, à mon avis, c'était une décision très correcte. Si vous laissez les hébergeurs modifier eux-mêmes les tarifs, un certain nombre d'inconvénients surviennent:
- il faudra modérer les modifications apportées par l'hébergeur: par hasard ou exprès, mais l'hébergeur risque fort d'indiquer de manière erronée le prix du tarif (par défaut, le tri se fait par prix), et ainsi de monter en première position;
- il n'est pas clair non plus s'il faut masquer les tarifs avant la modération: si vous vous cachez, alors la modération devra être effectuée rapidement afin que les tarifs de l'hôte soient accessibles aux visiteurs, et si vous utilisez la post-modération, c'est-à-dire le risque de montrer aux utilisateurs des informations inexactes;
- l'hébergeur peut oublier bêtement de changer la description des tarifs, car il y a beaucoup de tels répertoires, et il est difficile pour les hébergeurs de garder une trace de tout le monde. Cela peut également se produire si la personne responsable de la mise à jour des informations quitte / part en vacances / tombe malade et ne transfère pas l'accès à un nouvel employé.
Au fil du temps, je suis arrivé à la conclusion que vous devez surveiller la mise à jour des tarifs vous-même et vérifier périodiquement tous les tarifs sur votre propre hôte. Bien que cela nécessite beaucoup de temps et de ressources, mais avec cette approche, les tarifs devraient être aussi pertinents que possible. Cette approche a un inconvénient en termes de ressources dépensées: pour la plupart des hébergeurs, les tarifs changent assez rarement, mais vous devez toujours les vérifier, donc dans la plupart des cas, les éditeurs regardent les tarifs et ne trouvent aucun changement significatif. Le principal inconvénient en termes de mise à jour des tarifs est l'incapacité à répondre immédiatement aux changements. Autrement dit, si nous vérifions une fois par mois, et sur certains hébergeurs, nous vérifions les tarifs le 1er jour, et le 2 du jour, l'hébergeur les a mis à jour, puis pendant près d'un mois, nous afficherons des données non pertinentes. Cependant, ce problème a été partiellement résolu: certains hébergeurs après mise à jour de leurs tarifs envoient une demande de modification.
Comprenant que lorsque des tarifs non pertinents sont sur le site pendant un mois, cela nuit grandement à la réputation, j'ai commencé à chercher des options pour corriger cette situation et automatiser le contrôle.
La toute première chose que j'ai essayé de faire était de vérifier les pages des sites hébergés pour les changements et de commencer à partir de la page principale de chaque site. L'idée était la suivante: si quelque chose a changé sur le site Web de l'hôte, un signal est envoyé aux éditeurs, qui vérifient manuellement que cela a changé et, si nécessaire, modifient les tarifs. De cette façon, les changements pourraient être suivis rapidement. Oui, dans ce cas, il y aurait beaucoup de faux positifs lorsque l'hébergeur n'a pas changé les caractéristiques tarifaires, mais autre chose, à mon avis, il vaut mieux vérifier et ne rien trouver que d'ignorer tout changement. Le script a été écrit assez rapidement, et le principe de son fonctionnement est extrêmement simple: téléchargez la page html, prenez md5 et enregistrez-le dans la base de données. Après une journée, répétez la procédure et comparez avec la valeur déjà enregistrée - si elles ne correspondent pas, la page a changé et vous devez voir manuellement ce qui a changé exactement. Cette option semblait idéale du point de vue de la commodité: pas besoin d'écrire des analyseurs de code html - il suffit de chercher des changements et c'est tout. Cependant, le lendemain du début du contrôle, les éditeurs ont été informés que la plupart des hébergeurs avaient des changements. C'était un peu étrange, et j'ai décidé de vérifier, à cause de cela, c'est arrivé. La raison s'est avérée être banale, et cela a complètement rejeté mon idée de vérifier les changements dans le code html: de très nombreux hébergeurs Web avaient des pages qui généraient automatiquement des données (par exemple, des informations sur l'heure de génération de la page, etc.), donc l'idée s'est écrasée dans une dure réalité, et cette méthode de vérification n'a pas fonctionné.
La deuxième idée qui m'est venue à l'esprit consistait à vérifier les modifications via l'API de facturation. Cependant, cela a aussi ses inconvénients. Premièrement, seule la facturation BILLmanager dispose d'une API, ce qui n'est pas si mal, car environ 40% des hébergeurs utilisent cette facturation. Le deuxième problème est une description non standardisée des caractéristiques du tarif dans la facturation, ce qui conduit à nouveau à une situation où il vous suffit de surveiller si quelque chose a changé, et si cela a changé, de voir manuellement exactement ce que vous voulez et si vous devez apporter des modifications. De plus, on ne sait pas quoi faire de la facturation WHMCS, qui est également utilisée par de nombreux hébergeurs, les moins populaires RootPanel et BPanel, ainsi que d'autres programmes de facturation écrits par les hébergeurs eux-mêmes.
Malheureusement, je n'ai pas trouvé de solution idéale jusqu'à présent, donc pour le moment nous agissons comme suit: les tarifs sont constamment vérifiés par les éditeurs, et en cas de changement, nous mettons à jour les informations du service d'assistance et découvrons les caractéristiques actuelles.
Une fois par an, nous effectuons un «gros» contrôle et ré-posons à tous les hébergeurs les mêmes questions qu'ils ont posées lors de l'ajout initial, en précisant si des paramètres ont changé.
De temps en temps, nous constatons des erreurs factuelles sur les sites des hébergeurs (par exemple, il arrive souvent qu'après avoir modifié les tarifs certaines parties des pages du site restent des informations obsolètes), que nous essayons de leur notifier immédiatement.
En mode test, les scripts fonctionnent pour vérifier les sites de ces hébergeurs qui n'ont pas généré automatiquement d'informations sur le site, donc pour certains hébergeurs nous pouvons répondre très rapidement aux changements. Toujours en mode test, un vérificateur de facturation fonctionne, et pour les hébergeurs qui peuvent le faire, nous essayons également de surveiller automatiquement les modifications.
Cette approche vous permet de répondre le plus rapidement possible à ce qui se passe et de maintenir un haut degré de fiabilité des informations du catalogue. Par exemple, nous ne recevons pas plus de 2-3 plaintes par mois concernant des erreurs dans la description, et le plus souvent elles sont liées au fait que l'utilisateur n'a pas pu trouver le tarif sur le site internet de l'hébergeur.
C'est encore loin d'être parfait, car il n'y a pas d'échappatoire à un contrôle manuel. Je serais heureux si quelqu'un pouvait conseiller plus d'options pour automatiser une tâche aussi difficile.
Jetez un œil à VPS.today , un site pour trouver des serveurs virtuels. 1500 tarifs de 130 hébergeurs, une interface pratique et un grand nombre de critères pour trouver le meilleur serveur virtuel.