Em 2013, escrevi o site
VPS Search e, na época da
primeira publicação em Habré, o catálogo continha informações sobre 150 hosters e mais de 1200 tarifas. A adição desse conjunto de informações não demorou muito tempo, pois na primeira versão do site mostramos apenas os principais parâmetros tarifários (custo, capacidade do disco, tamanho da RAM, frequência do processador, quantidade de tráfego, país de localização e tipo de virtualização). Todas essas informações foram apresentadas nos sites dos hosters, portanto, além da cópia rotineira desses dados para o painel de administração do site, nada tinha que ser feito.

No final de janeiro de 2014, apresentei a
segunda versão do VPS Search, e o número de parâmetros para cada tarifa aumentou bastante, foram adicionados: tipo de disco, lista de sistemas operacionais instalados, métodos de pagamento, disponibilidade do painel de controle incluído no preço, tipo de administração, suporte IPv6. Todas essas informações não estavam nos sites de host, então eu precisei de cada host apresentado no catálogo para fazer perguntas para atualizar suas tarifas, o que levou bastante tempo.
No entanto, como se viu, o preenchimento do catálogo não foi o mais difícil: as tarifas dos hosters estavam constantemente mudando, e era necessário responder rapidamente a essas mudanças e fazer alterações.
Na minha opinião, as mudanças nas tarifas devem ser monitoradas com muito cuidado, pois dados irrelevantes prejudicam a reputação do catálogo. Por exemplo, um usuário foi ao site, encontrou algum tipo de tarifa por 100 rublos, foi ao site do hoster e viu que essa tarifa custa 150 rublos. O usuário pode pensar que as informações no catálogo estão muito desatualizadas e não podem mais ser usadas. Para excluir essa situação, você precisa atualizar as informações o mais rápido e corretamente possível.
No momento da redação do catálogo, assumi o seguinte modelo de atualização de informações: os hosters, registrados em sua conta pessoal, poderão monitorar independentemente suas tarifas. Caso o hoster não tenha essa oportunidade, eu mesmo seguirei as tarifas. No entanto, posteriormente, decidi me recusar a fornecer uma conta pessoal aos hosters e, na minha opinião, essa foi uma decisão muito correta. Se você permitir que os hosters editem as tarifas, surgirão vários inconvenientes:
- será necessário moderar as alterações feitas pelo hoster: por acaso ou de propósito, mas o hoster pode indicar incorretamente o preço da tarifa (por padrão, a classificação é feita pelo preço) e, assim, subir para a primeira posição;
- também não está claro se as tarifas devem ser ocultadas antes da moderação: se ocultas, a moderação precisará ser executada prontamente para que as tarifas do host sejam acessíveis aos visitantes e se a pós-moderação for usada, ou seja, existe o risco de exibir informações falsas aos usuários;
- o hoster pode muito pouco esquecer de alterar a descrição das tarifas, já que existem muitos desses diretórios e é difícil para os hosters acompanharem todos. Isso também pode acontecer se a pessoa responsável pela atualização das informações sair / sair de férias / adoecer e não transferir o acesso a um novo funcionário.
Com o tempo, cheguei à conclusão de que você mesmo precisa monitorar a atualização tarifária e fazer periodicamente uma verificação de todas as tarifas em seu próprio host. Embora isso exija muito tempo e recursos, mas com essa abordagem, as tarifas devem ser o mais relevantes possível. Essa abordagem tem menos em termos de recursos gastos: para a maioria dos hosters, as tarifas mudam muito raramente, mas você ainda precisa verificá-las; portanto, na maioria dos casos, os editores examinam as tarifas e não encontram mudanças significativas. A principal desvantagem em termos de atualização de tarifas é a incapacidade de responder imediatamente às mudanças. Ou seja, se checarmos uma vez por mês, e em alguns hosters, verificarmos as tarifas no 1º dia, e no segundo dia em que o hoster as atualizou, por quase um mês exibiremos dados irrelevantes. No entanto, esse problema foi parcialmente resolvido: alguns hosters, após atualizarem suas tarifas, enviam um pedido de alteração.
Entendendo que, quando há tarifas irrelevantes no site por um mês, isso prejudica bastante a reputação, comecei a procurar opções para corrigir essa situação e automatizar a verificação.
A primeira coisa que tentei fazer foi verificar as páginas dos sites hospedados quanto a alterações e começar a partir da página principal de cada site. A ideia era a seguinte: se algo mudou no site do host, um sinal é enviado aos editores, e eles manualmente verificam se ele mudou e, se necessário, fazem alterações nas tarifas. Dessa maneira, as mudanças podem ser monitoradas rapidamente. Sim, nesse caso, haveria muitos falsos positivos quando o hoster não alterasse as características tarifárias, mas outra coisa, no entanto, na minha opinião, é melhor verificar e encontrar nada do que ignorar qualquer alteração. O script foi escrito rapidamente, e o princípio de sua operação é extremamente simples: baixe a página html, pegue o md5 e salve-o no banco de dados. Após um dia, repita o procedimento e compare com o valor já salvo - se eles não corresponderem, a página foi alterada e você precisará ver manualmente o que exatamente foi alterado. Essa opção parecia ideal do ponto de vista da conveniência: não é necessário escrever nenhum analisador de código html - apenas procurando por alterações e é isso. No entanto, no dia seguinte ao início da verificação, os editores receberam uma notificação de que a maioria dos hosters teve alterações. Foi um pouco estranho, e eu decidi verificar, por causa disso aconteceu. O motivo acabou sendo banal, e rejeitou completamente minha ideia de verificar alterações no código html: muitos hosts da web tinham páginas que geravam dados automaticamente (por exemplo, informações sobre a hora em que a página foi gerada etc.), então a ideia entrou em uma dura realidade, e esse método de verificação não funcionou.
A segunda ideia que me veio à mente foi verificar se há alterações na API de cobrança. No entanto, isso também tem suas desvantagens. Em primeiro lugar, apenas o faturamento do BILLmanager possui uma API, o que não é tão ruim, pois cerca de 40% dos hosters usam esse faturamento. O segundo problema é uma descrição não padronizada das características da tarifa no faturamento, que novamente leva à situação em que você só precisa monitorar se algo mudou e se mudou, ver manualmente o que exatamente e se você precisa fazer alterações. Além disso, não está claro o que fazer com o faturamento do WHMCS, que também é usado por muitos hosters, os menos populares RootPanel e BPanel, além de outros programas de faturamento criados pelos próprios hosters.
Infelizmente, até agora não encontrei uma solução ideal, por isso, no momento, estamos agindo da seguinte forma: as tarifas são constantemente verificadas pelos editores e, em caso de alterações, atualizamos as informações do serviço de suporte e descobrimos as características atuais.
Uma vez por ano, fazemos uma verificação "grande" e re-perguntamos a todos os hosters as mesmas perguntas que eles fizeram durante a adição inicial, especificando se algum parâmetro foi alterado.
Ocasionalmente, encontramos erros factuais nos sites dos hosters (por exemplo, geralmente acontece que, após a alteração das tarifas, algumas partes das páginas do site permanecem com informações desatualizadas), e tentamos notificá-los imediatamente.
No modo de teste, os scripts funcionam para verificar os sites dos hosters que não geraram informações automaticamente no site; portanto, para alguns dos hosters, podemos responder rapidamente às alterações. Também no modo de teste, um verificador para cobrança funciona e, para os hosters que podem fazer isso, também tentamos monitorar automaticamente as alterações.
Essa abordagem permite que você responda o mais rápido possível ao que está acontecendo e mantenha um alto grau de confiabilidade das informações no catálogo. Por exemplo, não recebemos mais de 2 a 3 reclamações por mês sobre erros na descrição e, na maioria das vezes, estão relacionadas ao fato de o usuário não conseguir encontrar a tarifa no site do hoster.
Ainda está longe de ser perfeito, pois não há como escapar de uma verificação manual. Ficaria feliz se alguém pudesse aconselhar mais opções para automatizar uma tarefa tão difícil.
Dê uma olhada no VPS.today , um site para encontrar servidores virtuais. 1500 tarifas de 130 hosts, uma interface conveniente e um grande número de critérios para encontrar o melhor servidor virtual.