Olá Habr! Apresento a você a tradução do artigo
"Strategien zur Lokalisierung von Content", de Nicolai Goschin.
Definir a localização do conteúdo e, portanto, definir o idioma da interface do produto para que o idioma correto seja exibido para o usuário certo é extremamente importante para cada plataforma digital.
Antecedentes e Considerações Preliminares
Os projetos digitais destinados ao público em diferentes países ou em diferentes áreas do idioma desejam tirar proveito das estratégias de localização, portanto, devemos responder à seguinte pergunta: quais usuários devem receber qual conteúdo e em quais idiomas? A questão à primeira vista parece simples. Porém, mais adiante neste artigo, indicaremos por que esse tópico é, de fato, complicado. E, é claro, também veremos como lidar com essa complexidade.
À medida que nos aprofundamos no tópico de localização neste artigo, existem dois mecanismos que precisamos entender desde o início. A primeira é a configuração do idioma do navegador e a segunda é o endereço IP do usuário.
Configuração de idioma do navegador
Cada vez que um site é solicitado, o navegador envia automaticamente o idioma do navegador para o servidor, que pode ser configurado pelo usuário através das configurações do navegador. O idioma padrão é o idioma do sistema operacional. É importante saber que a maioria dos usuários não sabe que pode alterar o idioma. Cada idioma geralmente consiste em dois parâmetros: o próprio idioma e a região. A Alemanha usa de-de, ou seja, Alemanha-Alemanha, Áustria usa de-at, que significa "Alemanha-Áustria", e os EUA usam en-us.
Além disso, o usuário pode especificar uma lista de idiomas na ordem de suas preferências, por exemplo, por exemplo: en-us, en, de. Nesse caso, a primeira opção do usuário é o inglês na região dos EUA, o inglês independente da região é sua opção secundária e o alemão independente da região é o menos exigido.
IP do usuário
Um endereço IP (abreviado, "IP") é um "endereço da Internet" personalizado. Este é um número designado que pode ser usado para identificar um usuário na Internet e contém informações sobre sua localização. Por exemplo, você pode determinar o país a partir do qual um visitante visita o site por endereço IP. Isso é possível porque determinados intervalos de IP são atribuídos a países individuais. Por exemplo, endereços IP entre 2.16.240.0 e 2.16.255.255 são atribuídos à Alemanha. Se o usuário tiver um endereço IP 2.16.265.100, sabemos que essa pessoa está se conectando à Internet da Alemanha.
Note-se que existem outros métodos que podem ser usados para determinar a localização do usuário. No entanto, neste momento nós os omitimos, porque eles finalmente fornecem as mesmas informações que o endereço IP.
Portanto, agora sabemos que existem duas fontes nas quais informações podem ser obtidas sobre o idioma ou o local (país) do usuário. Nesta fase, consideraremos como podemos usar essas informações para localização, ou seja, adaptação do conteúdo para vários idiomas.
Localização linguística
A forma mais simples e comum de localização é a linguística, com base nas configurações do idioma do navegador. Este método pressupõe que o usuário definiu o idioma desejado nas configurações do seu navegador.
Na Alemanha, a maioria dos usuários usa de-de, de e en. Essa combinação implica que o conteúdo em alemão é preferido para a Alemanha (de-de). Se esse conteúdo não estiver disponível em um site específico, será utilizado o conteúdo alemão de qualquer outra região, mesmo que não se aplique à Alemanha (de). Se não houver outro conteúdo em alemão, a versão final do inglês será usada.
No cenário que descrevemos na introdução (revista on-line com versões em alemão, inglês e árabe), todos os clientes que definiram seu código de idioma para devem receber conteúdo em alemão. Em outras palavras, esses são todos os usuários cujo idioma principal é de-de, de-at, de-ch, de e assim por diante.
Para usuários que também entendem inglês ou árabe, a situação é um pouco mais fora do padrão. Embora os países de língua alemã (que se reúnem na chamada região DACH) se limitam geograficamente, isso não se aplica aos países de língua inglesa ou de língua árabe. Por exemplo, o inglês é falado nos EUA, Inglaterra e Austrália. Além disso, o inglês é o idioma que as pessoas entendem melhor após o idioma nativo na maioria dos países do mundo. É por isso que geralmente é indicado como um idioma adicional em todas as configurações do navegador.
Portanto, se em nosso cenário descrito configuramos a localização do site apenas com base no idioma do navegador, os usuários dos EUA e da Austrália receberão nosso conteúdo em inglês. Usuários do Egito e Emirados Árabes Unidos verão conteúdo em árabe. Tudo está indo bem.
Desvantagens da localização, dependendo da configuração de idioma do navegadorEsse tipo de definição de idioma se torna problemático se o idioma instalado no navegador não corresponder ao idioma nativo do usuário. Isso pode ocorrer, por exemplo, quando um usuário de língua alemã trabalha na Alemanha em uma empresa internacional na qual o sistema operacional e, por padrão, o navegador também estão configurados para inglês (en). Este usuário verá o conteúdo em inglês, mesmo que seu idioma nativo seja o alemão.
Um problema semelhante ocorre em países onde o idioma oficial ou comercial é geralmente o inglês, mas a população fala um idioma diferente. É o caso, por exemplo, de países como os Emirados Árabes Unidos.
Localização geográfica baseada em IP
As desvantagens da localização de idioma são parcialmente compensadas pela localização baseada em IP. No último método, o idioma é determinado com base no país a partir do qual o usuário tem acesso à Internet.
À primeira vista, a localização baseada em IP parece ser uma solução impermeável, pois permite o caso descrito acima quando o navegador configurou um idioma divergente. Assim, usando esse método, um usuário na Alemanha sempre recebe conteúdo em alemão, mesmo que seu navegador esteja instalado, por exemplo, em inglês como idioma principal.
Desvantagens da localização IP
Então, a localização baseada em IP é uma panacéia? Quem pensa assim está errado. A suposição básica é que todos os usuários que estão no mesmo país são falantes nativos desse idioma. E isso, é claro, está longe da realidade. Por exemplo, alguém que está na Alemanha, mas fala apenas inglês, verá todo o conteúdo da Web em alemão, embora o site também esteja disponível em seu idioma nativo.
Por fim, a localização baseada em IP ignora as configurações de idioma do navegador e baseia-se apenas na localização. Por exemplo, encontramos essa desvantagem quando trabalhamos na Internet durante as férias e não vemos nenhum conteúdo em nosso idioma nativo. Em vez disso, as páginas da web são exibidas apenas no idioma do país em que estamos localizados.
Localização combinada
Para elaborar uma solução mais ideal, agora é possível combinar as duas abordagens descritas para que possamos lidar melhor com esses casos limítrofes. Queremos dizer casos em que não devemos confiar apenas no endereço IP ou no idioma do navegador. Como descrito acima, isso é válido para falantes não nativos no país host e usuários com preferências de idioma do navegador configuradas incorretamente.
E aqui está como lidamos com esses casos:
- Usamos a localização IP como critério principal, ou seja, somos selecionados a partir da localização geográfica do usuário, como, por exemplo, a Alemanha.
- Em seguida, verificamos se um determinado local também foi definido nas configurações de idioma do navegador. Se houver uma correspondência, exibimos o conteúdo no idioma apropriado. Se as duas fontes de dados não corresponderem, usaremos a localização IP. A principal suposição aqui é que um usuário de um determinado país provavelmente domina o idioma nacional até certo ponto.
- Por fim, verificamos se o conteúdo está disponível em outros idiomas do navegador. Nesse caso, exibimos uma janela pop-up (semelhante a uma notificação de cookie) informando ao usuário que a página da web também está disponível nos idiomas alternativos listados nas configurações do navegador. Para que os visitantes do site possam mudar para outro idioma ou fechar a janela pop-up com um clique.
- Os cookies são usados para determinar se o usuário mudou o idioma ou rejeitou a janela pop-up. E na próxima sessão, o conteúdo será exibido no idioma selecionado.
Por exemplo, um usuário acessando a Internet do Egito, mas usando um navegador com o idioma alemão definido como idioma principal, verá uma janela pop-up. O conteúdo será exibido inicialmente em árabe. No entanto, o usuário verá coletivamente a seguinte mensagem em alemão: “Este site também está disponível em alemão. Deseja atualizar para a versão alemã?
Agora podemos aplicar a mesma lógica a vários idiomas alternativos (idiomas que são exibidos se o idioma necessário não estiver disponível), definindo regras específicas.
Acesso via Google
Outra vantagem desse método diferenciado é que ele permite controlar melhor o acesso ao site por meio de mecanismos de pesquisa como, por exemplo, o Google. Os mecanismos de pesquisa levam em consideração o idioma do navegador e não necessariamente a localização do usuário. Assim, um usuário que acessa o site por meio de um mecanismo de pesquisa é sempre direcionado para uma versão que corresponde ao idioma do navegador, mesmo se houver uma correspondência melhor com o local (com base no endereço IP). O usuário ainda pode mudar para outro conteúdo de idioma relevante através da janela pop-up descrita acima.
Conclusão
É necessário levar em consideração a combinação “usuário do idioma do conteúdo” não apenas para facilitar o uso ou, melhor, para a conveniência do usuário, mas também para marketing e estratégia. Portanto, a tarefa acima não afirma ser absolutamente correta - o objetivo específico do projeto é um fator decisivo. No entanto, se você levar em consideração o local e o idioma (ou seja, o endereço IP e a configuração do idioma do navegador), os resultados serão muito melhores, pois os casos de borda também podem ser processados corretamente.