URLs semánticas en sitios web en idioma ruso

En el pasado Congreso Web de Zaragoza decidí asistir a un taller sobre internacionalización de sitios web, ya que me ha tocado poner en marcha varios sitios web con orientación muy concreta hacia otros países y me pareció un taller atractivo. Además —como dice un amigo— una de mis pedradas es Rusia y también me ha tocado desarrollar algún proyecto muy relacionado con este país, con las características particulares que esto puede imponer, como es que tengan un alfabeto diferente y que Google no sea el buscador más usado por esas tierras.

Así que una de mis dudas respecto a este tipo de desarrollos, siempre fue la de las URLs semánticas (si aceptamos que aportan cierto valor de cara a la indexación y el posicionamiento de los contenidos) cuando el alfabeto con el que trabajas es cirílico, chino, japonés, coreano o lo que sea.

Realmente, esta duda nunca me ha supuesto problema práctico alguno, porque como luego explico, siempre he optado por alguna de las posibilidades que pienso que hay para elegir, pero como existen distintas formas de enfocarlo, me apetecía conversar con personas que también tuviesen experiencia al respecto. Y quienes mejor que las que puedes encontrar alrededor de un taller de internacionalización de sitios web en un escenario como fue el CWZGZ.

La cuestión era bien sencilla. Cuando en un sitio web trabajas con un alfabeto que no es el “tradicional occidental” (a-z), ¿cómo dispones las URLs semánticas de tu sitio web? Me interesaba saber cómo resuelven este tema otras personas.

Además de charlar con Carmen Urbano, profesional que impartió el taller de internacionalización de sitios web (realmente muy útil e interesante, dicho sea de paso a toro pasado), tuve ocasión de preguntar a otras personas. Siento no recordar nombres de aquellos cuya conversación más me impactó, pero es lo malo que tiene que cuando te presentas, tu interlocutor no haga lo mismo.

Una de las respuestas con las que me encontré, y no una sola vez:

- Pues en el idioma de origen

- Pero, por ejemplo con el ruso, el idioma de origen maneja un alfabeto cirílico

- ¿Cómo busca la gente? En su idioma, pues las URL en su idioma

- Pero no vas a meter cirílico en la URL del navegador, ¿lo transliteras?

- El idioma, tal cual. En la URL se pone lo que busque el usuario usando su idioma

- OK, gracias

Impactante. Desolador. Muchas gracias por iluminarme. Con el inglés te puede valer, pero con otros alfabetos, como te estaba preguntando y te he repetido en dos ocasiones, a mi no me cuadra. Quizás otro rato hable de este tipo de expertos cultivados en los for Dummies de Amazon, pero ahora sigo con lo mío.

Me tomo al pie de la letra la recomendación, así que como en la URL tengo respetar el idioma de origen íntegramente, si el contenido de mi sitio web son los coches, mi dominio va a ser:

http://www.машина.ру

Supongo que tampoco optaríamos por meter acentos y eñes en un dominio en español, así que nos vamos a permitir hacer un pequeño cambio:

http://www.mashina.ru

Me parece un poco mejor. Y ahora, vemos algunas de las posibilidades que tendríamos para una URL con algo de contenido semántico para la sección de coches nuevos de la marca Lada, y en la que podríamos haber considerado como palabras clave нови o новая (nuevo o nueva, no viene al caso ahora las distinciones entre uno y otro) y лада (Lada):

http://www.машина.ру/нови/лада/

http://www.mashina.ru/нови/лада/

http://www.mashina.ru/?q=new&p=123

http://www.mashina.ru/new/lada/

http://www.mashina.ru/novi/lada/

Bien, marco en rojo la que creo que puede ser la mejor opción, y esto no es más que una apreciación que puedo extraer de los proyectos en los que he aplicado esta opción, y de la experiencia de ir haciendo búsquedas, principalmente con Google (Rusia) y Yandex.

Hay quien no puede o quiere dedicar tiempo a este aspecto de la optimización de un sitio web y directamente opta por una URL con variables y valores, o bien una URL amigable, pero que no aporta contenido semántico. Esto se hace con cualquier proyecto web, independientemente del idioma o país.

Luego podemos encontrar quienes optan por hacer URLs semánticas usando contenidos de la versión en inglés, y siempre que te coincidan los mismos contenidos en inglés que en ruso puede ser una opción válida. Como el resto de opciones, si haces clic y no hay error 404, genial. Pero mezclar contenido en ruso con URLs que contienen términos en inglés siempre me ha parecido chocante. Y si no hay una versión en inglés de los contenidos y aún así se establecen URLs con términos en inglés, es cuando ya no encuentro la lógica.

Así que la mejor opción es la de transliterar el título de la página, o cualquier otro texto que determinemos, para formar la URL semántica optimizada para idioma ruso. No dependeremos de que exista una versión en inglés, o cualquier otro idioma, para generar la URL y  evitamos direcciones en las que aparezcan variables y otros elementos que no aporten contenido.

Búsqueda en Google con ruso transliterado 

Búsqueda en Google.ru con ruso transliterado

Búsqueda en Yandex con ruso transliterado 

Búsqueda en Yandex con ruso transliterado

Búsqueda en Google con ruso cirílico 

Búsqueda en Google.ru con ruso (cirílico)

Búsqueda en Yandex con ruso cirílico 

Búsqueda en Yandex con ruso (cirílico)

Google suele arrojar muchos más resultados, pero cantidad no es lo mismo que calidad. Yandex, como buscador, tiene más cuota de usuario en Rusia y, entre otras muchas cosas que hace mejor, me da la sensación de que sus resultados se suelen aproximar más a los resultados buscados por nuestras consultas. Además, también pienso que Yandex gestiona mucho mejor la transliteración, de modo que si un usuario está buscando новая машина (coche nuevo), puede valorar mejor una página con una URL del tipo /mashina/novi/ que no /car/new/ y por supuesto aquella que directamente pase variables y valores en la URL.

Puedes comprobar cómo Yandex, además de sugerencias en tiempo real, entiende las consultas que hace el usuario y facilita correcciones y “versiones” en cirílico de una búsqueda. Bastante útil si estamos buscando contenidos, sean del tipo que sean, por nombres propios (personas, ciudades, empresas…)

Lograr esto resulta tan sencillo como incorporar una función que se encargue de la transliteración, cambiar las letras del alfabeto cirílico por letras de un alfabeto “occidental” (aunque me guste bien poco esta forma de llamar a este alfabeto).

машина = mashina

нови / новая = novi / novaya

лада = lada

Habitualmente se suelen incorporar funciones para maquillar las URLs semánticas, eliminando artículos, preposiciones, acentos, eñes, espacios en blanco, etc… no cuesta mucho más hacer que en la URL semántica de un sitio web en ruso aparezca el mismo contenido pero con su transliteración.

Si te ha interesado el tema de la transliteración, aquí tienes algunas direcciones útiles:

http://www.translit.ru/

http://www.rusklaviatura.com/

Translit (PHP Classes)

Y si has llegado hasta aquí, es que todo esto te parece de interés o utilidad. Quizás has tenido que realizar algún sitio web en idioma ruso (o en otro alfabeto distinto al nuestro). ¿Decidiste usar URL amigables o semánticas? ¿Cómo las resolviste?

Soy periodista especializado en comunicación y contenidos digitales. SEO para Rusia; producción, optimización y posicionamiento de contenidos en ruso para Yandex y buscadores rusos. Arquitectura de información, comunicación, formación. Desarrollo de proyectos web. Profesor asociado en Universidad San Jorge y ESIC.

  • http://twitter.com/EzFr EzFr

    Yo tengo el mismo problema, pero añadido el ruso, chino, japonés, etc. el problema es que el navegador traduce el utf-8 (www.лещи.bg) a punycode (http://www.xn--e1agh1d.bg/), para que lo mantuviese en la
    barra de navegación habría que mostrar este campo en el vínculo mediante el urlencode () en PHP.
    Ni siquiera el gobierno ruso lo tiene resuelto http://правительство.рф

  • Pingback: Optimizar WordPress para el SEO en Yandex » antoniolite

  • Iván

    Hola Anotnio, muchas gracias por tu artículo, es muy interesante. Actualmente tengo que crear una versión en ruso para la web del sitio donde trabajo y estoy buscando información sobre la mejor forma de crear las URLs. Por tu artículo, entiendo que la transliteración es lo ideal. En el caso nuestro, las URLs las genero yo manualmente para después subir el contenido. Existe alguna web donde haga automáticamente la transliteración? Ya que yo recibiré los contenidos ya traducidos al ruso y de ahí, tendré que crear las URLs.

    Muchas gracias.

    • http://antoniolite.com/ antoniolite

      Hola Iván. Puedes usar translit.ru, por ejemplo.

      Si tienes los contenidos en cirílico, copias y pegas, haz clic en el botón “в транслит” y obtienes la versión transliterada. Si la quieres pulir un poco, cambia espacios en blanco por guiones, pones todo en minúsculas (una vez transliterado no necesitas teclado en cirílico ni nada) y listo.

      • Iván

        Muchas gracias por tu rápida respuesta. He encontrado otras webs con las que también hacer la transliteración, por ejemplo:

        http://www.translitteration.com/transliteracion/es/ruso/iso-9/
        http://translitor.net/

        Como verás, permite seleccionar diferentes sistemas de transliteración: iso9, ala-lc, bgn, …

        Recomiendas algún sistema en concreto para el caso que nos ocupa de las URLs?

        Muchas gracias otra vez y enhorabuena por tu web.

Este blog funciona gracias a WordPress con el theme GimpStyle diseñado por Horacio Bella.
Entradas y Comentarios feeds. XHTML y CSS válidos.