Internacionalització, localització, codificació, Islàndia i traducció d’un lloc web de fotos de gats japonesos

traducció internacionalització

InternacionalitzacióHi ha molta informació a l’hora d’internacionalitzar, localitzar i codificar en aplicacions web. També hi ha molts malentesos sobre el que cadascun proporciona per a una aplicació web. Aquí teniu la meva idea ...

Quan un navegador web estableix una connexió amb un servidor web, passa moltes variables i fa sol·licituds addicionals, en teniu un exemple:

GET / HTTP / 1.1
Amfitrió: www.dknewmedia.com
Agent d'usuari: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Accepta: HTTP Accepta = text / xml, application / xml, application / xhtml + xml, text / html; q = 0.9, text / normal; q = 0.8, image / png, * / *; q = 0.5
Accept-Language: en-us, en; q = 0.5
Accept-Coding: gzip, deflate
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internacionalització

La internacionalització és un conjunt de moltes coses:

  1. Localització: Capacitat per identificar de quin idioma i ubicació visita un visitant. Això es fa a través de Sol·licituds HTTP on el visitant és identificat per una configuració regional. En el meu cas, això és als Estats Units. "En" és anglès i "US" són els Estats Units. Aquesta és una configuració del meu sistema operatiu.
  2. Zones horàries: La possibilitat d’ajustar-se per zones horàries. Això normalment s’aconsegueix configurant el servidor a una hora mitjana de Greenwich (GMT) i després permetent als usuaris establir el seu desplaçament local respecte al GMT.
  3. Codificació de caràcters: Aquesta és la possibilitat de mostrar correctament els conjunts de caràcters d'idioma. És diferent de la localització, ja que la localització em pot indicar l'idioma i la regió de l'ordinador des del qual fa la sol·licitud, però no em dirà de quin idioma lector sol·licita ... això depèn del lector!

Tingueu en compte a la meva capçalera HTTP quan el navegador va fer la sol·licitud i va dir al servidor que sol·licitava la meva configuració regional (Accept-Language: en-us); tanmateix, també ha d’indicar al servidor quin joc de caràcters es demana (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) -8859 són conjunts de caràcters permesos.

Localització

En aquest fantàstic món barrejat, la localització ja no dicta la llengua. Tot i que estic als Estats Units, puc llegir absolutament un idioma diferent amb un conjunt de caràcters diferent ... això és el que passa quan faig servir Google Hindi (Realment no faig servir Google Hindi). La meva sol·licitud de configuració regional i el conjunt de caràcters són idèntiques a les que sol·licito Google anglès pàgina, però en realitat m’alimenten una pàgina que no sé llegir perquè no tinc el conjunt de caràcters. Tot surt ??????????? ... No obstant això, puc carregar aquest conjunt de caràcters a Firefox (Firefox> Preferències> Avançat> Idiomes):

Idioma de càrrega del Firefox

Si carregueu aquest idioma, podré sol·licitar la pàgina en el seu conjunt de caràcters nadiu i mostrar-la al meu ordinador, tot i que la meva configuració regional predeterminada sigui en EUA.

Així que ... si sóc estudiant d’hindi, estudio anglès a Purdue i estic connectat mitjançant VPN al servidor de l'escola, de vacances a Austràlia ... hi ha tres paràmetres diferents que s'han d'aplicar a l'aplicació per ser realment internacionalitzats - i cap depenen de l’altre.

La meva configuració local apareixeria com a EUA, però la meva zona horària és Austràlia, però l’idioma que sol·licito al lloc web pot ser hindi. Si hagués de programar la meva sol·licitud suposicions segons la configuració regional del meu ordinador, m’equivocaria totalment: alimentar la persona anglesa en una zona horària de l’Est. L’ideal seria programar la meva sol·licitud per oferir-la ambdós configuració d'idioma i zona horària ... però no els assumiria en funció de la configuració regional.

Islàndia: l’exemple final

Desconeixem els reptes multilingües i multilingües als Estats Units on ens trobem tots parla anglès [sarcasme implícit]. En alguns països, com ara Islàndia, tot i que la llengua materna és l’islandès, els increïbles islandesos creixen aprenent tres idiomes. Atès que Islàndia és un país al centre d'Europa i Amèrica del Nord, les seves empreses treballen a diversos continents, idiomes, dialectes d'idiomes i diverses zones horàries des del seu escriptori.

Molts llocs web islandesos es construeixen en anglès dels Estats Units, anglès del Regne Unit, islandès, espanyol, espanyol, francès i alemany. Imagineu el difícil que seria construir Icelandair's aplicacions de llocs web i sistemes de venda de bitllets ... wow!

EXCLUSIÓ DE RESPONSABILITAT: He tingut el plaer absolut de treballar amb la bona gent d'Islandair i us puc dir que són alguns dels professionals més talentosos i simpàtics amb els quals he tingut el plaer de treballar. És simplement un país i gent fantàstica! Aneu a visitar ... agafeu Icelandair i no deixeu de visitar el blue Lagoon!

Llenguatge versus codificació

Fins i tot hi ha codificacions de caràcters diferents en un mateix idioma que no es juguen bé entre elles. Exemple: un correu electrònic japonès escrit en Shift-JIS pot resultar il·legible a l'ordinador d'una persona japonesa amb la localització configurada a ja-JP perquè el seu servidor de correu només reconeix EUC-JP. Idealment, un client hauria de poder definir quina codificació voldria i quin idioma, simplement assegurant-se que la codificació i l'idioma siguin compatibles amb el que sol·licita el client.

Si vull llegir japonès, és possible que hagi de seleccionar tant el japonès com a idioma I SHIFT-JIS per a la codificació per mostrar correctament aquest idioma. Aquí hi ha més confusió per afegir a la barreja ... alguns tipus de codificació admeten diversos idiomes. UNICODE / UTF8 admet dotzenes. El contrari també és cert. Alguns idiomes es poden llegir en molts tipus de codificació. Si això no té sentit ... Disculpeu, és un tema molt complex.

Algun dia crec (espero) que tot canviarà. Crec que els dissenyadors originals de codis de localització esperaven que el combinat idioma-país fos tot el necessari ... però ens hem tornat molt més sofisticats. Recordeu, gran part d’això es va desenvolupar abans que existís Internet. Amb l'arribada de GIS, potser una persona pot seleccionar la seva codificació i el SIG gestionaria la informació sobre la zona horària i la configuració regional.

Internacionalització

Torna al suport per a la internacionalització. Si voleu proporcionar una sol·licitud internacionalitzada, heu de:

  1. Admet diversos tipus de codificació, idiomes i disposa de fitxers de traducció per mostrar aquestes traduccions.
  2. Permeteu al client establir el seu idioma i, fins i tot, potser el seu tipus de codificació, si cal.
  3. Donar suport als fusos horaris permetent als usuaris fer referència a la seva zona horària en comparació amb GMT.
  4. Utilitzeu els codis de localització amb precaució ... NO representen amb precisió el que realment sol·licita el vostre usuari ni el que pot llegir.

Traducció

La traducció automàtica encara està en els seus inicis. Hi ha diversos llocs web (i WordPress connectors) que ofereixen traducció automàtica del vostre lloc. No tingueu la temptació de fer-ho ... hi ha dues raons per les quals:

  1. Si la traducció automàtica funciona, l'usuari que estigui comprovant el vostre lloc ja tindrà un traductor amb qui treballar.
  2. La traducció automàtica és una merda.

No em creguis? Aquí teniu una traducció al japonès:
Enganxat de Fitxer Masatsu - un noi amb un munt d’imatges de gats:

Entrada de bloc japonès

???
- 00:29:35 per masatsu

??????????????????????????????
??????????????????????????

?????????? (?)?

?????????????????????????????????????????
???????????????????????????????

???????????????????????????????????? (?)

?????????????????

??????????????
???
???

???????????????????????????

???????????????????????????????

????????????????????????????????????????
???????????????????????????????????
?????????? Ag ???????????????

??????????????????????????????????????

Traducció automàtica:

?? Hann ?????
-00: 29: 35 per masatsu

El nom del sant puny d'un / l'elefant que va aparèixer ahir a la "flota de punys de la bèstia ??" guardabosc ”“ ?? Hann ???? ” amb un actor de ràdio Yutaka Mizushima….

? (?) que fa sípia fàcilment.

Perquè fins i tot l’actor de ràdio del sant puny, mestre ????? d'un / el gat són el codony xinès d'un Nagai Ichiro = bola de drac el bastó d'un / el ?? El guardabosques sembla que la gent que en sap enginyosament ho sap fàcilment.

?????? (La suor) que oblidava completament aquest any "el secret del nom de la súper flota", de la pràctica habitual cada any?,

?????? Si escric tard aquest any,

??????? santuari ??? (com pot?)? assassinat de cap (?? no tallat) Fukami ?? (? o observar capaç?) un / és el que fa

?????? Amb, es converteix en "una llauna /? /?", És a dir, "kung fu", quan es fa una fila i es canvia el cap d'un / el nom.

?????? Tot i que es diu que augmenta dos addicionals suposadament, pot convertir-se en quin tipus de nom.

Es diu que la veritat és "edat" perquè el símbol de l'element de plata és Ag?, Tot i que el nom de "el ????" plata ”el Takaoka? tècnic de ??????? estava pensant que el personatge es deia "?" s'utilitzava amb l'associació d'una pel·lícula de pantalla de plata, si la crida amb un membre addicional.

?????? No obstant això, estic pensant egoístament que la meva teoria no té cap relació que "?" està inclòs en un caràcter xinès.

Estic segur que invertir la polaritat d’aquesta traducció proporcionaria una dicció igualment llegible en anglès. Vau entendre l’entrada, oi?

2 Comentaris

  1. 1

Què et sembla?

Aquest lloc utilitza Akismet per reduir el correu no desitjat. Esbrineu com es processa el vostre comentari.