martes, 10 de febrero de 2009

Codificación Unicode UTF-8

Quiero platicarles acerca de un detalle que toda persona que se dedique a desarrollar aplicaciones Web debe tener muy en cuenta, esto debido a que existen aun muchas personas que lo pasan por alto, esto es la codificación de caracteres en el que vamos a desarrollar nuestra aplicación.

Actualmente debemos desarrollar todas nuestras aplicaciones utilizando el sistema de codificación utf-8, utilizarlo significa que debemos de guardar todos los archivos de texto utilizando un editor que este configurado previamente para guardar los documentos en esta codificación. Hay que tener en cuenta que implementar la codificación no es simplemente agregar un encabezado al header, este solo le indica al navegador en que tipo de codificación esta guardado el archivo, por lo que no necesariamente lo implementa si ya lo comprendimos en este punto.

El sistema de codificaciones es mas que una etiqueta, es el modo y espacio que cada uno de los caracteres ocupara en la memoria del disco, con las etiquetas le indicamos a los navegadores en que sistema de codificación esta guardado y por lo tanto como debe de interpretar lo almacenado en el.

Para que nuestro sistema integre al 100% la codificación debemos guardar todos nuestros archivos .aspx, asp, .js, .css, cs, vb, .php, .jsp, etc, Utilizando la codificación.
Si usamos una base de datos de igual manera debeos almacenar la información en esta codificación por lo que debemos establecerle la estructura de la base de datos para que almacene la información utilizando la codificación de caracteres a utf-8.

Si seguimos estas recomendaciones en el momento de iniciar el desarrollo ya habremos establecido las bases para desarrollar una aplicación en la que no debemos preocuparnos por estar convirtiendo información de una a otra codificación.

¿Qué problemas has tenido con las codificaciones de caracteres?

4 comentarios:

  1. la codificacion iso-8859-1 o latin1 se considera obsoleta para el desarrollo de web, esto es sin duda por las limitaciones y restricciones que impone para utilizarlo, esto es debido a que fue pensado para ser utilizado exclusivamente por el mercado latino.

    presenta un problema cuando queremos desarrollar sitios multi idioma. para los sitios de hoy en dia se recomienda utilizar el utf-8 a menos que deseemos trabajar con idiomas como el chino el cual requiere mucho mas espacio para los caracteres por lo que se debe utilizar utf-16.

    ResponderEliminar
  2. Es veldá. Como nunca he realizado un sitio multilenguaje, no he visto la necesidad de hacerlo. Pero para aplicar el UTF-8 hay que estandarizar como se manejan los datos usando las &entidades; HTML. Y luego que me da flojera parsear los datos... meh.

    Afortunadamente CakePHP tiene un sistema de internacionalización (que aún no pruebo) que supongo debe hacer fácil todo esto..

    Bueno, seguiré cocinando web con Cakephp.. Saludos

    ResponderEliminar
  3. Si seguiste las recomendaciones que hice en el post, no necesitas formatear ni 'parsear' ningun tipo de dato, simplemente debes escribir o imprimir texto tal como lo harias en cualquier editor de texto, el documento se guardara en la codificacion utf-8, el cual no necesita ser convertido a ningun otro formato, el navegador lo desplegara correctamente. Esa es precisamente la virtud de la codificacion utf-8. saludos.

    ResponderEliminar

Agradesco todos sus comentarios.