Muchas veces al crear una Web y al poner la codificación UTF-8 se nos ha desmontado, sobre todo los carácteres especiales más latinos, que son los acentos, la ñ, las diéresis, … más usuales en la codificación ISO-8859-1.
Porqué pasa esto? UTF-8 usa carácteres universales, los más usuados en casi todas las lenguas, pero ISO-8859-1 usa carácteres latinos como el Español, Portugués e Italiano entre otros. Una forma de arreglar esto, después de indicar la codificación UTF-8 (<meta http-equiv="Content-type" content="text/html; charset=utf-8" />
) en nuestra Web, es cambiar la codificación de nuestos archivos:
Bloc de notas: Archivo -> Guardar como -> Codificación
Dreamweaver: Modificar -> Propiedades de la página -> Título/Codificación -> Codificación
Notepad++: Formato -> UTF-8
Y la tabla con las equivalencias:
Latin1 | UTF-1 | UTF-8 | UTF-7,5 | UTF-7 | JAVA | HTML |
 | ¢à | +AKA- | \u00a0 |   | ||
¡ | ¡ | ¡ | ¢á | +AKE- | \u00a1 | ¡ |
¢ | ¢ | ¢ | ¢â | +AKI- | \u00a2 | ¢ |
£ | £ | £ | ¢ã | +AKM- | \u00a3 | £ |
¤ | ¤ | ¤ | ¢ä | +AKQ- | \u00a4 | ¤ |
¥ | ¥ | Â¥ | ¢å | +AKU- | \u00a5 | ¥ |
¦ | ¦ | ¦ | ¢æ | +AKY- | \u00a6 | ¦ |
§ | § | § | ¢ç | +AKc- | \u00a7 | § |
¨ | ¨ | ¨ | ¢è | +AKg- | \u00a8 | ¨ |
© | © | © | ¢é | +AKk- | \u00a9 | © |
ª | ª | ª | ¢ê | +AKo- | \u00aa | ª |
« | « | « | ¢ë | +AKs- | \u00ab | « |
 | ¢ì | +AKw- | \u00ac | ¬ | ||
| |  | ¢í | +AK0- | \u00ad | ­ |
® | ® | ® | ¢î | +AK4- | \u00ae | ® |
¯ | ¯ | ¯ | ¢ï | +AK8- | \u00af | ¯ |
° | ° | ° | ¢ð | +ALA- | \u00b0 | ° |
± | ± | ± | ¢ñ | +ALE- | \u00b1 | ± |
² | ² | ² | ¢ò | +ALI- | \u00b2 | ² |
³ | ³ | ³ | ¢ó | +ALM- | \u00b3 | ³ |
´ | ´ | ´ | ¢ô | +ALQ- | \u00b4 | ´ |
µ | µ | µ | ¢õ | +ALU- | \u00b5 | µ |
 | ¢ö | +ALY- | \u00b6 | ¶ | ||
· | · | · | ¢÷ | +ALc- | \u00b7 | · |
¸ | ¸ | ¸ | ¢ø | +ALg- | \u00b8 | ¸ |
¹ | ¹ | ¹ | ¢ù | +ALk- | \u00b9 | ¹ |
º | º | º | ¢ú | +ALo- | \u00ba | º |
» | » | » | ¢û | +ALs- | \u00bb | » |
¼ | ¼ | ¼ | ¢ü | +ALw- | \u00bc | ¼ |
½ | ½ | ½ | ¢ý | +AL0- | \u00bd | ½ |
¾ | ¾ | ¾ | ¢þ | +AL4- | \u00be | ¾ |
¿ | ¿ | ¿ | ¢ÿ | +AL8- | \u00bf | ¿ |
À | À | À | £À | +AMA- | \u00c0 | À |
Á | Á | à | £Á | +AME- | \u00c1 | Á |
 |  |  | £Â | +AMI- | \u00c2 |  |
à | à | à | £Ã | +AMM- | \u00c3 | à |
Ä | Ä | Ä | £Ä | +AMQ- | \u00c4 | Ä |
Å | Å | Ã… | £Å | +AMU- | \u00c5 | Å |
Æ | Æ | Æ | £Æ | +AMY- | \u00c6 | Æ |
Ç | Ç | Ç | £Ç | +AMc- | \u00c7 | Ç |
È | È | È | £È | +AMg- | \u00c8 | È |
É | É | É | £É | +AMk- | \u00c9 | É |
Ê | Ê | Ê | £Ê | +AMo- | \u00ca | Ê |
Ë | Ë | Ë | £Ë | +AMs- | \u00cb | Ë |
Ì | Ì | ÃŒ | £Ì | +AMw- | \u00cc | Ì |
Í | Í | à | £Í | +AM0- | \u00cd | Í |
Î | Î | ÃŽ | £Î | +AM4- | \u00ce | Î |
Ï | Ï | à | £Ï | +AM8- | \u00cf | Ï |
Ð | Ð | à | £Ð | +ANA- | \u00d0 | Ð |
Ñ | Ñ | Ñ | £Ñ | +ANE- | \u00d1 | Ñ |
Ò | Ò | Ã’ | £Ò | +ANI- | \u00d2 | Ò |
Ó | Ó | Ó | £Ó | +ANM- | \u00d3 | Ó |
Ô | Ô | Ô | £Ô | +ANQ- | \u00d4 | Ô |
Õ | Õ | Õ | £Õ | +ANU- | \u00d5 | Õ |
Ö | Ö | Ö | £Ö | +ANY- | \u00d6 | Ö |
× | × | × | £× | +ANc- | \u00d7 | × |
Ø | Ø | Ø | £Ø | +ANg- | \u00d8 | Ø |
Ù | Ù | Ù | £Ù | +ANk- | \u00d9 | Ù |
Ú | Ú | Ú | £Ú | +ANo- | \u00da | Ú |
Û | Û | Û | £Û | +ANs- | \u00db | Û |
Ü | Ü | Ü | £Ü | +ANw- | \u00dc | Ü |
Ý | Ý | à | £Ý | +AN0- | \u00dd | Ý |
Þ | Þ | Þ | £Þ | +AN4- | \u00de | Þ |
ß | ß | ß | £ß | +AN8- | \u00df | ß |
à | à | à | £à | +AOA- | \u00e0 | à |
á | á | á | £á | +AOE- | \u00e1 | á |
â | â | â | £â | +AOI- | \u00e2 | â |
ã | ã | ã | £ã | +AOM- | \u00e3 | ã |
ä | ä | ä | £ä | +AOQ- | \u00e4 | ä |
å | å | Ã¥ | £å | +AOU- | \u00e5 | å |
æ | æ | æ | £æ | +AOY- | \u00e6 | æ |
ç | ç | ç | £ç | +AOc- | \u00e7 | ç |
è | è | è | £è | +AOg- | \u00e8 | è |
é | é | é | £é | +AOk- | \u00e9 | é |
ê | ê | ê | £ê | +AOo- | \u00ea | ê |
ë | ë | ë | £ë | +AOs- | \u00eb | ë |
ì | ì | à | £ì | +AOw- | \u00ec | ì |
í | í | à | £í | +AO0- | \u00ed | í |
î | î | î | £î | +AO4- | \u00ee | î |
ï | ï | ï | £ï | +AO8- | \u00ef | ï |
ð | ð | ð | £ð | +APA- | \u00f0 | ð |
ñ | ñ | ñ | £ñ | +APE- | \u00f1 | ñ |
ò | ò | ò | £ò | +API- | \u00f2 | ò |
ó | ó | ó | £ó | +APM- | \u00f3 | ó |
ô | ô | ô | £ô | +APQ- | \u00f4 | ô |
õ | õ | õ | £õ | +APU- | \u00f5 | õ |
ö | ö | Ã | £ö | +APY- | \u00f6 | ö |
÷ | ÷ | ÷ | £÷ | +APc- | \u00f7 | ÷ |
ø | ø | ø | £ø | +APg- | \u00f8 | ø |
ù | ù | ù | £ù | +APk- | \u00f9 | ù |
ú | ú | ú | £ú | +APo- | \u00fa | ú |
û | û | û | £û | +APs- | \u00fb | û |
ü | ü | ü | £ü | +APw- | \u00fc | ü |
ý | ý | ý | £ý | +AP0- | \u00fd | ý |
þ | þ | þ | £þ | +AP4- | \u00fe | þ |
ÿ | ÿ | ÿ | £ÿ | +AP8- | \u00ff | ÿ |
Fuente: http://czyborra.com/utf/
Muy útil, gracias.
Muchísimas gracias por ese aporte… me sacaste de apuros..
Saludos
Tengo un problema estoy migrando de isis a marc 21 y no se que conversión hacer porque no se en que codificación se convierte, al perecer es iso-8859-1 pero cuando la paso para utf-8 y la muestro en la consola de perl me salen caracteres extraños.La cuestión es que en la base esta lam(con tilde en la a) y cuando tomo el valor me pone á,así con los demás caracteres especiales.Por favor si sabes como resolver esto ayúdame.Gracias de antemano.
Excelente pagina, me has ahorrado horas de búsqueda
Tengo esta situación cuando cambio una string a utf-8, por ejemplo QUIÑONES en igual de QUIÑONES
Buenas estoy modificando un sistema de inscripciones pero cuando guarde en ansi pero se ve todo pero hay unos que estan en utp-8 y cuando pido reporte en pdf me sale una pagina en blanco, pero si lo cambio a ansi se ve bien, a que se debe eso, como debo guardar los cambios que haga en que formato se esta trabajando con php, mysql con appepeserve de servidor local.
El codigo UTF8 para la Á e Í, en el listado es à para los 2, pero en ningun caso funciona, alguna sugerencia?
Las listas no están completas en UTF-8 ya que hay caracteres no imprimibles (no se ven) En ASCII el caracter à es 195 y el segundo caracter es 129 para la Á y para la Í el primer caracter es 195 (Ã) y el segundo es 141. En visual Basic se escribe algo así:
‘para la Á
strTexto = «Ã» & Chr$(129)
‘para la Í
strTexto = «Ã» & Chr$(141)
Espero te sirva.
Cuando coloco : (dos puntos) no aparece, cual sería la conversión a utf8?