Un problema habitual cuando se trabaja con varios idiomas son los caracteres que no se usan en inglés (tildes, diéresis, cedillas, etc…). Si en algún momento necesitas cambiar el charset de un fichero puedes usar el siguiente comando:
iconv --from-code=ISO-8859-1 --to-code=UTF-8 fichero_origen.txt > fichero_destino.txt |
Eso sí, muchísimo cuidado, no se puede usar el mismo fichero como origen y destino ya que se vaciará su contenido.
Puedes usar este script para hacer el cambio en un único paso:
cp $1 $1.temp iconv --from-code=ISO-8859-1 --to-code=UTF-8 $1.temp > $1 rm $1.temp |
Puedes guardarlo en un fichero llamado ‘cambiar_charset’ y luego darle premisos de ejecución:
chmod +x cambiar_charset |
Ejemplo de uso:
./cambiar_chaset mifichero.txt |