DOS/
Windows
和Linux/Unix的文件换行回车格式不同,基于 DOS/
Windows
的文本文件在每一行末尾有一个 CR (回车)和 LF (换行),而 UNIX 文本只有一个换行。
1 )、把Dos/Windows 下的文件移至Linux/Unix系统
虽然很多程序不在乎 DOS/Windows格式的 CR/LF文本文件,但是有几个程序却在乎——最著名的是 bash ,只要一遇到回车,它就会出问题。以下 sed调用将把 DOS/Windows格式的文本转换成可信赖的 UNIX 格式:
$ sed -e 's/.$//' mydos.txt > myunix.txt (有可能吧最后一行以一些字符去掉了,要检测下)
该脚本的工作原理很简单:替代规则表达式与一行的最末字符匹配,而该字符恰好就是回车。我们用空字符替换它,从而将其从输出中彻底删除。如果使用该脚本并注意到已经删除了输出中每行的最末字符,那么,您就指定了已经是 UNIX格式的文本文件。也就没必要那样做了!
2 )、把Linux/UNIX文本移至 Windows系统,使用以下脚本执行必需的格式转换:
$ sed -e 's/$/\r/' myunix.txt > mydos.txt
在该脚本中,'$' 规则表达式将与行的末尾匹配,而 '\r' 告诉 sed在其之前插入一个回车。在换行之前插入回车,立即,每一行就以 CR/LF结束。请注意,仅当使用 GNU sed 3.02.80或以后的版本时,才会用 CR 替换 '\r'.
iconv 的使用方法
iconv---编码转换
用法: iconv [选项...] [文件...]
有如下选项可用:
输入/输出格式规范:
-f, --from-code=名称 原始文本编码
-t, --to-code=名称 输出编码
信息:
-l, --list 列举所有已知的字符集
输出控制:
-c 从输出中忽略无效的字符
-o, --output=FILE 输出文件
-s, --silent 关闭警告
--verbose 打印进度信息
-?, --help 给出该系统求助列表
--usage 给出简要的用法信息
-V, --version 打印程序版本号
例子:
iconv -c -f utf-8 -t gb2312 aaa.txt >bbb.txt
这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,忽略无效的字符,其输出定向到bbb.txt文件。
utf-8 和 gb2312 在 windows 上看是一样的。在linux下是有区别的。粘贴、复制utf-8编码的字都会改变其编码,变为gb2312(windows下)。只有通过ftp 才能保证它的编码不变化。
本文来自ChinaUnix博客,如果查看原文请点:http://blog.chinaunix.net/u2/65250/showart_1949928.html
分享到:
相关推荐
linux修改mysql字符集 linux修改mysql字符集
当装完oracle11g由于当时装的匆忙发现数据库的编码不对,显示编码为AL32UTF,要想显示中文需要改成ZHS16GBK.
linux环境上运行项目,出现部分乱码,则通过修改字符集来解决
Linux下修改oracle字符集 Linux 下修改 oracle 字符集:WE8ISO8859P1 修改为 ZHS16GBK. WE8ISO8859P1 字符集是安装 oracle 时默认字符集,不支持中文。
linux 下的 oracle 导入数据库时出现中文乱码,通过修改字符集格式,修改成支持中文的格式。简单易操作。
修改 Linux系统默认字符集 解决oracle安装乱码问题
qt实现转换文件字符集编码
NULL 博文链接:https://darkmasky.iteye.com/blog/600056
linux 字符集转换脚本,稍微修改脚本即可批量修改文件解决字符编码导致的文件乱码问题
linux下设置mysql字符集为UTF-8以及mysql重启
Linux下修改MySQL字符集 1.查找MySQL的cnf文件的位置 find / -iname '*.cnf' -print /usr/share/mysql/my-innodb-heavy-4G.cnf /usr/share/mysql/my-large.cnf /usr/share/mysql/my-small.cnf /usr/share/mysql/...
Windows字符集.pdf
修改linux系统客户端、服务端字符集详细操作步骤。
用途:创建指定大小以随机字符填充的文件、替换文件中随机位置指定大小的内容为随机字符、指定位置插入指定大小的随机字符,支持大文件操作,详情请参照README文档 有源代码和应用程序,需要扩展的朋友可以直接在源...
oracle字符集的查看,oracle客户端字符集的修改
将windows上的文件编码格式转化为U-TF8,在移植windows代码到linux下的时候很有用,避免注释代码为乱码,以及编码格式引起的编译错误!
linux下的字符编码转换方法。教你如何实现Linux下的编码转换。
字符集转换程序
gb18030所有字符集与码表,表
支持包安装成功后,转换工具 (gbunicnv.exe) 和微软4字节字符集编码支持包 (ms4bsp.dll) 会被安装在系统的 Program Files\GB18030Tools 文件夹下。用户可通过 Windows 2000 中的中文内码(Unicode) 输入法输入所需的 ...