怎样看汉字和西文字符的个数
很多作者朋友投稿,对杂志社征稿函中的“字符数”表示不理解。他们觉得,“字符数”不就是“汉字数”吗?其实不然,这是两码事。
很多作者朋友投稿,对杂志社征稿函中的“字符数”表示不理解。他们觉得,“字符数”不就是“汉字数”吗?其实不然,这是两码事。
字符的定义是:字符是电子计算机或无线电通信中字母、数字、符号的统称,其是数据结构中最小的数据存取单位,通常由8个二进制位(一个字节)来表示一个字符。
在ASCII 编码中,一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。
可见,字符数≠汉字数。字符数包括汉字数、标点符号和空格。显然,字符数>汉字数。
那么,如何查看一篇稿子的字符数呢?
举例说明:
字符的定义是:字符是电子计算机或无线电通信中字母、数字、符号的统称,其是数据结构中最小的数据存取单位,通常由8个二进制位(一个字节)来表示一个字符。
在ASCII 编码中,一个英文字母字符存储需要1个字节。在 GB 2312 编码或 GBK 编码中,一个汉字字符存储需要2个字节。
可见,字符数≠汉字数。字符数包括汉字数、标点符号和空格。显然,字符数>汉字数。
那么,如何查看一篇稿子的字符数呢?
举例说明:
鼠标单击稿件左下方的“字数”,会弹出一个“字数统计”的弹窗。上面会显示“页数”、“字数”、“字符数(不计空格)”、“字符数(计空格)”、“段落数”、“非中文单词”、“中文字符”等信息。
作为期刊投稿的作者而言,我们需要关注的是:“字符数(计空格)”。这个就是我们发表论文时,提及的“字符数”。
以上就是“字符数”的查阅方法。
为什么期刊收稿时,会着重强调“字符数”而不是“汉字数”呢?就让小坤给大家做一下简单科普吧!
期刊是按照版面收费的,一个版面就是一个单面,可表示为1P。作者投稿后,编辑要按照期刊的要求进行排版。每个版面不仅包括汉字、还有标点符号、段落空格、以及图表等。所以,收稿时,要按照包含空格的字符数计算,而不是汉字数。
字符数越多,意味着占的版面也就越多。一个期刊通常从几十页到两三百页不等,每一期的页数都是固定的,版面也是有限的。
杂志社作为一个事业单位或者企业,在期刊运营过程中,要付出成本投入,所以本质上,也需要盈利。如果您的稿子占用的版面越多,所需要缴纳的费用当然也会越多。
因此,如果您的稿子超出一定字符,编辑通常会询问,是否需要对字符数进行删减。如果不做删减,肯定就不能按照1个版面计算的。
在电脑内部对汉字进行传输处理和存储时使用汉字的机内码。
电脑内部汉字信息的存储运算的代码有四种:输入码、国标码、内码和字型码。
输入码:包括拼音编码和字型编码。微软拼音ABC就是拼音编码,五笔字型输入法就是字型编码。
国标码:又称为汉字交换码,在计算机之间交换信息用。用两个字节来表示,每个字节的最高位均为0,因此可以表示的汉字数为2的14次幂,就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32(即十六进制数的20),便得到国标码。例如“中”字的国标码为8680(十进制)或7468(十六进制)。
内码:汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码,进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如,“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。
字型码:表示汉字字形的字模数据,因此也称为字模码,是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时,字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵,每行24个点就是24个二进制位,存储一行代码需要3个字节。那么,24行共占用3′24=72个字节。计算公式:每行点数/8′行数。依此,对于48′48的点阵,一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。
鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com
图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!