萌娘百科衷心希望新型冠状病毒肺炎疫情早日结束!
  • 你好~!欢迎来到萌娘百科!如果您是第一次来到这里,点这里加入萌娘百科!
  • 欢迎具有翻译能力的同学~有意者请点→Category:需要翻译的条目
  • 如果您在萌娘百科上发现某些内容错误/空缺,请勇于修正/添加!编辑萌娘百科其实很容易!
  • 觉得萌娘百科有趣的话,请推荐给朋友哦~
  • 萌娘百科群119170500欢迎加入,加入时请写明【萌娘百科+自己的ID】~
  • 萌娘百科Discord群组已经建立,请点此加入!

汉字

萌娘百科,万物皆可萌的百科全书!转载请标注来源页面的网页链接,并声明引自萌娘百科。内容不可商用。
跳转至: 导航搜索
存活时间最长的文字
基本资料
用语名称 汉字
其他表述 中文字、中国字、𡨸汉(越南语:chữ hán/hán tự)、かんじ(日语平假名)、한자(韩语)
相关条目 汉语日语韩语越南语
拉丁字西里尔文字希腊文字波斯-阿拉伯文字

汉字是指汉字文化圈中的的视觉符号系统,使用范围为东亚、东南亚地区。又名中文字、中国字

现代汉字是指楷化后的汉字,包括繁体字和简体字。

简介

虽然两河文明的「楔形文字」和古埃及文明的「圣书字」比华夏文明的「汉字」要早,但是楔形文字已于公元前1世纪左右逐渐消亡,圣书字的使用也结束于公元5世纪末。换句话说,高达九成的自源文字民族被消灭了,所以现代的表意文字只有汉字;其他的文字要么被其他的民族二次创作成拼音文字,要么被毁灭和遗弃。

公元前一千多年所创造的古汉字与现代汉字之间存在着某种区别,可是这种区别仅仅是字体书法上的修改。

汉字不是象形文字,甲骨文中只有少数象形字。特别是汉字从篆书变为隶书之后,象形字完全不象形了。把汉字体系说成象形文字,对古代和对现代来说,都不符合事实。

近代之前,汉字一直以来被作为远东地区的官方外交文字。随着鸦片战争、近代东亚传统文化的衰落以及朝贡体系的崩溃,英语取代汉语成为了新的东亚外交通用语,大部分使用汉字的国家和地区均抛弃或简化了汉字。

造字简史

现实造字

实物收藏家
  • 做个标记:早期人们为弥补口头语言的局限而采用较为简单的方法(结绳、结珠、刻木、刻符、岩画),它们对简单表意和记忆有一定效果,但不能表达复杂和抽象意义,与语言单位没有任何联系。后来可能觉得原始图画也太麻烦,所以想创造出更为概括的符号系统。
  • 记性不好:大概人的记忆力对数字最没有办法,特别需要符号帮助。
灵魂画师
  • 最低成本原则:人们一定会用最低成本的方式(直观、简单)无中生有地创造出一套表达概念的符号系统,古老的文字(埃及圣书体、两河楔形文字、汉字、玛雅文字、纳西族东巴文、水族的水书)无一例外全是用「象形」的方式(也有少量流行的记号被吸收为文字符号)。
  • 拒绝「死记硬背」:在当时,人们不可能分析自己发音,然后发明一套对应语音的符号。因为表达内容跟语音是没有必然联系的,只能先死记硬背才能用上。而象形字只要别太抽象,别人不用学习,也能看懂高达八成
我来组成头部
  • 无法表达抽象概念:人们的生活越来越复杂,所需要的语词和文字也越来越丰富,而且用简单的图画表示一些细微差别是不可能的;所以人们用「指事」「会意」等方式表达抽象概念。
  • 符号不够啊!:用于构形的符号是有限的,而且很多意义单位无法通过图画的形式表示,出于高效便捷的需求使用「假借」(三大古典文字都有)的方式(一些字的读音很像,可以直接拿来用)。如果汉字完全有「假借」的倾向,那么每一个音节就都只有一个汉字,就会变成拼音文字。
  • 用字混乱:但假借字多了后在实践中就会导致极端的混乱,因为字本身就有一个意义,再加上好几个意义,就难以断定代表的是哪个词。所以在假借的基础上加一些表意字改进成「形声」的方式,这种方式大大提高了文字表达的明确性,是文字体系形成过程中的一个极为重要的步骤。商代甲骨文中的形声字占20%,现代汉字中形声字的数量达到了97%。
  • 留着部首:虽然这些表意文字离发展成字母只有一线之隔,但高达九成的表意文字不会自行变化成表音文字,可能觉得部首是有用的,所以没有转变为纯表音文字。

玄学造字

传说中,仓颉造字惊天动地,而天雨粟、鬼夜哭。

仓颉是黄帝时期的史官,因为他有4只眼睛,所以他能看到世间上很多事情。他日思夜想,到处观察,看尽了天上星宿的分布情况、地上山川脉络的样子、鸟兽虫鱼的痕迹、草木器具的形状,描摹绘写,造出种种不同的符号,并且定下了每个符号所代表的意义。他按自己的心意用符号拼凑成几段,拿给人看,经他解说,倒也看得明白。

形体演变

经历了从甲骨文、金文、大篆、小篆的演变,到汉朝产生了隶书,从此汉字基本定型。

古文字(商代至秦代,公元前三世纪晚期)
  • 甲骨文:用来请示鬼神的工具,埋藏在地下。后来,有位老哥生病服中药时,看到名叫「龙骨」的小石片一斤只值几分钱,上面有刻纹;他认为这可能是一种古文字。这种中药,碾成粉末可以治刀伤,加水煎汤可以治惊悸、盗汗、疟疾。不知道有多少人把古文字吞进肚子里去了。晚近多次发掘,一共得到有字甲骨十几万片,整理出4000多字,已经释读了1000多字。据说,对破译未释读甲骨文并经专家委员会鉴定通过的研究成果,单字奖励10万元;对存争议甲骨文作出新的释读并经专家委员会鉴定通过的研究成果,单字奖励5万元
  • 金文:表示铸刻在以钟、鼎为代表的古铜器上的文字。因为「钟鼎文」不能涵盖所有古铜器上的文字(除此之外还有鬲、簋、爵、尊、罍、盘、铙、镈等数十种青铜器),所以从清代开始,学者们有意使用「金文」称呼。
  • 篆书:篆书只是用于金石铭刻的「标准体」,而不是日常使用的「手写体」。汉代人将「篆书」分为「大篆」(指西周晚期的规范化篆书,以「籀文」为代表)和「小篆」(特指秦始皇「书同文」所用的规范化秦篆);但因为内涵和外延一直都没有公认的说法,很容易引起概念上的混淆,所以现在古文字学界已经停用「大篆」这个名称。
  • 古隶:篆书与古隶是并行的。隶书与篆书之间,是书体风格之别,而非文字构形之别。用隶书笔法表现的秦文字,叫「秦隶」;用篆书笔法表现的秦文字,叫「秦篆」。
现代文字
  • 隶书/佐书:主要将篆书圆转的笔划改为方折,书写速度更快,在木简上用漆写字很难画出圆转的笔划。在篆书基础上,为适应书写便捷的需要产生的字体就小篆加以简化,又把小篆匀圆的线条变成平直方正的笔画,便于书写,分秦隶(古隶)和汉隶(今隶)。
  • 草书:形成于汉代,是为书写简便在隶书基础上演变出来的。
  • 楷书/正书:初期楷书仍残留极少的隶笔,结体略宽,横画长而直画短。
  • 行书:楷书的草化或草书的楷化。它是为了弥补楷书的书写速度太慢和草书的难于辨认而产生的。笔势不像草书那样潦草,也不要求楷书那样端正。楷法多于草法的叫「行楷」;草法多于楷法的叫「行草」。

造字方法

随着社会的发展,原来的象形字逐渐不敷应用,于是便出现了形声字,其造字能力很强,现在大部分汉字均属于形声字,越南的喃字甚至几乎全部是形声字

六书

东汉许慎在《说文解字》中对汉字的构成和使用方式的归纳。

  • 象形:用文字的线条或笔画勾画想要表达物体的外形特征。来自于图画文字,是一种最原始的造字方法。例如:日、月、月、雨、口、羊、泉、山。
  • 指事/象事/处事:用象征性符号勾画出较抽象的概念。例如:上、下、凹、凸、一、二、三、亦、刃、寸、高。
  • 会意/象意:用两个或多个独体字组成新的字形与字义。例如:酒、鸣、明、众、家、森、从、休、奀。
  • 形声/象声/谐声:表示类属的「形旁/义符」与表示相近发音的「声旁/音符」组成新字。其中形部代表该汉字的类别,声部则代表该汉字的发音。至少在春秋战国时期形声字便开始普及。
  • 转注:制造「同义字」的方法。例如:考与老、窍与空。
  • 假借:用已有音同或音近的汉字去表达新意。一字兼表数意,造成了一些同音同形而异义的词。通假是用字法,本有其字,假借是造字法,本无其字。例如:自(鼻子)、钱(田器)。
三书

二十世纪30年代,唐兰第一个开始批判传统「六书」理论,并且提出了关于汉字构造的新理论。陈梦家在1956年出版的《殷墟卜辞述》的「文字」章里,描绘了甲骨文字的发展过程,并且附带谈到整个汉字发展的问题,把汉字分为象形、假借、形声三种类型。

  • 象形/表意:画出了一个物件,或一些惯用的记号,叫人一见就能认识这是什么。人身的形是「象身」,自然界一切生物和非生物的形是「象物」,人类的智慧的产物是「象工」。
  • 假借:图画文字的主要部分,包括旧时所谓「会意字」和「指事字」的大部分。
  • 形声:形声字是原有的图画文字经过孽乳、转注、发展来的。

汉字的迷思

好多字啊

用「形声」的方法造字,理论上可以设计出无限多的新字。根据这项原则,把简单的书写符号作为材料成对地结合起来,这种结构方式可以容易而迅速地表示任何一个本身难以画出的词。

很快,成百上千个这种形声合体字就被相继造了出来,高达九成的汉字都是根据这项原则构成的。因为这种方法太容易了,所以导致人们任意地造出了许多不必要的字,最大的汉语字典包括了四万多个不同的字。据统计,全世界最全的汉字字库,共收录汉字91251个,Unicode收录的汉字数量甚至达到了93859个(注)。但是,在数量繁多的基础上,汉字的高频字又非常集中,通用字和常用字只有几千个。乍一看很多字,实际上学会几百个简单的书写符号(基本材料),后面只是个拼字问题。每个常用字我都认识,但合起来就不知道在说什么

  • 在延续了三千多年的中国文学作品中经常通用的汉字只有六七千个。
  • 学会大约四千个汉字就足够用了。
  • 要阅读现代的书报杂志,人们只需致力于掌握两三千字就行了。

字不变,但音变

在拼音文字中,字形能够与语音演化的步调一致,再现语言的音变。但在汉语中是不可能的,汉语字符的写法早已彻底固定,不能改变了。因此,汉语的语音在不断地变化,但汉字的形体却相对固定,这使得千百年之后的形声字已经不能正确反映它在造字时代的读音。以「家」为例:在公元前的一段时期里它读/kɔ/,在公元500年它读/ka/,在17世纪它读/kia/,在现在的北京话里它又念/jia/。

现代中国人能够阅读和理解古代典籍,正是因为其中的文字与今天所使用的一样。他能认出这些字,并把它们连起来,得出包含在古代典籍中的意义,但对于这些字在成书时代的读法却一无所知。汉语有大量的方言,在这些方言中,古汉语的词通过彼此迥异的道路发展着;因此,尽管广州人和北京人用完全不同的方式朗诵古书,可是他们同样都能理解古书的内容。

中国方言众多,同一个汉字可能在不同方言中的读音差异巨大,但其基本意思在不同方言中保持一致,因此,可以看出表意是汉字的本质属性。


参见:汉语方言

表意文字还是意音文字

  • 表意文字/语素文字:字符只代表语素,而不代表音节的文字系统。每一个字符都有其独立的含义。包括意音文字(已知的语素文字都不局限于表形和表意,而是有表音的成分)。历史上发展成熟而又代表高度文化的表意文字只有西亚的楔形文字、北非的圣书字和东亚的汉字。楔形文字和圣书字早已废止和不再使用,汉字是当今世界上唯一仍被广泛采用的语素文字。
  • 意音文字:字符既代表语素,又代表音节的文字系统。在意音文字中有部分表意字(构成要素只和形体或事实有直接联系,不能表音),例如:象形字、指事字、会意字。也有只和语素的读音有联系的表音字,例如:假借字。只有少量只记录语音的字,不能通过字形表达意义,例如:秋千、沙发。还有既和语意有联系,也和语音有联系的半表意半表音字,例如:形声字。

「汉字是意音文字」尚未得到学界的普遍认可,因为汉字虽然意音兼顾,但总体而言重于表意(虽然形声字很多,但表音性很弱),且表音成分也不同于表音文字的表音符号,所以可以宽泛地称之为具有一定表音功能的表意文字。

书同文

书同文指以秦文字作为规范字形,消灭不合秦式的六国文字。「书同文」最主要的功绩就是消灭了战国以来「文字异形」的局面。以秦文字作为规范字形,消灭不合秦式的六国文字。

因为战国时期,周王室衰微,各国独立性有了很大提高,同时文字的应用也越来越普遍,使得文字形体发生了前所未有的剧烈变化。总而言之,产生的俗体字形与传统正体的差别相当大。因为俗体使用得非常广泛,所以传统的正体几乎已经被冲击得溃不成军了。因为建立在宗周故地的秦国,地处西陲,又比较落后闭塞,使得秦文字变化不大,反而最忠实地继承了殷商文字的传统。

秦始皇从来没下过「简化汉字」的命令,因秦始皇而改动的秦文字用十个手指头就能数完(其目的大多是为了避讳,而非针对汉字形体的简化)。「书同文」奠定了之后两千多年里文字统一的基础,同时由于其「尊古」的特点,使得秦文字能够成为沟通殷周文字与汉代文字的桥梁。

文言与白话

人们认为文言和白话的界限总是泾渭分明的,例如:文言不用「了」,白话不用「矣」。但有时候,文言和白话的界限并不清楚(半文半白)。文言和现代语并不是两种对立的语言,虽然现代汉语是现代人用的,古代汉语是古人用的(古汉语不等于文言),两者迥然不同;但是「不同」有程度深浅的分别:深可以深到全不通,如汉语和外语;浅的只是不全通,而文言和现代汉语的差别只是不全通。

书面语一定比口语精简。当时人们视「精简」为一种高的风格,不少文人就会用力求笔下实现这种风格。当时受物质条件的限制,不能不简。在有纸以前,记言,文字要写在竹木上,编成册或编,传抄也是这样。这很费事,不得不用化简的办法来调节,例如:《易经》的卦辞、爻辞,《尚书》,《春秋》、《左传》。就算是这样言简意赅,写成书也会笨重得不得了,官府的储存不用说,就是私学,也是《庄子•天下》中的「惠施多方,其书五车」。这费工笨重的程度,随着纸和印刷术的发明、改进而逐渐减轻,但就是到今天,写和夸夸其谈究竟不一样,为了经济些,书面的还是不得不求简。一繁一简,其间自然就形成距离。


参见:文言文

通假字不是错别字

通假狭义指假借一个音同或音近的字来表示一个本有其字的词,所以本有本字的假借是典型的通假显形。

通假字就是古人书写某个词的时候,没有写本字,而用了一个音同或音近的字。二字只有读音上的联系,而没有意义上的瓜葛,于是我们就说它们是通假关系。

规范字的「通」字,是因为本有其字,但未形成统一规范用字。

拉丁化

民国时期,由于中国积贫积弱,部分知识分子认为汉字阻碍了教育的普及,决定将汉字改造为拼音文字。

1867年,在英国使馆任中文秘书的威妥玛(Thomas F. Wade,用现代译法叫托马斯·F.维德)创造了第一组汉语拼音,使用时间很长,对汉字的拉丁化起了重要作用,以后的方案都有参考。后人称为韦氏拼音,著名的常凯申便是起源于此。

1918年民国政府颁布注音符号,至今台湾仍在使用。但它并非绝对的音素文字,而是类似于日语假名,一个音节用一个字母表示。

1928年中华民国教育部公布第一套法定的拉丁化拼音方案-国语罗马字(简称国罗),特点是用字母的拼法来表示汉语的声调,实际上由于流传时间较短,实际起到的作用不大。

1958年,中华人民共和国公布的第二套法定的拉丁化拼音方案,使用了26个拉丁字母,用符号表示声调,但是这种符号不易在西式打字机上实现。

八十年代,王永民发明五笔输入法,成功将汉字导入电脑。但五笔比拼音难于学习,并不流行。

与此同时,同为使用表意文字的越南则完全废除了传统文字,改为使用拉丁字母。朝鲜和韩国亦完全废除了汉字,只保留了表音的谚文。

现代词汇与日本

中日两国刚引进西方新词的时候,帮忙翻译的有:传教士、日本人、中国人。这些词的构成高达九成是用汉字的词根意译的,如果不符合汉语习惯,就会被淘汰。据统计,社会科学的术语,大约有40%是从日本输入。有些是赋予「原词」新的意义(如经济),有些是模仿汉字创造。在互联网时代,也有一些词是来自日本的,例如:空耳


参见:日语借词


参见:Category:日语借词

繁简之争

繁体字有利于理解古籍的部分内容,在书法上也更富有美感;而简化字更经济、书写更方便。但是文字不能无限制地简化,因为会带来不确定性。例如:《第二次汉字简化方案(草案)》(典型包括短作𰦓,展作𰍰,弹作𰐔,蛋作旦,舞作午,酒作氿,遇作迂等),可以说,一简字是二简字的半成品。因为群众对该方案意见较多(一简的广泛推行),不久停止使用「二简字」(最终于1986年6月24日被废除)。至此,汉字简化工作基本结束。一大批文字的字形结构没变,只是把繁体字中比较复杂的部分改成了简单的符号。

应该指出,其实部分简化字的历史长于繁体字,繁体字是在明清官方正体化后才确定为正统写法。

这种争议其实不是汉字本身,而是「地域、政治、立场」的争论。汉字简化的扫盲作用被过于放大了,文盲率减低的主因,是教育的改善、媒体的传播、拼音的辅助,是信息时代的降临。

严格来说,简体中文和繁体中文不算是两种文字,这只是一种文字中不同的组合关系。

网络上的文字游戏
  • 「愛」对「爱」说:没有「心」,如何爱?[1]
  • 「義」对「义」说:不讲道义,与我无关。“義”下方的“我”本指一种兵器,而非第一人称代词。
  • 「親」对「亲」说:不能相见,怎能相亲。
  • 「广」对「廣」说:我已经扫黄了。
  • 「厂」对「廠」说:我的内部已被贪官挖空了。
  • 「办」对「辦」说:现代化了,不用辛辛苦苦了。
  • 「進」对「进」说:你怎么不是越来越佳,而是往井里走了?“進”内部为zhuī ,而非jiā 


参见:忧郁的台湾乌龟

使用情况

  • 使用该文字的国家:中国(大陆、港澳台)、日本、韩国、朝鲜(直到1953年?)、越南(直到1975年?)、蒙古(未知)、马来西亚、新加坡
  • 使用该文字的民族:汉族(中文,汉藏语系)、大和族(日语,孤立语言)、琉球族(琉球语,孤立语言)、朝鲜族(韩语,孤立语言)、京族(越南语,南亚语系)、壮族(壮语,侗台语系)、白族(白语,汉藏语系)等众多民族。
  • 衍生文字:日语平片假名、韩语谚文、喃字、方块壮字、契丹文字(已灭绝)、西夏文字(已灭绝)、女真文字(已灭绝)、汉字注音符号
  • 书写方向:从右往左写是左行,反之则是右行。所有古代简牍上的文字,都是用毛笔书写,而不是刀刻的(用来刮错字)。古人写字左行和右行都有(如甲骨文)。商周时期的青铜器铭文全部左行,青铜器后的竹简还是左行,纸张出现后,虽然书写不受材料制约,但仍旧左行。1950年左右,郭沫若、陈嘉庚等人提议,将汉语从竖写左行改为横写右行,书写习惯的开始正式定调。

网络文化

造字

拆字

按照偏旁部首拆卸一个字或者一个词语。

参见:拆字

低俗谐音

有些弹幕会把一些汉字读法谐音成跟「性」「消化」相关的汉字。多出现在一些空耳情景,令观众产生恶心的反应。因为这些低俗词汇与原视频的氛围格格不入,所以会被观众举报。

  • bo:波、勃。
  • ca/cha:插。例如:「查一下这个人」谐音成「插一下这个人」。
  • jin/jing:精、茎。例如:「金刚」谐音成「茎肛」。
  • si/shi:湿、屎。例如:「好诗」谐音成「好湿」,「找死」谐音成「找屎」。
  • se/she:射。
  • xin/xing:性。例如:「幸福」谐音成「性福」。
  • yin/ying:阴、硬。

判断形声字失误

念错音、写错字、误用成语、不知道某个常识这种在生活中非常正常的行为,如果公众人物(明星、学者、主持人、播音员等)犯了这些错误,常常会被网友和键盘侠嘲讽得很惨。

除非一个人很多字都不认识、很多字都念错写错以至于影响正常的阅读和交流了,那才算是语文基础太差、不认真学或天生有什么学习记忆方面的障碍。

  • 新垣结衣的「垣」 (yuán) 念成「桓」「恒」。
  • 把堀北真希的「堀」 (kū) 念成「掘」
  • 把藤蔓的「蔓」(wàn)念成「漫」。
  • 把给予的「给」(jǐ)念成「给」(gěi)。
  • 把鸿鹄之志的「鹄」(hú)念成「浩」。
  • 把三聚氰胺的「氰」(qíng)念成「青」。

相关作品

  • 生僻字:陈柯宇用一些生僻字创作一首歌曲。
  • 中文字幕根据相关法律法规和政策,不过多介绍
  • 服部平次:我们脑内还有与面部识别神经元类似的汉字神经元,同一个汉字看多了,汉字神经元就会疲劳,引起机能低下。也就是说,就算是很熟悉的汉字,也弄不清楚到底该怎么写。——《名侦探柯南
  • 中国汉字听写大会
  • 1984年上映于大陆的彩色动画片,讲述了一个父亲教儿子识字,通过讲解象形文字说明中国文字的起源的故事。——《三十六个字》
  • 《学问猫教汉字》

相关图片

参考资料

  1. “爱”的本字是“㤅”,这个有心。