1樓:匿名使用者
一個漢字佔2個位元組,一個位元組佔8位,一個字母佔1個位元組。計算機中,各種資訊都是以二進位制編碼的形式存在的,不管是文字還是其它各種資訊,在計算機中都是以0和1組成的二進位制**表示的,之所以能區別這些資訊的不同,是因為它們採用的編碼規則不同。英文字母用的是單位元組的ascii碼,漢字採用的是雙位元組的漢字內碼
1、字元(英文,包括字母、數字、標點、運算子等)編碼
字元的編碼採用國際通用的ascii碼(american standard code for information interchange,美國資訊交換標準**),每個ascii碼以1個位元組(byte)儲存,從0到數字127代表不同的常用符號,例如大寫a的ascii碼是65,小寫a則是97。由於ascii碼只用了位元組的七個位,最高位並不使用,所以後來又將最高的一個位也編入這套編碼碼中,成為八個位的延伸ascii(extendedascii)碼,這套內碼加上了許多外文和**等特殊符號,成為目前常用的編碼。基本的ascii字符集共有128個字元,其中有96個可列印字元,包括常用的字母、數字、標點符號等,另外還有32個控制字元。
標準ascii碼使用7個二進位對字元進行編碼,對應的iso標準為iso646標準。
雖然標準ascii碼是7位編碼,但由於計算機基本處理單位為位元組(1byte = 8bit),所以一般仍以一個位元組來存放一個ascii字元。每一個位元組中多餘出來的一位(最高位)在計算機內部通常保持為0(在資料傳輸時可用作奇偶校驗位)。由於標準ascii字符集字元數目有限,在實際應用中往往無法滿足要求。
為此,國際標準化組織又制定了iso2022標準,它規定了在保持與iso646相容的前提下將ascii字符集擴充為8位**的統一方法。iso陸續制定了一批適用於不同地區的擴充ascii字符集,每種擴充ascii字符集分別可以擴充128個字元,這些擴充字元的編碼均為高位為1的8位**(即十進位制數128~255),稱為擴充套件ascii碼。
2、漢字的編碼
(1)漢字內碼
漢字資訊在計算機內部也是以二進位制方式存放。由於漢字數量多,用一個位元組的128種狀態不能全部表示出來,因此在2023年我國頒佈的《資訊交換用漢字編碼字符集——基本集》,即國家標準gb2312-80方案中規定用兩個位元組的十六位二進位制表示一個漢字,每個位元組都只使用低7位(與ascii碼相同),即有128×128=16384種狀態。由於ascii碼的34個控制**在漢字系統中也要使用,為不致發生衝突,不能作為漢字編碼,128除去34只剩94種,所以漢字編碼表的大小是94×94=8836,用以表示國標碼規定的7445個漢字和圖形符號。
每個漢字或圖形符號分別用兩位的十進位制區碼(行碼)和兩位的十進位制位碼(列碼)表示,不足的地方補0,組合起來就是區位碼。把區位碼按一定的規則轉換成的二進位制**叫做資訊交換碼(簡稱國標碼)。國標碼共有漢字6763個(一級漢字,是最常用的漢字,按漢語拼音字母順序排列,共3755個;二級漢字,屬於次常用漢字,按偏旁部首的筆劃順序排列,共3008個),數字、字母、符號等682個,共7445個。
由於國標碼不能直接儲存在計算機內,為方便計算機內部處理和儲存漢字,又區別於ascii碼,將國標碼中的每個位元組在最高位改設為1,這樣就形成了在計算機內部用來進行漢字的儲存、運算的編碼叫機內碼(或漢字內碼,或內碼)。內碼既與國標碼有簡單的對應關係,易於轉換,又與ascii碼有明顯的區別,且有統一的標準(內碼是惟一的)。
(2)漢字外碼
無論是區位碼或國標碼都不利於輸入漢字,為方便漢字的輸入而制定的漢字編碼,稱為漢字輸入碼。漢字輸入碼屬於外碼。不同的輸入方法,形成了不同的漢字外碼。常見的輸入法有以下幾類:
按漢字的排列順序形成的編碼(流水碼):如區位碼;
按漢字的讀音形成的編碼(音碼):如全拼、簡拼、雙拼等;
按漢字的字形形成的編碼(形碼):如五筆字型、鄭碼等;
按漢字的音、形結合形成的編碼(音形碼):如自然碼、智慧abc。
輸入碼在計算機中必須轉換成機內碼,才能進行儲存和處理。
(3)漢字字形碼
為了將漢字在顯示器或印表機上輸出,把漢字按圖形符號設計成點陣圖,就得到了相應的點陣**(字形碼)。全部漢字字碼的集合叫漢字字型檔。漢字型檔可分為軟字型檔和硬字型檔。
軟字型檔以檔案的形式存放在硬碟上,現多用這種方式,硬字型檔則將字型檔固化在一個單獨的儲存晶片中,再和其它必要的器件組成介面卡,插接在計算機上,通常稱為漢卡。
用於顯示的字型檔叫顯示字型檔。顯示一個漢字一般採用16×16點陣或24×24點陣或48×48點陣。已知漢字點陣的大小,可以計算出儲存一個漢字所需佔用的位元組空間。
例:用16×16點陣表示一個漢字,就是將每個漢字用16行,每行16個點表示,一個點需要1位二進位制**,16個點需用16位二進位制**(即2個位元組),共16行,所以需要16行×2位元組/行=32位元組,即16×16點陣表示一個漢字,字形碼需用32位元組。
即:位元組數=點陣行數×點陣列數/8
用於列印的字型檔叫列印字型檔,其中的漢字比顯示字型檔多,而且工作時也不像顯示字型檔需調入記憶體。
可以這樣理解,為在計算機內表示漢字而統一的編碼方式形成漢字編碼叫內碼(如國標碼),內碼是惟一的。為方便漢字輸入而形成的漢字編碼為輸入碼,屬於漢字的外碼,輸入碼因編碼方式不同而不同,是多種多樣的。為顯示和列印輸出漢字而形成的漢字編碼為字形碼,計算機通過漢字內碼在字模庫中找出漢字的字形碼,實現其轉換。
2樓:匿名使用者
這裡以txt檔案中的漢字為例, 介紹文字編輯器如何顯示漢字的過程:
1. 二進位制(檔案,你可以把一個檔案理解為一串1+0構成的內容.也可以叫落地碼編碼的內容)——
2. 通過落地碼識別出每個字元(落地碼,就是utf-8/utf-16/gbk這一類編碼, 它們能夠將連續的1/0組成的數字串切割(解碼過程)成能n個小塊(塊的長度不一定相同!),每塊表示一個字元(一個漢字).
而如何切割, 就是這一類編碼的意義所在,具體參考每個編碼定義)——
3. 每個小塊轉成對應的unicode值(unicode也是一種碼, 他是用來區分字元和字元之間的唯一性. 即每一個不同的字元的unicode都是不同的.
它一般有固定的長度. 從落地碼轉成unicode碼, 有固定的對應關係,具體參考落地碼的編碼規範)——
4. 每個unicode值對映到字型庫中對應的文字圖案()——
5. 讀取並顯示含有文字的**
注:從2開始, 每取下一個塊,就可以立即執行345,或者取特定個之後再一起執行345.
英文也可以參照這個過程, 只是比中文更加簡單, 比如2的時候,每一個英文字元的塊長都是一樣的.
一個檔案只能有一種落地碼, 並且編輯器需要知道這個落地碼是哪一個碼. 如果不匹配,就會看到所謂的亂碼. 也不是說一定只能一種碼...除非你知道你在搞什麼..
落地碼無處不在. 比如windows系統的預設編碼,這個會影響你的粘帖板. 有時候粘帖板中也會包含字型資訊.
特別要注意的是, unicode其實也算是一種落地碼,只是現在一般用的不多. 當作為落地碼時, 格式有ucs-2/ucs-4這兩種. 比如windows記事本儲存的時候有unicode選項,它預設是ucs-2.
如果有錯誤的地方忘指出, 謝謝!
附上兩個工具:
unicode查詢-網頁連結
utf8轉二進位制等-網頁連結
計算機是怎麼識別二進位制**的?二進位制**是如何被翻譯成漢字或者英文字母的?
3樓:無珹鬱鷗
一個英文字母在計算機儲存中是用ascii碼錶示的在計算機的儲存單元中,一個ascii碼值佔一個位元組(8個二進位制位)計算機中每個二進位制位都有01
兩種狀態
7位二進位制位可以表示的ascii碼就有128個(最高位是奇偶校驗位
就不解釋了)
比如字母a的
ascii碼為65
換為二進位制就是
1000001
然後把這存在一個位元組裡
就代表是個a
電腦上打字只顯示字母打不出漢字是怎麼回事?
4樓:桃夭
出現這種情況的原因有:
沒有安裝輸入法。
輸入法沒有切換到中文輸回入。答
選擇了中文輸入不小心按了shift 鍵。
大寫鍵鎖定了。
解決方法:
重新安裝一個輸入法。
選擇中文輸入法。
中文輸入法的狀態按了按了shift 鍵。解決辦法:再按一下shift 鍵。
大寫鍵鎖定了。解決辦法:給大寫鍵解鎖,按一下caps lock鍵。
打字時常見的問題及解決方法如下:
出現問題:用筆記本打字時有時候會突然發現打字時明明按的是字母卻出來的是數字。
出現該問題的原因:使用外接鍵盤時按了“numlock”時沒有解鎖就拔下鍵盤。
解決該問題的方法:
重新接上外接鍵盤,按一下“numlock”鍵就可以解開數字鍵盤鎖。
在筆記本鍵盤上找到fn和[numlk]鍵即可。
5樓:思語新竹
電腦打字只顯示字母,打不出漢字是因為你是在英文模式上,轉換成中文模式就能打出字來了。
6樓:日月晨雲
這個是屬於你的輸入法沒有調過來,還有一種就是把大寫鍵盤那個鎖定鍵了,開開了看不見,cap鍵開開了,然後它打出來的只能是英文了。
7樓:匿名使用者
是鍵盤壞了!我遇到過!
8樓:漂泊
1,大寫bai
字母鎖定開啟了du,檢視鍵盤右上方中間zhi的燈是否亮dao了,亮了的話按一下專caps lock就可以。
2,沒有輸入法,屬百度一個輸入法一般建議搜狗輸入法。
3,可能是按到了shift鍵或者大寫的capslk鍵,再按一次4,把鍵盤最左邊從上往下數的第4個鍵按一下。
9樓:佳佳
首先看下中英文輸復
入法切換是否正確制,如果選的是英文,就切換成中文輸入法,以搜狗輸入法為例,圈紅圈的位置,滑鼠單擊就可以隨意切換
電腦上打字怎麼從英文切換成中文,按什麼鍵? 100
10樓:竸機械師
1、電腦是否使用的自帶的打字軟體,如果是直接按shift就可以切換中文或者是英文。或者是按shift+ctrl切換輸入法。
2、如果是其他的輸入法也是一下,先按shift切換中英文。或者是按shift+ctrl切換輸入法即可。
3、也可以按工作列輸入法的圖示即可。
計算機黑屏不是線路和顯示器怎麼辦
和 或主機電源 主機板 顯示卡以及bios設定 軟體出現故障 一 經常在執行大程式時黑屏,故障一般是 1 顯示卡驅動不夠完善,需用乙個穩定的版本重灌 2 主機電源功率不夠,導致agp顯示卡的供電不足 功率不夠可能是主機電源的功率因素決定的,也可能是散熱不良所致 3 主機板板載功率不夠,導致agp顯示...
怎樣學習和理解計算機組成原理,如何學習計算機組成原理
的家之歌 推薦回答 一般來講,這種課有兩種上法 1.著重介紹組合語言程式設計和接 術,技巧性很強。2.著重介紹cpu 及部分儲存器之間的體系結構,順帶介紹組合語言。第二種,就給你說說這個好了。這裡能找到mit 用的相應課件,裡面從頭至尾介紹了一種被簡化的 cpu 結構,包括各 種實現細節,還提供免費...
職稱英語 計算機如何報名考試,職稱外語和計算機考試每年都有幾次?都是什麼時候啊?
1全部1 職稱英語一般在考試前一年的11月份報名,全國專業技術人員計算機應用能力考試一年舉行4次,具體報名時間各地有差異,所以建議您到當地人事考試中心詢問。2 在當地人事考試中心報名。3 中級技術職稱只需要專業通過,再通過職稱英語和職稱計算機,不需要再考其他的了。4 當地人事考試中心不需要你先發表 ...