1樓:
一級字型檔為常用字型檔,它以拼音字母為順序,分為24個字母小區;二級字型檔為非常用字型檔,它為漢字偏傍部首為序,以需輸入漢字的第一個拼音字母或部首來查詢對應位置,然後再查詢。
漢字的區位碼標準是將漢字分為一級字型檔和二級字型檔,一級字型檔中漢字是按拼音順序編碼,是通常用的漢字,二級字型檔是不經常用的漢字,是按漢字的部首筆劃順序編碼的。
對於一級字型檔(16區到55區),每個漢字拼音的字母的出現是有規律的,比如字母a開頭的字只出現在第16區中的‘啊’與‘澳’之間,如果要查某個漢字的首字母,只要其區碼和位碼在‘啊’與‘澳’之間,就可判斷它的首字母是a,如果它的區碼不在一級字型檔中就是二級字型檔的漢字。
對於二級字型檔(56區到87區),要自己建兩個陣列,一個存放二級字型檔中的漢字,另一個存放對應於上面陣列中每個漢字的拼音首字母,每個陣列都是存放3008個資料,因為二級字型檔有3008個字元,一級字型檔有3775個漢字。要查某個二級字型檔中的漢字的首字母,就從陣列中找出相同的漢字,然後從另一個陣列中查出其首字母。最好陣列中的漢字字母按照其在二級字型檔中的順序存放,這樣要查某個二級漢字的首字母只要根據二級漢字的區碼和位碼就可計算出其首字母在字母陣列中的位置,這樣也就不用建存放二級字型檔漢字的陣列了。
漢字的區位碼錶示將字元分成87個區,每區94個字元(序號從1到94,這個序號稱為位碼)。
漢字的區號從16區開始,每個區的位碼從1到94。
漢字的內碼用兩個位元組。每個位元組都是從160十進位制(a0十六進位制,10100000二進位制)開始,也就是兩個高位位1表示是內碼。高位元組對應區位碼中的區碼,低位元組對應區位碼中的位碼。
由於低位元組從10100000開始,這樣一個區就只能表示95個字,又由於區位碼中的位碼是從1開始的,這樣內碼低位元組表示位碼是從10100001(161)開始,就只能表示94個字,這正對應區位碼中的每區94個漢字。
一個漢字內碼與區位碼的關係是:
十進位制內碼高位元組=區碼+160 內碼低位元組=位碼+160
十六進位制
內碼高位元組=區碼+a0 內碼低位元組=位碼+a0
由於漢字的區碼是從16開始的,16+160=176,這樣漢字的內碼的高位元組就是從176開始的,得到一個規律:
要判斷一個字元是否是漢字的方法(對與unicode字元,因為它是用兩個位元組表示一個字元,也是現在程式設計較常用的表示和存放字元的方法):
讀出字元的高位元組,將其轉換位十進位制,然後判斷其是否大於等於(>=)176,如果是就表示它是漢字。
如果為了可靠,可以在判斷完高位元組後,再讀出低位元組,將其轉換位十進位制,然後判斷其是否大於(>)160,如果是就表示它是漢字。
2樓:字型視界
一級字型檔是比較常用的,一般按照字母順序,約有3775個漢字;二級字型檔是非常用漢字,一般按照偏旁部首編碼,約有3008個字元
3樓:不喜歡也可以
包含國標二級字型檔就肯定包含一級字型檔.在國標碼中全部國標漢字與圖形符號組成一個94*94的矩陣,矩陣的每一行叫一個"區",每一列叫一個"位".01~15區是圖形符號區,16~55區是一級常用漢字區,共3755個,它們是按照漢語拼音排序的,56~87區是二級非常用漢字區,共3008個,它們是按照部首排序的,88~94區是自定義漢字區.
國標二級字型檔的漢字區位碼查詢,國標二級字型檔漢字區位碼查詢劉松京
德的國標二級字型檔的漢字區位號 請幫忙查一下 德 機內碼 b5c2 區位碼 21341。機內碼 簡稱內碼 由國家標準化組織制定的漢字編碼字符集標準。gb2312 80標準收錄6763個漢字和常用符號,兩個位元組表示乙個漢字。譬如,德 用 b5c2 表示,b5 為高位元組,c2 為低位元組,都是16進...
誰知道關於中國節能標準,一級節能和二級節能又什麼區別
奮鬥的西燭添光 一級節能表示產品節電已達到國際先進水平,能耗最低 二級節能表示產品比較節電。兩者的區別 1 功效不同 由於一級節能表示已經將產品節電已達到國際最先進水平,能耗達到最低,所以一級節能比二級節能更省電。2 科技含量水平不同 由於一級節能表示已經將產品節電已達到國際最先進水平,所以一級節能...
關於一級學科和二級學科,一級學科和二級學科的區別?
中國教育電視臺 學科和專業是兩個概念,學科是指知識體系,專業指的是就業體系,專業是從13門學科延伸出來的。 一級學科是學科大類 二級學科是其下的學科小類,也就是專業。一級學科是學科大類,二級學科是其下的學科小類。根據2011修訂版,共設13個學科門類 哲學 經濟學 法學 教育學 文學 歷史學 理學 ...