
汉字分为独体字,合体字。合体字分为部首加主体。合体字结构分为,上下,左右,全包围,半包围,杂合型。 举例说明;冉,M+H+拼音R, 更,F+N+W+拼音G, 承,X+G+A+W 莲,S+A+F+C 镶,T+Y+M+W 般,Q+E+N+O 带, M+F+J+P 连,P+A+F 圆,L+M+F+W 襄Y+M+F+H 字取部首前两画,特殊的部首如图所示,无论部首在哪个位置,都编在1码。 如有重码,在末尾用拼音替换,如再有重码,用数字替换,U-2;I-3;O-4;V-5;E-6;A代替Z, 编码总数: 8953个重码总数: 627个,占编码总数的 7.00%码元集总数: 25个,所有码元:abcdefghijklmnopqrstuvwxy 7828 占词库总量的 93.64%重码有 2 个的编码共 247 个,对应词条总数为: 494 占词库总量的 5.9%重码有 3 个的编码共 11 个,对应词条总数为: 33 占词库总量的 .39%重码有 4 个的编码共 1 个,对应词条总数为: 4 占词库总量的 .04%词库词条总量为 8359 条,加权平均重码数为: 1.06