3.设计一个程序,按国家管理有关的城市名,实现输入、报表输出功能。其中,输入时对一个国家每次可录入一个到多个不同的市;输出时的报表格式类似如下(给出的只是例子):中国:北京、上海、广州、惠州美国:华盛顿、纽约、旧金山德国:柏林、法兰克福、汉堡
data = {} # 创建一个空字典来存储数据
# 输入数据
while True:
country = input('请输入国家名称(输入q结束):')
if country == 'q':
break
cities = input('请输入城市名称,多个城市用逗号分隔:')
cities_list = cities.split(',')
data[country] = cities_list
# 输出报表
for country, cities in data.items():
cities_str = '、'.join(cities)
print(f'{country}:{cities_str}')
点阵字库是比较古老的技术,上世纪90年代初个人PC刚刚出现,中文大多都是用点阵字库来记录的,读出汉字字模后用于显示和打印,有12点阵、16点阵、24点阵以及32点阵等。1992年时,我见到了当时学校唯一一台486的康柏电脑,安装的是Win3.1中文版,也是我第一次见到有图形界面的操作系统。后来很多年后才由现在广泛使用的矢量字库逐渐替代点阵字库,不过现在还有银行等单位在用针式打印机打印凭证、报表等,里面固化的应该还是点阵字库。
以下原理性表述来源于网络:
HZK16字库是符合GB2312标准的16×16点阵字库,HZK16的GB2312-80支持的汉字有6763个,符号682个。其中一级汉字有 3755个,按声序排列,二级汉字有3008个,按偏旁部首排列。HZK16字库里的16×16汉字一共需要256个点来显示,也就是说需要32个字节才能达到显示一个普通汉字的目的。
一个GB2312汉字是由两个字节编码的,范围为0xA1A1~0xFEFE。A1-A9为符号区,B0-F7为汉字区。每一个区有94个字符(注意:这只是编码的许可范围,不一定都有字型对应,比如符号区就有很多编码空白区域)。
下面以汉字"我"为例,介绍如何在HZK16文件中找到它对应的32个字节的字模数据。前面说到一个汉字占两个字节,这两个中前一个字节为该汉字的区号,后一个字节为该字的位号。其中,每个区记录94个汉字,位号为该字在该区中的位置。所以要找到"我"在hzk16库中的位置就必须得到它的区码和位码。
区码: 汉字的第一个字节-0xA0
位码: 汉字的第二个字节-0xA0汉字编码是从0xA0区开始的, 所以文件最前面就是从0xA0区开始, 要算出相对区码。这样就可以得到汉字在HZK16中的绝对偏移位置: offset=(94*(区码-1)+(位码-1))*32
注解:
区码减1是因为数组是以0为开始而区号位号是以1为开始的
(94*(区号-1)+位号-1)是一个汉字字模占用的字节数
最后乘以32是因为一个汉字要用到32个字节来存储。
注:在上面C代码中所用到的及以下python代码中将会用到的,就是上述文字中所讲到的字体文件“HZK16”,可以到网上搜索“UCDOS HZK16下载”来获得。