命名非标准 PC 代码页

在个人电脑和克隆机上常见的 8 位字符编码中,有一种 IBM 从未正确标准化或赋予代码页指定的编码——尽管它似乎来自 IBM 本身,并且在一段时间内非常流行,至少在某些领域是这样。

在 IBM 方面

  • 在 IBM 发货的大多数 CGA 和 MDA 板上,字符 ROM 编号为 5788005 或 6359300,包含熟悉的代码页 437字体——PC 的原始字符集。但有些板配备了更不寻常的 4733197 ROM,它用十二个新字符修改了 CP437 字符集(如下用红色显示):

    • 展示了该特定芯片的相关字体图片,包括 MDA 字体(字符 80 - FF)、CGA 字体(默认,字符 80 - FF)、CGA 字体(细体,字符 80 - FF)等,此芯片来自 MDA 卡,可用于两种类型的适配器,IBM 带有此英国制造的 ROM 的板至少在 1985 年就已生产,可能更早,且在一些欧洲国家(如挪威和丹麦)销售。
  • 这种字符集常见描述为“丹麦/挪威”或“北欧”,但其中包含的字符不仅仅与丹麦和挪威有关,如ø Ø与丹麦和挪威有关,Ŀ ŀ是加泰罗尼亚语,õ Õ ã Ã是葡萄牙语,ʼn是南非荷兰语,ℓ ³ ¤不特定于任何特定地区。

第三方采用

  • 许多兼容机制造商(尤其是在欧洲销售的)认为此字符集很重要并予以实现,它们都坚持“丹麦/挪威”版本的故事,尽管有非北欧字符,如:

    • Acer:MS-DOS 3.20(Acer OEM),是GRAFTABL.COM的一部分。
    • DEC VAXmate:VAXmate MS-DOS 3.10,称为“IBM Norway/Denmark Extended”。
    • Ericsson PC/Portable PC:字符 ROM,Ericsson DOS 3.10,命令为GRAFTABL GRAFCHAR.DAN
    • NCR PC4、PC4i、PC6、PC8:高分辨率彩色适配器 ROM,NCR-DOS,称为“丹麦/挪威”“北欧”。
    • Nixdorf 8810 - M15 286:字符 ROM,DOS 3.20 系统磁盘,命令为GRAFTBNO.COM
    • Olivetti GO467 EGA +:板载视频 BIOS,对于 M240 等(可能存在 CP437 变体)。
    • Olivetti M24:Olivetti M24/M24SP DOS 3.20,命令为NORDIC.COM
    • Olivetti Prodest PC - 1:字符 ROM,DOS 3.10 系统磁盘,命令为NORDIC.COM
    • Sharp PC4602/4641:字符 ROM,系统设置,称为“丹麦/挪威”。

    这些兼容机都早于带有标准化代码页(包括 865)的 PC - DOS 3.3,早期的例子表明 IBM 可能从 1983 年(PC 在欧洲开始销售时)就使用了该方案。

回到 IBM:代码页 1058?

  • IBM 从未在任何地方正式记录此字符集,但有一个地方似乎几乎承认了它的存在,即代码页 1058。然而,原始 IBM PC 版本的此代码页在 0x7F 处有字符,而 IBM 的 CP1058 有(方格/点状框),与 HP 字符集更典型,且后续列表将此 IBM 代码页置于从 HP 派生的序列中(如 IBM 列表标识为“HP Emulation, IBM - DN”,Aivosto 的列表称为“HP IBM - DN”并与 HP 版本配对,称“IBM 和 HP 版本有些不同”)。

十亿个 U + 0024 问题

  • 关于此神秘的小(非)标准字符集,仍有许多疑问,如 IBM(UK)使用修改后的 CGA/MDA ROM 的目的、为何非 IBM 来源都称此字符集为“丹麦”“挪威”“北欧”、IBM 是否有此字符集的官方指定、为何 PC - DOS 3.3 的新代码页系统舍弃它等。

更新(2024 - 10 - 06):上述一些问题已有答案,可查看下一篇文章Missing IBM PC Localization Disks & ROMs

此帖由ʼn(U + 0149 又名 LATIN SMALL LETTER N PRECEDED BY APOSTROPHE)和已故的 Michael Scott Kaplan 的精神带来。

阅读 13
0 条评论