日前,Unicode官方博客宣布发布14.0版版本,其中包括核心规范、附件和数据文件。 据悉该版本新增838个字符,共计达144697个字符。新增内容还包括5个新脚本,总共达到了159 个脚本,最后还增加37个新的emoji表情符号。
Unicode 14.0中的新脚本和字符添加了对现代语言的支持,包括波斯尼亚、印度、印度尼西亚、伊朗、爪哇、马来西亚、蒙古、缅甸、巴基斯坦、 和菲律宾,以及非洲和北美的其他语言:
阿拉伯字母:添加包括古兰经敬语和古兰经使用字符。
历史上的维特库其(Vithkuqi)字母,曾经用来书写阿尔巴尼亚语,当前正对其现代复兴。
坦撒(Tangsa)字母:用于书写坦撒语,在印度和缅甸使用。
托托(Toto)字母:用于编写印度东北部托托语的字母。
其他很拉丁文字扩展 IPA。
表情符号
本次版本新增加了37个表情符号字符, 包括几个用于情感和手势的新表情符号(笑脸、手势、 动物和自然、食物和饮料、交通和活动)。
笑脸符号:
手势符号
新增加了,打响指,千夫指和比心,有意思的戴皇冠的人,孕人,孕男人和巨魔。
自然和其他符号
新增加了珊瑚,莲花等等。
其他符号包括:
吉尔吉斯共和国使用的索姆货币符号
俄罗斯开发的 Znamenny乐谱
重要的图表字体更新,包括:
对 CJK 辅助块和封闭的字母数字进行了重大更新
Unicode 属性和规范决定了文本在计算机上的行为和。版本 14.0 中的更改包括 Unicode 标准附件和具有显著修改的技术标准。
UAX #14, Unicode Linebreaking Algorithm
UAX #29, Unicode Text Segmentation
UAX #31, Unicode Identifier and Pattern Syntax
UAX #38, Unicode Han Database (Unihan)
UAX #45, U-Source Ideographs
为 14.0 还更新了重要的Unicode 附件:
UTS #10, Unicode Collation Algorithm — sorting Unicode text
UTS #39, Unicode Security Mechanisms — reducing Unicode spoofing
UTS #46, Unicode IDNA Compatibility Processing — compatible processing of non-ASCII URLs
Unicode 标准是所有现代软件和通信的基础。包括操作系统、浏览器、笔记本电脑和智能手机——因特网和Web(URL、HTML、XML、CSS、JSON 等)。
,