科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道应用软件XML 2007 年度回顾

XML 2007 年度回顾

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

 对XML 来说,2007年又是发展较为平缓的一年.但是在这一年中,一些重要的规范都升级到了1.0 版,XML 在信息发布(Web 和传统形式)方面得到持续发展.更重要的是,REST与Web服务的碰撞引起了轩然大波,整个Web服务领域产生了重大变化。

作者:cnbeta 来源:cnbeta 2008年1月17日

关键字: 软件

  • 评论
  • 分享微博
  • 分享邮件
 4 月

  尽管早就有传闻 XML 将在 Web 中引入语义并使浏览器能够理解其显示的内容,但 XML 始终是关于语法,而不是语义.整个 XML 1.0 规范只包含两个和语义沾边的属性:xml:space 和 xml:lang(而且我不能肯定 xml:space 是不是语义属性).在很大程度上,XML 规范的意义来自于处理 XML 文档的应用程序,而不是文档本身.XML 系列的后续规范也几乎是这样,包括名称空间、XML Infoset、XSLT,以及 XPath.

  但是在 4 月份,W3C 通过发布 Internationalization Tag Set (ITS) 1.0 进一步扩展了 xml:lang 属性.这个推荐标准定义了标识方向性、可译性、ruby 文本的标准属性和可跨不同词汇表共享的文档本地化和国际化的其他常见内容.例如,在清单 1 显示的 DocBook 文章中,its:translate 属性指示 author 元素不应该被翻译,而 its:dir 属性表明整个文档使用从左到右的文本.

  清单 1. 带有 ITS 标记的 DocBook 文章

  <xforms:model><dbk:article

  xmlns:its="http://www.w3.org/2005/11/its"

  xmlns:dbk="http://docbook.org/ns/docbook"

  its:version="1.0" version="5.0" xml:lang="en"

  its:dir="ltr">

  <dbk:info>

  <dbk:title>Fun with XML</dbk:title>

  <dbk:author its:translate="no">

  <dbk:personname>

  <dbk:firstname>Elliotte</dbk:firstname>

  <dbk:surname>Harold</dbk:surname>

  </dbk:personname>

  </dbk:author>

  </dbk:info>

  <dbk:para>XML rocks!</dbk:para>

  </dbk:article>

  < p>

  <>

  此规范并未引起广泛关注,但它对在多种环境中进行发布的人(就目前而言,几乎包括所有人)来说非常有用.

  在 4 月,W3C Internationalization Activity 还发布了国际化最佳实践的完结版:指定 XHTML 和 HTML 内容中的语言.我将该建议总结为 16 条 “最佳实践”:

  最佳实践 1:总是使用 html 标记属性声明页面文本的默认语言,除非文档包含针对使用多种语言的演讲者的内容.

  最佳实践 2:如果文档包含针对使用多种语言的演讲者的内容,决定是否需要在 html 标志中声明一种语言,或者不定义语言.

  最佳实践 3:如果文档包含针对使用多种语言的演讲者的内容,尝试根据最可能使用的语言对文档进行划分,并为每部分声明合适的语言.

  最佳实践 4:在文本中使用 lang 和/或 xml:lang 属性来指出语言上的任何更改.

  最佳实践 5:对于 HTML,只使用 lang 属性;对于用作文本或 html 的 XHTML 1.0,使用 lang 和 xml:lang 属性;对于用作 XML 的 XHTML,只使用 xml:lang 属性.

  最佳实践 6:使用语言属性声明用于文本处理的默认语言,而不是使用 HTTP 或元元素.

  最佳实践 7:不要在 body 元素中声明文档的默认语言,使用 html 元素.

  最佳实践 8:如果属性值中的文本和元素内容使用的语言不同,考虑使用嵌入式方法.

  最佳实践 9:考虑在 HTTP 报头使用 Content-Language 声明或者使用元标记声明文档目标受众的语言元数据.

  最佳实践 10:如果文档包含针对使用多种语言的演讲者的内容,结合使用 Content-Language 和以逗号分隔的语言标记列表.

  最佳实践 11:遵循 IETF 的 BCP 47 中关于语言属性值的指导.

  最佳实践 12:使用尽可能短的语言标记值.

  最佳实践 13:如果可能,使用代码 zh-Hans 和 zh-Hant 分别指代简体中文和繁体中文.

  最佳实践 14:当指向另一种语言中的资源时,考虑指明目标文档语言的优缺点.

  最佳实践 15:如果希望指出一个元素的目标文档使用的是另一种语言,考虑结合使用 CSS 和 hreflang 的优缺点.

  最佳实践 16:不要使用标志图标指明语言.  

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章