科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网软件频道基础软件最基础的数据结构

最基础的数据结构

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

本文将讨论实际编程最经常使用的三种数据结构:字符串、数组和Hash表,比较它们在不同语言中的实现思路,并涉及它们的使用技巧。

作者:左轻侯 来源:blog 2007年7月27日

关键字:

  • 评论
  • 分享微博
  • 分享邮件

 不幸的是,由于复杂的历史原因,许多C++方言(例如Visual C++和Borland C++Builder)都提供了与标准字符串不同的字符串实现。这些字符串实现各有长处,但是将它们和C++标准字符串以及C风格字符串进行转换,又成为了一项令人头疼的工作。
   Delphi对字符串的改进基于另外一种思路。在Delphi中,字符串仍然是一种基本类型,而不是类。它的实现方式也是字符数组,不同于C风格字符串的是,在数组的头部增加了两个32位整数存储空间,分别用于存放字符串的长度和引用计数。通过前者可以方便地获得字符串的长度,而不需要进行无谓的遍历操作。后者实现了COW(Copy on Write)技术,这种技术的效果是:当字符串被复制时,并不会复制其内容,而只是建立一个新的指针,指向原有的字符串,并在引用计数上加一。当字符串被删除时,引用计数减一,当引用计数为0时,字符串的内存将被释放。只有当对字符串进行写入操作时,才会建立一个新的字符串并复制内容。这些工作是由编译器自动完成的,程序员完全可以象使用C风格字符串一样使用Delphi风格的字符串,只是效率大大地提高了。
   Java和C#中的字符串,是一个封装了常见操作的类,这一点和C++类似。一个特殊之处(往往导致经典的性能问题)是,无论是在Java还是在C#中,String类都是不变(immutable)的。也就是说,String的内容不能够被改变,如果代码试图改变一个String对象的内容,实际的结果是建立了一个新的String对象,并抛弃旧的对象。如下例:
  
   String s = "";
   for (int i = 0;i < 10000;i++) {
   s += i + ", ";
   }
  
   结果是建立并抛弃了10000个String对象,这在性能上的开销是惊人的。为了避免这种情况,应该使用StringBuilder对象,它可以改变其内容。(C#一直使用StringBuilder。Java从1.5开始引入StringBuilder以部分替代StringBuffer,它们的主要区别在于线程安全性。)如下例:
  
   StringBuilder sb = new StringBuilder();
   for (int i = 0; i < 10000; i++) {
   sb.append(i + ",");
   } 
  

数组
   从抽象数据类型的意义上来说,一维数组(array)的定义是:具有相同数据类型的若干个元素的有限序列。
   在C语言中,数组意味着一块连续的内存空间,按顺序存放着若干个相同数据类型的元素。可以通过下标来访问数组中的元素。如下例:
  
   int a[10]; // 定义一个int型的数组
   for (int i = 0;i < 10;i++) {
   a[i] = i; // 赋值
   }
  
   在C语言中,数组名事实上是一个指针(指向该数组的第一个元素),因此所有通过数组下标完成的操作,都可以通过指针来完成。通过指针来访问数组,效率上比数组下标要高,而且更加灵活,例如,指针可以进行偏移量的运算,甚至可以进行绝对地址的存取。
   C语言中的数组没有越界检查,这意味着,程序员可以访问数组最后一个元素以后的地址,或者第一个元素之前的地址(例如,a[-1]、a[-2]这种形式是合法的)。在某些情况下,这是一种有用的技巧,但大多数情况下是一场灾难。C语言的数组也不支持自动增长,如果数组的长度发生了变化,程序员必须手动处理所有关于申请和释放内存的工作。
   C++提供了C风格的数组,同样不支持越界检查和自动增长。但是,C++(至少是Stroustrup博士本人)建议,应该尽量使用STL中的容器作为替代品,一般是vector。Vector基于面向对象和模板技术,构建了一个强大而复杂的类,实现了如下特性:高效率的自动内存管理;按任何顺序访问、插入和删除元素;越界检查,但同时也提供了不进行检查的访问方式,以照顾性能上的考虑;基于运算符重载技术的运算符支持;基于迭代器的漫游机制;与数据类型无关的算法支持;等等。相对于C风格的数组,vector是一种更高抽象层次上的序列概念。它对大量常用的功能进行了封装(例如,对内存的直接操作),同时又尽可能地照顾了效率和可移植性(例如,在自动扩充时通过缓存机制来提高效率)。这也正是C++语言对C语言进行改进时的指导思想。
  

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章