广告
返回顶部
首页 > 资讯 > 后端开发 > 其他教程 >如何使用C++的StringBuilder提升性能
  • 526
分享到

如何使用C++的StringBuilder提升性能

2023-06-17 08:06:17 526人浏览 泡泡鱼
摘要

今天就跟大家聊聊有关如何使用c++的StringBuilder提升性能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。介绍经常出现客户端打电话抱怨说:你们的程序慢如蜗牛。你开始检查可能

今天就跟大家聊聊有关如何使用c++的StringBuilder提升性能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

介绍

经常出现客户端打电话抱怨说:你们的程序慢如蜗牛。你开始检查可能的疑点:文件io数据库访问速度,甚至查看WEB服务。 但是这些可能的疑点都很正常,一点问题都没有。

你使用最顺手的性能分析工具分析,发现瓶颈在于一个小函数,这个函数的作用是将一个长的字符串链表写到一文件中。

你对这个函数做了如下优化:将所有的小字符串连接成一个长的字符串,执行一次文件写入操作,避免成千上万次的小字符串写文件操作。

这个优化只做对了一半。

你先测试大字符串写文件的速度,发现快如闪电。然后你再测试所有字符串拼接的速度。

好几年。

怎么回事?你会怎么克服这个问题呢?

你或许知道.net程序员可以使用StringBuilder来解决此问题。这也是本文的起点。

背景

如果Google一下“C++ StringBuilder”,你会得到不少答案。有些会建议(你)使用std::accumulate,这可以完成几乎所有你要实现的:

#include <iOStream>// for std::cout, std::endl  #include <string>  // for std::string  #include <vector>  // for std::vector  #include <numeric> // for std::accumulate  int main()  {      using namespace std;      vector<string> vec = { "hello", " ", "world" };      string s = accumulate(vec.begin(), vec.end(), s);      cout << s << endl; // prints 'hello world' to standard output.       return 0;  }

目前为止一切都好:当你有超过几个字符串连接时,问题就出现了,并且内存再分配也开始积累。

std::string在函数reserver()中为解决方案提供基础。这也正是我们的意图所在:一次分配,随意连接。

字符串连接可能会因为繁重、迟钝的工具而严重影响性能。由于上次存在的隐患,这个特殊的怪胎给我制造麻烦,我便放弃了Indigo(我想尝试一些C++11里的令人耳目一新的特性),并写了一个StringBuilder类的部分实现:

// Subset of Http://msdn.microsoft.com/en-us/library/system.text.stringbuilder.aspx  template <typename chr>  class StringBuilder {      typedef std::basic_string<chr> string_t;      typedef std::list<string_t> container_t; // Reasons not to use vector below.       typedef typename string_t::size_type size_type; // Reuse the size type in the string.      container_t m_Data;      size_type m_totalSize;      void append(const string_t &src) {          m_Data.push_back(src);          m_totalSize += src.size();      }      // No copy constructor, no assignement.      StringBuilder(const StringBuilder &);      StringBuilder & operator = (const StringBuilder &);  public:      StringBuilder(const string_t &src) {          if (!src.empty()) {              m_Data.push_back(src);          }          m_totalSize = src.size();      }      StringBuilder() {          m_totalSize = 0;      }      // TODO: Constructor that takes an array of strings.        StringBuilder & Append(const string_t &src) {          append(src);          return *this; // allow chaining.      }          // This one lets you add any STL container to the string builder.       template<class inputIterator>      StringBuilder & Add(const inputIterator &first, const inputIterator &afterLast) {          // std::for_each and a lambda look like overkill here.                  // <b>Not</b> using std::copy, since we want to update m_totalSize too.          for (inputIterator f = first; f != afterLast; ++f) {              append(*f);          }          return *this; // allow chaining.      }      StringBuilder & AppendLine(const string_t &src) {          static chr lineFeed[] { 10, 0 }; // C++ 11. Feel the love!          m_Data.push_back(src + lineFeed);          m_totalSize += 1 + src.size();          return *this; // allow chaining.      }      StringBuilder & AppendLine() {          static chr lineFeed[] { 10, 0 };           m_Data.push_back(lineFeed);          ++m_totalSize;          return *this; // allow chaining.      }       // TODO: AppendFORMat implementation. Not relevant for the article.        // Like C# StringBuilder.ToString()      // Note the use of reserve() to avoid reallocations.       string_t ToString() const {          string_t result;          // The whole point of the exercise!          // If the container has a lot of strings, reallocation (each time the result grows) will take a serious toll,          // both in performance and chances of failure.          // I measured (in code I cannot publish) fractions of a second using 'reserve', and almost two minutes using +=.          result.reserve(m_totalSize + 1);      //  result = std::accumulate(m_Data.begin(), m_Data.end(), result); // This would lose the advantage of 'reserve'          for (auto iter = m_Data.begin(); iter != m_Data.end(); ++iter) {               result += *iter;          }          return result;      }       // like javascript Array.join()      string_t Join(const string_t &delim) const {          if (delim.empty()) {              return ToString();          }          string_t result;          if (m_Data.empty()) {              return result;          }          // Hope we don't overflow the size type.          size_type st = (delim.size() * (m_Data.size() - 1)) + m_totalSize + 1;          result.reserve(st);                  // If you need reasons to love C++11, here is one.          struct adder {              string_t m_Joiner;              adder(const string_t &s): m_Joiner(s) {                  // This constructor is NOT empty.              }                          // This functor runs under accumulate() without reallocations, if 'l' has reserved enough memory.               string_t operator()(string_t &l, const string_t &r) {                  l += m_Joiner;                  l += r;                  return l;              }          } adr(delim);          auto iter = m_Data.begin();                   // Skip the delimiter before the first element in the container.          result += *iter;           return std::accumulate(++iter, m_Data.end(), result, adr);      }   }; // class StringBuilder

有趣的部分

函数ToString()使用std::string::reserve()来实现最小化再分配。下面你可以看到一个性能测试的结果。

函数join()使用std::accumulate(),和一个已经为首个操作数预留内存的自定义函数。

你可能会问,为什么StringBuilder::m_Data用std::list而不是std::vector?除非你有一个用其他容器的好理由,通常都是使用std::vector。

好吧,我(这样做)有两个原因:

字符串总是会附加到一个容器的末尾。std::list允许在不需要内存再分配的情况下这样做;因为vector是使用一个连续的内存块实现的,每用一个就可能导致内存再分配。

std::list对顺序存取相当有利,而且在m_Data上所做的唯一存取操作也是顺序的。

你可以建议同时测试这两种实现的性能和内存占用情况,然后选择其中一个。

性能评估

为了测试性能,我从Wikipedia获取一个网页,并将其中一部分内容写死到一个string的vector中。

随后,我编写两个测试函数,第一个在两个循环中使用标准函数clock()并调用std::accumulate()和StringBuilder::ToString(),然后打印结果。

void TestPerformance(const StringBuilder<wchar_t> &tested, const std::vector<std::wstring> &tested2) {      const int loops = 500;      clock_t start = clock(); // Give up some accuracy in exchange for platform independence.      for (int i = 0; i < loops; ++i) {          std::wstring accumulator;          std::accumulate(tested2.begin(), tested2.end(), accumulator);      }      double secsAccumulate = (double) (clock() - start) / CLOCKS_PER_SEC;       start = clock();      for (int i = 0; i < loops; ++i) {          std::wstring result2 = tested.ToString();      }      double secsBuilder = (double) (clock() - start) / CLOCKS_PER_SEC;      using std::cout;      using std::endl;      cout << "Accumulate took " << secsAccumulate << " seconds, and ToString() took " << secsBuilder << " seconds."             << " The relative speed improvement was " << ((secsAccumulate / secsBuilder) - 1) * 100 << "%"             << endl;  }

第二个则使用更精确的Posix函数clock_gettime(),并测试StringBuilder::Join()。

#ifdef __USE_POSIX199309   // Thanks to <a href="http://www.guyrutenberg.com/2007/09/22/profiling-code-using-clock_gettime/">Guy Rutenberg</a>.  timespec diff(timespec start, timespec end)  {      timespec temp;      if ((end.tv_nsec-start.tv_nsec)<0) {          temp.tv_sec = end.tv_sec-start.tv_sec-1;          temp.tv_nsec = 1000000000+end.tv_nsec-start.tv_nsec;      } else {          temp.tv_sec = end.tv_sec-start.tv_sec;          temp.tv_nsec = end.tv_nsec-start.tv_nsec;      }      return temp;  }   void AccurateTestPerformance(const StringBuilder<wchar_t> &tested, const std::vector<std::wstring> &tested2) {      const int loops = 500;      timespec time1, time2;      // Don't forget to add -lrt to the g++ linker command line.      ////////////////      // Test std::accumulate()      ////////////////      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time1);      for (int i = 0; i < loops; ++i) {          std::wstring accumulator;          std::accumulate(tested2.begin(), tested2.end(), accumulator);      }      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time2);      using std::cout;      using std::endl;      timespec tsAccumulate =diff(time1,time2);      cout << tsAccumulate.tv_sec << ":" <<  tsAccumulate.tv_nsec << endl;      ////////////////      // Test ToString()      ////////////////      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time1);      for (int i = 0; i < loops; ++i) {          std::wstring result2 = tested.ToString();      }      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time2);      timespec tsToString =diff(time1,time2);      cout << tsToString.tv_sec << ":" << tsToString.tv_nsec << endl;      ////////////////      // Test join()      ////////////////      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time1);      for (int i = 0; i < loops; ++i) {          std::wstring result3 = tested.Join(L",");      }      clock_gettime(CLOCK_THREAD_CPUTIME_ID, &time2);      timespec tsJoin =diff(time1,time2);      cout << tsJoin.tv_sec << ":" << tsJoin.tv_nsec << endl;       ////////////////      // Show results      ////////////////      double secsAccumulate = tsAccumulate.tv_sec + tsAccumulate.tv_nsec / 1000000000.0;      double secsBuilder = tsToString.tv_sec + tsToString.tv_nsec / 1000000000.0;          double secsJoin = tsJoin.tv_sec + tsJoin.tv_nsec / 1000000000.0;      cout << "Accurate performance test:" << endl << "    Accumulate took " << secsAccumulate << " seconds, and ToString() took " << secsBuilder << " seconds." << endl              << "    The relative speed improvement was " << ((secsAccumulate / secsBuilder) - 1) * 100 << "%" << endl <<               "     Join took " << secsJoin << " seconds."             << endl;  }  #endif // def __USE_POSIX199309

最后,通过一个main函数调用以上实现的两个函数,将结果显示在控制台,然后执行性能测试:一个用于调试配置。

如何使用C++的StringBuilder提升性能

另一个用于发行版本:

如何使用C++的StringBuilder提升性能

看到这百分比没?垃圾邮件的发送量都不能达到这个级别!

代码使用

在使用这段代码前, 考虑使用ostring流。正如你在下面看到Jeff先生评论的一样,它比这篇文章中的代码更快些。

你可能想使用这段代码,如果:

  • 你正在编写由具有C#经验的程序员维护的代码,并且你想提供一个他们所熟悉接口的代码。

  • 你正在编写将来会转换成.net的、你想指出一个可能路径的代码。

  • 由于某些原因,你不想包含<sstream>。几年之后,一些流的IO实现变得很繁琐,而且现在的代码仍然不能完全摆脱他们的干扰。

要使用这段代码,只有按照main函数实现的那样就可以了:创建一个StringBuilder的实例,用Append()、AppendLine()和Add()给它赋值,然后调用ToString函数检索结果。

就像下面这样:

int main() {      ////////////////////////////////////      // 8-bit characters (ANSI)      ////////////////////////////////////      StringBuilder<char> ansi;      ansi.Append("Hello").Append(" ").AppendLine("World");      std::cout << ansi.ToString();       ////////////////////////////////////      // Wide characters (Unicode)      ////////////////////////////////////      // http://en.wikipedia.org/wiki/Cargo_cult      std::vector<std::wstring> cargoCult      {          L"A", L" cargo", L" cult", L" is", L" a", L" kind", L" of", L" Melanesian", L" millenarian", L" movement",  // many more lines here...  L" applied", L" retroactively", L" to", L" movements", L" in", L" a", L" much", L" earlier", L" era.\n"     };      StringBuilder<wchar_t> wide;      wide.Add(cargoCult.begin(), cargoCult.end()).AppendLine();          // use ToString(), just like .net      std::wcout << wide.ToString() << std::endl;      // javascript-like join.      std::wcout << wide.Join(L" _\n") << std::endl;       ////////////////////////////////////      // Performance tests      ////////////////////////////////////      TestPerformance(wide, cargoCult);  #ifdef __USE_POSIX199309      AccurateTestPerformance(wide, cargoCult);  #endif // def __USE_POSIX199309      return 0;  }

任何情况下,当连接超过几个字符串时,当心std::accumulate函数。

现在稍等一下!

你可能会问:你是在试着说服我们提前优化吗?

不是的。我赞同提前优化是糟糕的。这种优化并不是提前的:是及时的。这是基于经验的优化:我发现自己过去一直在和这种特殊的怪胎搏斗。基于经验的优化(不在同一个地方摔倒两次)并不是提前优化。

当我们优化性能时,“惯犯”会包括磁盘I-O操作、网络访问(数据库、web服务)和内层循环;对于这些,我们应该添加内存分配和性能糟糕的 Keyser S&ouml;ze。

鸣谢

首先,我要为这段代码在linux系统上做的精准分析感谢Rutenberg。

多亏了Wikipedia,让“在指尖的信息”的梦想得以实现。

看完上述内容,你们对如何使用C++的StringBuilder提升性能有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网其他教程频道,感谢大家的支持。

--结束END--

本文标题: 如何使用C++的StringBuilder提升性能

本文链接: https://www.lsjlt.com/news/287910.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • 如何使用C++的StringBuilder提升性能
    今天就跟大家聊聊有关如何使用C++的StringBuilder提升性能,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。介绍经常出现客户端打电话抱怨说:你们的程序慢如蜗牛。你开始检查可能...
    99+
    2023-06-17
  • 提高C# StringBuilder操作性能优化的方法
    目录1. 在Visual Studio中创建一个控制台应用程序项目2. 安装 BenchmarkDotNet NuGet包3. 使用 StringBuilderCache 来减少分配...
    99+
    2022-11-12
  • C#提高StringBuilder操作性能优化的方法是什么
    本篇内容介绍了“C#提高StringBuilder操作性能优化的方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!在 .NET 中,S...
    99+
    2023-06-25
  • 如何使用JavaScript的Map提升性能
    这篇文章将为大家详细讲解有关如何使用JavaScript的Map提升性能,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。Map与常规对象有什么不同Map和常规对象主要有2个...
    99+
    2022-10-19
  • 如何使用OPCache提升PHP的性能
    目录什么是 OPcache安装 Opcacheab 测试效果配置参考总结参考文档对于 PHP 这样的解释型语言来说,每次的运行都会将所有的代码进行一次加载解析,这样一方面的好处是代码...
    99+
    2022-11-12
  • 如何提升MongoDB的性能
    如何提升MongoDB的性能?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。(1)文档中的_id键推荐使用默认值,禁止向_id中保存自定义的值。...
    99+
    2022-10-18
  • 使用PhpFastCache提升您的网站性能
    在本文中,我们将探索PhpFastCache库,该库使您可以在PHP应用程序中实现缓存。 因此,它有助于改善整体网站性能和页面加载时间。什么是PhpFastCache?PhpFastCache是一个库,可轻松在PHP应用程序中实现缓存。 这...
    99+
    2023-03-17
    PhpFastCache php
  • 怎么使用OPCache提升PHP的性能
    这篇文章给大家分享的是有关怎么使用OPCache提升PHP的性能的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。PHP开发环境搭建工具有哪些一、phpStudy,是一个新手入门最常用的开发环境。二、WampServ...
    99+
    2023-06-14
  • 如何使用php函数来提升程序的性能?
    在开发Web应用程序时,性能是一个非常重要的因素。用户期望获得快速的响应和高效的操作体验。PHP是一种流行的服务器端开发语言,它提供了许多内置函数来完成各种任务。在编写PHP代码时,合理地使用这些函数可以显着提升程序的性能。本文将介绍一些常...
    99+
    2023-10-21
    缓存 (Cache) 多线程 (Multithreading) 优化 (Optimize)
  • 如何使用Memcache提升PHP应用程序的性能和可用性?
    如何使用Memcache提升PHP应用程序的性能和可用性?引言:随着互联网应用程序的迅速发展和用户访问量的增加,提高应用程序的性能和可用性成为了开发者亟需解决的问题之一。其中,使用缓存是一种常见的优化手段。Memcache是一种常用的缓存技...
    99+
    2023-11-09
    PHP应用程序 Memcache(缓存) 性能和可用性
  • Vite使用Esbuild提升性能详解
    目录前言初探 Esbuild关键 API - transfrom & buildpluginEsbuild 在 Vite 中的巧妙使用预构建middlewares 中内容转换...
    99+
    2022-11-13
    Vite Esbuild性能提升 Vite Esbuild
  • PHP7性能优化如何提升
    这篇文章主要介绍“PHP7性能优化如何提升”,在日常操作中,相信很多人在PHP7性能优化如何提升问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”PHP7性能优化如何提升”的疑惑有所帮助!接下来,请跟着小编一起来...
    99+
    2023-06-21
  • 如何提升Node.js 服务性能
    这篇文章给大家介绍如何提升Node.js 服务性能,内容非常详细,感兴趣的小伙伴们可以参考借鉴,希望对大家能有所帮助。author如何使用find-my-way 通过 on 方法绑定路由,并且提供了 HTT...
    99+
    2022-10-19
  • PHP如何提升网站性能
    这篇文章给大家分享的是有关PHP如何提升网站性能的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。***条、尽可能的减少 HTTP 的请求数 (Make Fewer HTTP Requests ) http请求是要开...
    99+
    2023-06-17
  • 如何使用Memcache提升PHP应用程序的排序性能?
    如何使用Memcache提升PHP应用程序的排序性能?概述:在开发PHP应用程序时,经常需要对数据库中的数据进行排序。然而,如果数据集非常大,常规的排序方法可能会导致性能问题。为了解决这个问题,我们可以利用Memcache来缓存已排序的数据...
    99+
    2023-11-07
    PHP(编程语言) Memcache(缓存) 排序性能
  • 如何使用Memcache提升PHP应用程序的计算性能?
    如何使用Memcache提升PHP应用程序的计算性能?随着Web应用程序的复杂性不断增加,优化应用程序的性能成为开发者的首要任务之一。在PHP应用程序中,我们可以使用Memcache来提升计算性能,以减少数据库查询,增加数据的缓存并减少计算...
    99+
    2023-11-07
    Memcache(存储) 提升(性能) PHP(应用程序)
  • PHP8中如何使用JIT编译提升代码性能?
    PHP语言一直以来都被广泛用于构建Web应用程序,但是由于解释执行的特性,导致了其性能相对较低。为了提升PHP的性能,从PHP7开始引入了JIT(Just-in-Time)编译器,而在全新的PHP8版本中,JIT编译的功能得到了进一步的改进...
    99+
    2023-10-22
    PHP JIT编译 代码性能
  • win10 2004游戏性能如何提升
    本篇内容主要讲解“win10 2004游戏性能如何提升”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“win10 2004游戏性能如何提升”吧!win10 2004游戏性能怎么样:Windows ...
    99+
    2023-07-01
  • 如何使用Spring框架提升Go语言函数的性能?
    Spring框架是一款非常强大的Java开发框架,它可以帮助开发者快速构建高性能的应用程序。但是,你知道吗?Spring框架也可以用来提升Go语言函数的性能! 在本篇文章中,我们将介绍如何使用Spring框架来提升Go语言函数的性能。我们将...
    99+
    2023-11-05
    spring 框架 函数
  • .NET使用Collections.Pooled提升性能优化的方法
    目录简介Collections.Pooled如何使用性能对比PooledList<T>PooledDictionary<TKey, TValue>Pooled...
    99+
    2022-11-13
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作