c++截取漢字和英文混合字符串代碼實例
在C++里截取字符串可以使用string.substr(),可是這個函數(shù)只能按英文來截取,
如果是漢字可能就要計算好字符個數(shù),如果是漢字和英文混合,那就只能望洋興嘆了。
可是恰好我需要這樣一個函數(shù),于是就自己實現(xiàn)了一個,其中如何判斷漢字和英文
參看了此處。
代碼簡單也無優(yōu)化,若有更好的方法歡迎提出,代碼如下。
#include <iostream>
#include <string>
#include<cstdio>
#include<vector>
#include<typeinfo>
using namespace std;
int is_zh_ch(char p)
{
/*漢字的兩個字節(jié)的最高為都為1,這里采用判斷最高位的方法
將p字節(jié)進(jìn)行移位運算,右移8位,這樣,如果移位后是0,
則說明原來的字節(jié)最高位為0,不是1那么也就不是漢字的一個字節(jié)
*/
if(~(p >> 8) == 0)
{
return 1;//代表不是漢字
}
return -1;
}
string sub(string str,int start,int end=-1)
{
if(typeid(str)==typeid(string) && str.length()>0)
{
int len=str.length();
string tmp="";
//先把str里的漢字和英文分開
vector <string> dump;
int i=0;
while(i<len)
{
if (is_zh_ch(str.at(i))==1)
{
dump.push_back(str.substr(i,2));
i=i+2;
}
else
{
dump.push_back(str.substr(i,1));
i=i+1;
}
}
end=end>0?end:dump.size(); //end默認(rèn)為dump.size
if(start<0||start>end)
printf("start is wrong");
//直接從dump里取即可
for(i=start; i<=end; i++)
{
tmp+=dump[i-1];
}
return tmp;
}
else
{
printf("str is not string\n");
return "";
}
}
int main()
{
string p="半山wuji";
cout<<sub(p,1,1)<<endl;
cout<<sub(p,2,2)<<endl;
cout<<sub(p,3);
}
以上所述是小編給大家介紹的c++截取漢字英文混合字符串詳解整合,希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復(fù)大家的。在此也非常感謝大家對腳本之家網(wǎng)站的支持!
相關(guān)文章
Visual Studio Code上添加小程序自動補(bǔ)全插件的操作方法
這篇文章主要介紹了Visual Studio Code上添加小程序自動補(bǔ)全插件的操作方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-04-04
C++?MiniZip實現(xiàn)目錄壓縮與解壓的示例詳解
Zlib是一個開源的數(shù)據(jù)壓縮庫,提供了一種通用的數(shù)據(jù)壓縮和解壓縮算法,本文主要為大家詳細(xì)介紹了如何利用Zlib實現(xiàn)目錄壓縮與解壓,需要的小伙伴可以參考下2023-11-11
關(guān)于VS2022不能使用<bits/stdc++.h>的解決方案(萬能頭文件)
#include<bits/stdc++.h>包含了目前 C++ 所包含的所有頭文件,又稱萬能頭文件,那么如何在VS2022中使用萬能頭呢?下面小編給大家代理了關(guān)于VS2022不能使用<bits/stdc++.h>的解決方案(萬能頭文件),感興趣的朋友一起看看吧2022-03-03
淺析C/C++中動態(tài)鏈接庫的創(chuàng)建和調(diào)用
下面小編就為大家?guī)硪黄獪\析C/C++中動態(tài)鏈接庫的創(chuàng)建和調(diào)用。小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考,一起跟隨小編過來看看吧2016-05-05

