首页 > 编程语言 > C语言进阶教程之字符串&内存函数
2023
01-03

C语言进阶教程之字符串&内存函数

前言:

字符串是一种非常重要的数据类型,但是C语言不存在显式的字符串类型,C语言中的字符串都以字符串常量的形式出现或存储在字符数组中。字符串常量适用于那些对它不做修改的字符串函数。同时,C 语言提供了一系列库函数来对操作字符串,这些库函数都包含在头文件 string.h 中。 

一、求字符串长度

strlen

size_t strlen ( const char * str );
  • 字符串已经 '\0' 作为结束标志,strlen函数返回的是在字符串中 '\0' 前面出现的字符个数(不包含 '\0' )
  • 参数指向的字符串必须要以 '\0' 结束
  • 注意函数的返回值为size_t,是无符号的( 易错 )
  • 学会strlen函数的模拟实现

源字符串必须以 '\0' 结束。 会将源字符串中的 '\0' 拷贝到目标空间。 目标空间必须足够大,以确保能存放源字符串。 目标空间必须可变。 学会模拟实现。

例1:

#include <stdio.h>
#include <string.h>
int main()
{
    int len1 = strlen("abcdef");
    printf("%d\n", len1); //6
    char arr[] = {'a','b','c','d','e','f'};
    //错误写法
    int len2 = strlen(arr);
    printf("%d\n", len2); //随机值
    return 0;
}

执行结果: 

例2:

int main()
{
    if(strlen("abc") - strlen("abcdef") > 0)
        printf("hehe\n");
    else
        printf("haha\n");
    system("pause");
    return 0;
}

执行结果:

 由于此时的strlen没有进行定义,它的默认类型为无符号类型,那么两个无符号数相加减最后得出的数是一个很大的数,所以最后的结果必然是大于0的

strlen函数的模拟实现

(1)计数器

#include <stdio.h>
#include <assert.h>
int my_strlen(const char *str)
{
    int count = 0;
    assert(str != NULL);
    while(*str != '\0')
    {
        count++;
        str++;
    }
    return count;
}
int main()
{
    int len = my_strlen("abcdef");
    printf("%d\n", len);
    return 0;
}

 (2)指针-指针

#include <stdio.h>
int my_strlen(const char *str)
{
	  const char *p = str;
	  while(*p != '\0')
	  {
	  	  p++;
	  }
	  return p-str;
}
int main()
{
	  int len = 0;
	  char arr[10]="abcdef";
	  len = my_strlen(arr);
	  printf("%d\n", len);
	  return 0;
}

(3)递归

不创建临时变量求字符串长度

#include<stdio.h>
int my_strlen(const char *str)
{
	  if(*str=='\0')
		    return 0;
	  else
  	    return 1+my_strlen(str+1);
}
 
int main()
{
    int len = 0;
	  char arr[10]="abcdef";
	  len = my_strlen(arr);
	  printf("%d\n", len);
    return 0;
}

二、长度不受限制的字符串函数

strcpy

char* strcpy(char * destination, const char * source);
  • 将按源指向的 C 字符串复制到按目的地指向的阵列中,包括终止空字符 (并停止在那个时候)
  • 源字符串必须以 '\0' 结束
  • 会将源字符串中的 '\0' 拷贝到目标空间
  • 目标空间必须足够大,以确保能存放源字符串
  • 目标空间必须可变。 学会模拟实现

例:

#include <stdio.h>
int main()
{
    char arr1[] = "abcdefghi";
    char arr2[] = "bit";
 
    //错误示范
    //char *arr1 = "abcdefghi";
    //p指向常量字符串,而常量字符串无法被修改
    //char arr2[] = {'b','i','t'};
    //由于此时没有给'\0',由于找不到'\0'会导致向后越界访问
 
    strcpy(arr1, arr2); 
    printf("%s\n", arr1);
    return 0;
}

strcpy函数的模拟实现

#include <stdio.h>
#include <assert.h>
char *my_strcpy(char *dest, const char *src)
{
    assert(dest != NULL);
    assert(src != NULL);
    char *ret = dest;
    //拷贝src指向的字符串到dest指向的空间,包含'\0'
    while(*dest++ = *src++)
    {
        ;
    }
    //返回目的的空间的初始地址
    return ret;//'\0'
}
int main()
{
    char arr1[] = "abcdefgh";
    char arr2[] = "bit";
    my_strcpy(arr1, arr2); 
    printf("%s\n", arr1);
    return 0;
}

strcat

char * strcat ( char * destination, const char * source );
  • 将源字符串的副本附加到目的地字符串。终止无效字符在目的地由源的第一个字符覆盖,并在源的末尾包含空字符由目的地两者的连结形成的新字符串
  • 源字符串必须以 '\0' 结束
  • 目标空间必须有足够的大,能容纳下源字符串的内容
  • 目标空间必须可修改
  • 字符串自己如何给自己追加

例:

#include <stdio.h>
int main()
{
    char arr1[30] = "hello\0xxxxxxx";
    char arr2[] = "wolrd";
    strcat(arr1, arr2);
    printf("%s\n", arr1);
    //错误示范
    char arr3[] = "hello";
    char arr4[] = "world";
    strcat(arr3, arr4);
    printf("%s\n", arr3);
    //由于arr3数组没有定义空间大小
    //此时就开辟了'hello\0'6个字节
    //当arr4数组追加过去后就产生了越界访问,产生报错
    return 0;
}

调试结果: 

执行结果:

总结:此时我们可以看到,arr2数组内的的字符串从arr1数组中的'\0'开始进行追加

当arr2数组内的字符串追加过去后,后面的‘\0'也一并追加了过去

当目标空间不够大时,就会造成访问越界

strcat函数的模拟实现

#include <stdio.h>
#include <assert.h>
char *my_strcat(char *dest, const char *src)
{
    assert(dest != NULL);
    assert(src);
    char *ret = dest; 
    //1.找到目的字符串的'\0'
    while(*dest != '\0')
    {
        dest++;
    }
    //2.追加
    while(*dest++ = *src++)
    {
        ;
    }
    return ret;
} 
 
int main()
{
    char arr1[30] = "hello";
    char arr2[] = "wolrd";
    my_strcat(arr1, arr2);
    printf("%s\n", arr1);
    return 0;
}

strcmp

int strcmp (const char * str1, const char * str2 );

此函数开始比较每个字符串的第一个字符。 如果它们彼此相等,则继续使用以下对,直到字符不同或到达终止空字符为止。 

标准规定:

  • 第一个字符串大于第二个字符串,则返回大于0的数字
  • 第一个字符串等于第二个字符串,则返回0
  • 第一个字符串小于第二个字符串,则返回小于0的数字
  • 那么如何判断两个字符串?
#include <stdio.h>
#include <string.h>
int main()
{
    char *p1 = "qbc";
    char *p2 = "abc";
    // int ret = strcmp(p1, p2);
    // printf("%d\n", ret);
    if(strcmp(p1, p2) > 0)
    {
        printf("p1 > p2\n");
    }
    else if(strcmp(p1, p2) == 0)
    {
        printf("p1 == p2\n");
    }
    else if(strcmp(p1, p2) < 0)
    {
        printf("p1 < p2\n");
    }
    return 0;
}

strcmp函数的模拟实现

#include <stdio.h>
int my_strcmp(const char *str1, const char *str2)
{
    assert (str1 && str2);
    // 比较
    while(*str1++ == *str2++)
    {
        if(*str1 == '\0')
        {
            return 0;//等于
        } 
    }
    if(*str1 > *str2)
        return 1;//大于
    else
        return -1;//小于
    //return (*str1 - *str2);
    //通过相减判断大于或小于
}
}
int main()
{
    char *p1 = "abcdef";
    char *p2 = "abqwe";
    int ret = my_strcmp(p1, p2);
    printf("ret = %d\n", ret);
    return 0;
}

三、长度受限制的字符串函数

strncpy

char * strncpy ( char * destination, const char * source, size_t num );//单位是字节
  •  将源的前 num 个字符复制到目标。 如果在复制 num 个字符之前找到源 C 字符串的结尾(由空字符表示),则用零填充目标,直到总共写入了 num 个字符。
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。

 例1:

int main()
{
    char arr1[10] = "abcdefgh";
    char arr2[] = "bit";
    stcncpy(arr1, arr2, 6);
    return 0;
}

调试结果: 

 例2:

#include <stdio.h>
#include <string.h>
int main()
{
    char arr1[10] = "abcdefgh";
    char arr2[] = "bit";
    strncpy(arr1, arr2, 6);
    return 0;
}

调试结果: 

 由此可见,strncpy函数能拷贝任意长度的字符,当拷贝的字符长度不够拷贝数时,用 '\0' 进行补充,直到拷贝数相等

strncpy函数的模拟实现

#include <stdio.h>
#include <assert.h>
void my_strncpy(char *dest, const char *src, int n)
{
    assert(src);
    char* p1 = dest;
    const char* p2 = src;
    while (n--)
    {
        *p1++ = *p2++;
    }
}
 
int main()
{
    char arr1[20] = "hello"
    char arr2[] = "world";
    my_strncpy(arr1, arr2, 3);
    return 0;
}

strncat

char * strncat ( char * destination, const char * source, size_t num );
  • 将源的前 num 个字符附加到目标,再加上一个终止空字符
  • 如果 source 中 C 字符串的长度小于 num,则只复制终止空字符之前的内容。

例1:

#include <stdio.h>
#include <string.h>
int main()
{
    char arr1[30] = { "hello\0xxxxxx" };
    char arr2[] = "world";
    strncat(arr1, arr2, 4);
    return 0;
}

调试结果: 

例2:

int main()
{
    char arr1[30] = { "hello\0xxxxxxxxx" };
    char arr2[] = "world";
    strncat(arr1, arr2, 8);
    return 0;
}

调试结果:

 由此可见,不管追加几个数,都会在追加字符串后加上 '\0',而一旦追加数超过了追加字符串的长度,在追加完整字符串后面再加上'\0'后便结束了

strncat函数的模拟实现

#include<stdio.h>
#include<assert.h>
#include<string.h>
void my_strncat(char* dest, const char* src, int len1, int len2, int n)
{
	char* ret = dest + len1;
	assert(src);
	assert(n <= len2);
	while ((n--) && (*ret++ = *src++))
    {
		;
    }
}
int main()
{
	char arr1[20] = "abcd";
	char arr2[] = "efghi";
	int len1 = strlen(arr1);
	int len2 = strlen(arr2);
	int n = 0;
	scanf("%d", &n);
	my_strncat(arr1, arr2, len1, len2, n);
	return 0;
}

strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

比较到出现另个字符不一样或者一个字符串结束或者num个字符全部比较完。

例:

#include <stdio.h>
#include <string.h>
int main()
{
    const char* p1 = "abcdef";
    const char* p2 = "abcqwer";
    int ret = strncmp(p1, p2, 4);
    printf("%d\n", ret);
}

执行结果:

strncmp函数的模拟实现

#include<stdio.h>
#include<assert.h>
#include<string.h>
int my_strncmp(const char *dest, const char *src, int n)
{
	int ret = 0;
	assert(dest);
	assert(src);
	assert(n);
	while( (n--) && !(ret = (unsigned char)*dest-(unsigned char)*src) && *dest )
	{
		dest++;
		src++;
	}
	return ret;
}
int main()
{
	char arr1[] = "abcdef";
	char arr2[] = "abcedef";
	int n = 0;
	int ret = 0;
	int i = 0;
	scanf("%d",&n);
	ret = my_strncmp(arr1, arr2, n);
	if(ret == 0)
	{
		for(i=0; i<n; i++)
		printf("%c",arr1[i]);
		printf("=");
		for(i=0; i<n; i++)
		printf("%c",arr2[i]);
	}
	else if(ret < 0)
	{
		for(i=0; i<n; i++)
		printf("%c",arr1[i]);
		printf("<");
		for(i=0; i<n; i++)
		printf("%c",arr2[i]);
	}
	else
	{
		for(i=0; i<n; i++)
		printf("%c",arr1[i]);
		printf(">");
		for(i=0; i<n; i++)
		printf("%c",arr2[i]);
	}
	return 0;
}

四、字符串查找

strstr

char * strstr ( const char *, const char * );

返回指向 str1 中第一次出现 str2 的指针,如果 str2 不是 str1 的一部分,则返回空指针。

例:

int main()
{
    char *p1 = "abcdefabcdef";
    char *p2 = "def";
    char * ret = strstr(p1, p2);
    if(ret == NULL)
    {
        printf("子串不存在");
    }
    else
    {
        printf("%s\n", ret);
    }
    system("Pause");
    return 0;
}

执行结果:

 由此可得出,当有主字符串中存在两个及以上子串时,优先按第一次出现相同的地址进行打印,并且会一直打印完剩下的字符串

strstr函数的模拟实现

#include <stdio.h>
#include <assert.h>
//KMP 算法
char *my_strstr(const char *p1, const char *p2)
{
    assert(p1 != NULL);
    assert(p2 != NULL);
    char *s1 = NULL;
    char *s2 = NULL;
    char *cur = (char*)p1;//当前指针current
    if(*p2 == '\0')
    {
        return (char*)p1;
    }
    while(*cur)
    {
        s1 = cur;
        s2 = (char*)p2;
 
        while(*s1 && *s2  && (*s1 == *s2))
        {
            s1++;
            s2++;
        }
        if(*s2 == '\0')
        {
            return cur;//找到子串
        }
        cur++;
    }
    return NULL;//找不到子串
}
 
int main()
{
    char *p1 = "abcdef";
    char *p2 = "def";
    char * ret = my_strstr(p1, p2);
    if(ret == NULL)
    {
        printf("子串不存在\n");
    }
    else
    {
        printf("%s\n", ret);
    }
    return 0;
}

strtok

char * strtok (char *str, const char *sep);
  • sep参数是个字符串,定义了用作分隔符的字符集合
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用 \0 结尾,返回一个指向这个标记的指针。(注:strtok函数会改 变被操作的字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为 NULL ,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回 NULL 指针。

例:

#include <stdio.h>
#include <string.h>
int main()
{
    char arr[] = "qpzyahxf@163.com";
    char *p = "@.";
    char buf[1024] = {0};
    //strtok会改变字符串内容,buf防止原字符串被切割(保护原始数据)
    strcpy(buf, arr);
    //切割buf中的字符串
    char *ret = NULL;
    for(ret = strtok(arr, p); ret != NULL; ret = strtok(NULL, p))
    {
        printf("%s\n", ret);
    }
    // char *ret = strtok(arr, p);
    // printf("%s\n", ret);
    // ret = strtok(NULL, p);
    // printf("%s\n", ret);
    // ret = strtok(NULL, p);
    // printf("%s\n", ret);
    return 0;
}

执行结果:

strtok函数的模拟实现

#include <stdio.h>
char *my_strtok(char *str1 ,char *str2)
{
    static char *p_last = NULL;
    if(str1 == NULL && (str1 = p_last) == NULL)
    {
        return NULL;
    }   
    char *s = str1;
    char *t = NULL;
    while(*s != '\0')
    {
        t = str2;
        while(*t != '\0')
        {
            if(*s == *t)
            {
                p_last = s + 1;
                if( s - str1 == NULL)
                {
                    str1 = p_last;
                    break;
                }
                *s = '\0';
                return str1;
            }
            t++;
        }
        s++;
      }
      return NULL;
}
 
int main() 
{ 
    char arr[] = "qpzyahxf@163.com";
    char *ret = NULL;
    char *p = "@.";
    for(ret =  my_strtok(arr, p); ret != NULL; ret = my_strtok(NULL, p))
    {
        printf("%s\n", ret);
    }
    return 0; 
} 

五、错误信息报告

strerror

char * strerror(int errum);

返回错误码,所对应的错误信息。

 ​​​​​​例1:

#include <stdio.h>
#include <string.h>
int main()
{
    int i = 0;
    //1-10错误码的返回返回信息
    for(i = 0; i <= 10; i++)
    {
        printf("%d     %s\n", i, strerror(i));
    }
    system("pause");
    return 0;
}

执行结果: 

在实际在使用的时候,错误码并非由我们来控制的,而是接收系统返回的错误信息

例2:

#include <stdio.h>
#include string.h>
#include <errno.h>
    char *str = strerror(errno);//需引用头文件errno.h
    printf("%s\n", str);
    //errno 是一个全局的错误码的变量
    //当c语言的库函数在执行过程中,发生了错误,就会把对应的错误码,复制到errno中

例3:

#include <stdio.h>
#include <errno.h>
int main()
{
    //打开文件
    FILE *pf = fopen("test.txt", "r");
    if(pf == NULL)
    {
        printf("%s\n", strerror(errno));//知道错误的原因
    }
    else
    {
        printf("open file success.\n");
    }
    return 0;
}

执行结果: 

六、字符操作

字符分类函数

函数 如果他的参数符合下列条件就返回真
iscntrl 任何控制字符
isspace 空白字符:空格‘ ',换页‘\f',换行'\n',回车‘\r',制表符'\t'或者垂直制表符'\v'
isdigit 十进制数字 0~9
isxdigit 十六进制数字,包括所有十进制数字,小写字母a~f,大写字母A~F
islower 小写字母a~z
isupper 大写字母A~Z
isalpha 字母a~z或A~Z
isalnum 字母或者数字,a~z,A~Z,0~9
ispunct 标点符号,任何不属于数字或者字母的图形字符(可打印)
isgraph 任何图形字符
isprint 任何可打印字符,包括图形字符和空白字符

注:0位假,非0为真

 字符转换

int tolower ( int c ); 
//tolower 转小写字母
int toupper ( int c );
//toupper 转大写字母

例1:

#include <stdio.h>
#include <ctype.h>
int main()
{
    char ch = tolower('Q');
    putchar(ch);
    system("pause");
    return 0;
}

执行结果: 

例2:

#include <stdio.h>
#include <ctype.h>
int main()
{
    //大写字母转小写
    char arr[] = "No Mercy";
    int i = 0;
    while(arr[i])
    {
        if(isupper(arr[i]))
        {
            arr[i] = tolower(arr[i]);
        }
        i++;
    }
    printf("%s\n", arr);
    return 0;
}

执行结果: 

七、内存操作函数

在之前的学习中,我们了解了字符串拷贝可以使用strcpy函数,但是strcpy函数具有局限性。

当拷贝的数据不是字符串时,比如说int类型、float类型,还能使用strcpy函数吗?

strcpy函数在拷贝的时候是以\0为字符串拷贝的结束标志,那么在拷贝其它类型数据的时候,拷贝该结束的时候不一定存在\0。所以使用strcpy函数肯定是行不通的。那怎么办呢?

此时我们就可以使用memcpy函数-- - 内存拷贝函数,用来拷贝任意类型数据。

memcpy

void *memcpy ( void * destination, const void * source, size_t num );
//void* - 通用类型的指针-无类型指针
//dest destination 表示内存拷贝的目的位置
//src source 表示内存拷贝的起始位置
//size_t num 表示内存拷贝的字节数
  • 函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置
  • 这个函数在遇到 '\0' 的时候并不会停下来
  • 如果source和destination有任何的重叠,复制的结果都是未定义的。

例:

int main()
{
    int arr1[] = { 1,2,3,4,5 };
    int arr2[5] = { 0 };
    memcpy(arr2, arr1, sizeof(arr1));
    return 0;
}

调试结果:

memcpy函数的模拟实现

void *my_memcpy ( void *dest, const void *src, size_t num) 
{ 
    void *ret = dest; 
    assert(dest && src); 
    while (num--) 
    { 
        //*(char*)dest = *(char*)src;
		//dest = (char*)dest + 1;//++(char*)dest
		//src = (char*)src + 1;//++(char*)src
        *((char*)dest)++ = *((char*)src)++; 
    } 
    return ret; 
}
 
int main()
{
    int arr1[10] = { 1,2,3,4,5,6,7,8,9,10 };
	int arr2[10] = { 0 };
	my_memcpy(arr2, arr1, 20);
    return 0;
}

memmove

void * memmove ( void * destination, const void * source, size_t num ); 
//void* - 通用类型的指针-无类型指针
//dest destination 表表示内存移动的目的位置
//src source 表示内存移动的起始位置
//size_t num 表示移动内存的字节数

 和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的

如果源空间和目标空间出现重叠,就得使用 比特科技 memmove函数处理

memmove函数的模拟实现

void *my_memmove( void *dest, const void *src, size_t num) 
{ 
    void * ret = dest; 
    assert(dest && src);
    if (dest <= src || (char *)dest >= ((char *)src + num)) 
    { 
        while (num--) 
        { 
            *(char*)dest = *(char*)src; 
            dest = (char*)dest + 1;
			src = (char*)src + 1;
        } 
    }
    else
    { 
        //从后向前拷贝
        while (num--)
        {
            *((char*)dest + num) = *((char*)src + num);
        }
    } 
    return ret; 
} 
 
int main()
{
    int arr1[10] = {0,1,2,3,4,5,6,7,8,9};
    int arr2[10] = {0};
    my_memmove(arr1 + 2, arr1, 20);
    return 0;
}

memset

void* memset(void* dest, int c, size_t count);

作用:Sets buffers to a specified character.(将缓冲区设置为指定的字符)

以字节为内存设置单位

例:

#include<stdio.h>
#include<string.h>
int main()
{
	char arr[] = "abcdefg";
	memset(arr, '*', 4);
	printf("%s", arr);
	return 0;
}

执行结果

memcmp

int memcmp ( const void * ptr1, 
             const void * ptr2, 
             size_t num ); 

比较从ptr1和ptr2指针开始的num个字节

返回值如下

例:

#include<stdio.h>
#include<string.h>
int main()
{
	int arr1[5] = { 1,2,3,4,5 };
	int arr2[5] = { 1,2,3,4,8 };
	int ret = memcmp(arr1, arr2, sizeof(arr1));
	if (ret > 0)
	{
		printf("arr1 > arr2");
	}
	else if (ret == 0)
	{
		printf("arr1 == arr2");
	}
	else
	{
		printf("arr1 < arr2");
	}
	return 0;
}

执行结果:

总结

到此这篇关于C语言进阶教程之字符串&内存函数的文章就介绍到这了,更多相关C语言字符串&内存函数内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网!

编程技巧