【C语言基础】fscanf中的死循环问题

问题

在使用 fscanf读取文件时,使用[^\n]格式读到行末时,fscanf返回为0,不等于EOF(-1),所以一直执行while循环,打印str(第一行数据)。现在在循环体中调用fseek,使fscan读到行末时强行跳过/n,从而能够读取后面行的数据,现在的问题是,fseek中的offset为什么是2不是1呢?\n不是只有一个长度吗?

代码

文件内容如下

img


#include <stdio.h>
int main()
{
    char str[1024];
    // char str2[1024];
    FILE *fp = fopen("./test.txt", "r");
    while (fscanf(fp, "%[^\n]", str)!=EOF)
    {
        printf("%s\n", str);
        fseek(fp,2,SEEK_CUR);
    }
    
    fclose(fp);
    return 0;
}

执行结果:

fseek(fp,2,SEEK_CUR)可以得到正确的结果,fseek(fp,1,SEEK_CUR)则是一直打印第一行结果。

img

输入格式%[^\n]匹配任何字符除了换行符,换行符没有被提取仍在文件流中,下次再读时,输入格式%[^\n]没有匹配提取任何字符,所以返回值是0,换行符仍然没有被提取,这样就形成了死循环。
Windows系统下,按文本模式打开文件,当保存文件时,系统会自动把把\n替换成\r\n,读取文本文件时,系统会自动把\r\n替换成\n,也就是说Windows系统下文本文件中的换行其实是由两个字符\r\n组成的,因此你用fseek跳过换行需要跳过两个字节。
Linux系统下文本文件的换行就是\n一个字符,因此你用fseek跳过换行只需跳过一个字节。

其实正确的按行读入文件方式是应该使用fgets()函数,而不是fscanf(),下面是一个简单的例子

#include <stdio.h>

#define N 1024

int main()
{
    char str[N];
    FILE *fp = fopen("./test.txt", "r");
    if (!fp)
    {
        perror("fopen failed");
        return 1;
    }
    while (fgets(str, N, fp))
        printf("%s", str);
    fclose(fp);
    return 0;
}

经实验,在win上要offset设置2,linux要设置4,才能够正常输出

不要把
fopen("...","...");fscanf,fprintf,fgets,fgetc,fputc,fclose //读时把\r\n替换成\n,写时把\n替换成\r\n;读到\x1a就设置EOF;读写的内容当字符看待

fopen("...","...b");fseek,ftell,fread,fwrite,fscanf,fprintf,fgets,fgetc,fputc,fclose //不作以上替换,遇到\x1a仍继续读;读写的内容当字节看待
弄混了