关于C语言中的字符串输入输出

出于好奇测试了一下,声明的时候:
char ch[5];
scanf("%s",ch);
printf("%s,%d",ch,sizeof ch);

如果输入超过5个字母,字母都还是会全部显示出来的,而ch的大小还是5BYTE。这printf到底是什么黑科技?顺便问一下%s是怎么支持Unicode的?好像汉字啦,Ctrl+字符这一类奇奇怪怪的好像也都可以输出诶,怎么做到的?
好像getchar()也能正常识别汉字并储存的样子……

1.关于超过5个字节的问题。你的这样做法,数组实际已经跨过界了。问题是会表现出来的。例如,你在这个ch[5]后面另外定义一个int,先给这个int赋好值,你会发现scanf之后那个int的值变了.如果后面是没有数据的话,有可能会引起段错误..
2.有C/C++有tchar.h,可以完全支持unicode.根据你的控制台/终端的编码方式,ASCII0-31的控制字符,ASCII128-255的字符,也可能有对应的可显示字符的。甚至在一定情况下也可以把GBK的两半拼起来显示为一个汉字。但是如果存在编码转换,例如输入的时候是UTF-8,输出GBK就一定要处理过才行。

这不是黑科技,而是ch之后的不属于ch的内存也被非法使用了。
你可以用下面的代码测试一下长度超过5的情况。

    char ch0[100];
    char ch[5];
    char ch2[100];
    scanf("%s",ch);
    printf("%s",ch0);
    printf("%s",ch);
    printf("%s",ch2);

这种数组溢出的问题会导致后面的数据被覆盖,有时候会出错,有时候又不会出错,看当时的运行时环境。