超级新手问答(C/C++ Newbie's FAQ)
新手必看。
学习C/C++肯定会问到以下几个问题,下面让这个经验帮你解惑吧!
步骤/方法
- 01
vi, vim是编译器么? vi means visual editor,是软件世界第一个全屏幕编辑器,最初的作者是现在Sun microsystem的Bill Joy。 vim means Vi IMproved,可以看作是增强的vi。 很不幸,他们都不是编译器,如果你已经写好了first.c,那么不能指望vi们将你的源代码变成执行程序。
- 02
gcc, g++这些都是干什么用的 gcc means GNU C Collector,是GNU的旗舰软件,自由软件,C语言编译器。 g++ 是GNU的C++编译器。
- 03
那么cc, CC, ld, make这些程序又是干什么的呢? cc是unix world中对c编译器的叫法,就是c compiler。 CC是对c++编译器的叫法,这两个名称都不特指某一厂家的产品。例如HP提供的HP-UX上c编译器叫cc,Solaris上的c编译器也叫cc ld means link editor,是连接器的通称,并不特指某一个具体的产品。但是他们都是用来连接目标文件的。 make means ???,make程序根据Makefile/makefile中指定的规则,以及一些默认的规则,完成从源代码到最终代码的处理过程。不光可以用来编译连接程序,也可以做其它的一些有依赖,分阶段的事情。
- 04
我已经安装了linux,如何开始我的C/C++之旅呢? step 1: typein a helloworld program(1) in your favorate editor, I think it must be a vim step 2: save your program to hello.c and then quit from the editor step 3: typein 'gcc hello.c' step 4: typein 'a.out' 这时候,你应该可以看到你的第一个程序已经顺利运行了! 我们将上面的四个步骤概括一下,然后遵循这几个步骤,你就可以不断的生产出各样的程序了 第一步:编辑程序 第二步:编译程序 第三步:运行程序
- 05
我的程序运行结果与我想象的不同! 如果你的第一反应是"printf这个函数(或者gcc或者其他的库什么的)有问题!",那么我想你是个自恋狂,记住,整个系统中唯一没有经过测试的就是你的代码,任何东西都是没有问题的,除了你的代码。(当然gcc也可能有问题,但是被你遇到的几率可以暂时看作是0) 我们有两种方式来解决这个问题: 第一种方式是使用printf函数在可能出问题的地方输出相关变量,好处是可以快速的上手,不需要其他的知识。坏处是如果你没有足够的技巧,你有可能忘记删除这些函数,以及在程序比较大的时候每次增加了新的printf都要重新编译,太浪费时间。 第二种方式是使用调试器,比如gdb。但是gdb就象你知道的其他大部分调试器一样,是符号调试器,他们依赖于编译器产生的符号表。符号表通常可以通过给编译器指定-g参数来生成。如果没有符号表,gdb很难使用(仍然可以使用,如果你熟悉汇编语言的话)。
- 06
Core dump! 你的程序现在已经很复杂了,在你增加了某一个十分强劲的功能后,一执行,屏幕上出现一行小字: Segmentation fault(core dump) 然后一切就都安静了下来。可以说太糟糕了,unix所能提供的最坏的界面都让你遇到了。怎么办呢? 如果你记得了在编译程序的时候使用-g参数,那么现在它就派上了用场。你可以: gdb a.out core 然后你就可以通过gdb的where命令查看问题出在了什么地方。 segmentation fault的意思是段违例,一般由于你的程序越界写造成。例如你的数组长度是8,但是你企图向相当于第10个元素的位置写入数据,就可能会产生这个问题。core dump产生的原因不止是segment fault,还有可能是其他的,总之是因为有坏人向你的程序发送了一个不可捕获的信号。如果这句话的意思你不明白,没有关系,也不需要明白,那是以后的事。
- 07
printf的头文件在哪里? 你在星巴克里跟女朋友聊天并同时向邻座的单身女孩抛媚眼的时候,脑子里还在想一个想了很长时间但是一直没有答案的问题,到底如何向屏幕输出一行文字呢?这时候,两个笨蛋从你旁边经过,他们正在讨论printf,你听到后,觉得:哦,这才是我想要的,对printf,没错。但是你那如编译器一般的大脑马上提醒你,找不到函数原型,应该包含什么头文件呢?于是你停止聊天和抛接媚眼,打开手提电脑,通过某种无线装置接入到internet,在bbs上发了一个帖子: where the printf() is defined? 但是出乎你的意料,尽管这是一个刚果人都经常光顾的bbs,但是居然过去了5分钟之后,仍然没有人回答你。看来这个问题偏难,你微笑着对你的女朋友说。 事实上,你不应该问这样的问题。你应该学会自己解决这样的问题,我提供给你几个途径: main printf(如果该关键字有多个entry,则应该用man -a或者man -k,或者直接指定section) find /usr/include -name "*.h" -print | xargs grep printf search on Google
- 08
我已经有多个.c 文件了,应该如何编译呢? 经过一段时间的开发,你的程序目前已经从一个简单的foo.c变成了两个文件,foo.c和bar.c,我们假定foo.c中定义了main函数。那么: gcc -g bar.c 将报告你没有main函数。这让你很恼火,是否应该合并两个文件呢?还是...? 正确的做法是编译时刻增加一个“只编译”的参数-c: gcc -g -c bar.c gcc -g -c foo.c gcc -o a.out foo.o bar.o 这样之后,你的程序可以运行了。我们在前面提到三个步骤,编辑,编译,运行。但实际上,我们忽略了一个重要的步骤就是连接,我们前面的例子中,编译和连接都是一步完成的(不指定-c 的话),因此我们没有提起。但是你大概会问,连接不应该是用ld么?为什么在这里用gcc完成了呢?ld当然是可以完成任务的,但是它并不知道我们在写一个c程序,c程序的main函数是由_start()函数调用的,而start函数是在runtime目标文件中(通常叫做xxcrt.o)实现的,任何c程序都必须连接这个runtime目标文件。如果用ld作为连接器,我们不得不自己指定这个目标文件的位置以及文件名。但是,如果用gcc,则方便的多,它知道我们要额外连接那些东西,它提供给我们一个更简单的使用界面,尽管它仍然是通过调用ld来工作的。
- 09
Why a.out? 迄今为止,你发现你的执行程序一直叫a.out,这个名字很古怪,也很土,你说呢?如果你想改变一下你的程序名字,应该: gcc -o win.exe foo.c bar.c 这样,你的程序就叫做win.exe,而不是a.out了。 a.out这个名字的起源估计是某人的一时冲动,例如我小时侯经常把程序中的变量依次称为aint, bint...(绝对的坏习惯,这里先不说这个)。但是后来执行文件因此得名,甚至执行文件的格式也因此得名(早期的unix执行文件格式称为a.out格式,当然现在已经进化为ELF了)。
- 10
如何生成动态库和静态库? 静态库是一个目标文件的简单集合。由ar(archive,归档的意思)生成。 ar -cr libfoo.a foo.o bar.o 通常命名方式是libxxx.a,但是你不遵守也没有太大的问题。应用程序在使用你的库的时候,通常只需要告诉ld你的库名字即可,这个名字就是libxxx.a中的xxx,例如ld -lfoo。意思是告诉ld,连接一个名字为libfoo.a或者libfoo.so的库。如果你的库名字不遵循libxxx.a的格式,ld就找不到,给应用开发造成麻烦。 另外,静态的意思是每个用到该库的应用程序都拥有一份自己的库拷贝,应用程序运行的时候,即使将库删除也没有问题因为应用程序自己已经有了自己的拷贝。动态库结构复杂一些,通常是一个ELF格式的文件。可以有三种方法生成: ld -G gcc -share libtool 用ld最复杂,用gcc -share就简单的多,但是-share并非在任何平台都可以使用。GNU提供了一个更好的工具libtool,专门用来在各种平台上生成各种库。 动态库实际上应该叫做共享库,只是很多人从windows的Dynamic Linked Library这个词学习过来,把unix的共享库称做动态库。所有应用程序共享一份库拷贝,所以,即使连接完了,也不能将其删除。而且需要在LD_LIBRARY_PATH这个环境变量中正确的设置库所在的位置,否则程序运行会报告找不到这个库。
- 11
我有了10个.c文件,还是一个一个编译么?有没有工程的概念(就象vc的dsp)? 确实一个一个编译很土。我们有更好的办法,就是make。make程序是一个类似脚本执行程序一样的东西。它根据你提供的Makefile(或者小写的makefile)来工作,它可以处理复杂的依赖关系,就象你希望的那样,如果修改了一个头文件,那么包含它的所有.c程序都应该被重新编译。但是很不幸,这种依赖关系需要你自己指定。你首先要了解makefile的语法,然后根据语法来写makefile。当程序很多得时候,makefile也变得复杂。如果你希望得到makefile得更详细信息,可以man make或者在linux里面: info make 但是没有更简单的办法么?好在世界上除了你我之外还有很多人注意到了这个问题。目前有两个简单的办法: imake,imake是依赖已经建立好得一个库信息数据库,可以帮助你完成连接遇到的问题,尤其是写X Window程序,很多人用imake automake/autoconf,这两个程序更加完善和简单。但是使用稍微复杂一些,你需要看更多的手册才能掌握,但是非常好用,简单到如果你增加了一个.c文件,只需要在Makefile.am中增加一个文件名即可,头文件的依赖完全自动生成。这两个简单的办法已经超过了新手可以接受的范围,如果你确实是新手,还是学着自己写makefile好一些。
- 12
我要学习linux kernel的源代码,遇到了一些问题,能告诉我怎么办么? 如果前面的问题有你不清楚的,我建议你还是找一本浅显一些的教材,然后敲些例子程序来学习。现在大家的趋势好象是言必称kernel,好象不太对劲。学习的对象如果不适合自己的层次,只能导致进度减慢。
- 13
printf()这个函数如何使用? 这个问题好象与前面的问题类似,但是因为太多人问类似的问题,所以只好单独列出来了。你不应该问这样的问题,你应该首先想到的是man,这个伟大的助手。 man printf 当然,不同的OS,能够提供给你的man略有不同,例如man的参数等等。所以当你接触到一个新的unix变种的时候,有必要先: man man 这样可以知道man应该如何使用。 另外,当man解决不了你的问题的时候,最好的办法是自己写一个测试程序,在自己的$HOME中保持一个test目录是我的习惯,遇到任何不能肯定的问题,都可以在这里先实验一番。这些办法都比到bbs上去提问高效。
- 14
Windows vs Linux? 这里扯出这个问题好象有些奇怪。这个文档主要是以linux为背景讲的,因此很少涉及到Windows平台下面的东西。但是这不等于说Windows不好,只是顾及了我自己的一些偏好。开始学习的初期,这些因素的影响不大,不用加入到孰优孰劣的无聊争论中。
- 15
我要学习C++,需要C语言的知识么? C++和C这两种语言的关系在The C++ Programming Language这本书的1.6节讲的已经很清楚了,如果你有什么疑问,可以仔细读一读。应该可以不需要C语言的知识就可以开始学习C++,但是有些C的基本常识,再学习C++,肯定是有帮助的。
- 16
哪些东西应该放进头文件中,哪些不应该? 头文件相当于一个模块接口的描述,应该尽可能的简单明了。 我们可以根据下面的公式来判断哪些东西应该进入头文件,哪些只要在源程序中声明就可以了: 这个结构是否会在其它源程序中被使用? yes 进入头文件 no 不进入头文件 实际上,还会有一些被“株连”的结构啊,宏啊什么的被编译器要求放进头文件。例如: struct A { struct B b; // 用到了另外一个结构 int c; }; 这就是我所谓的“株连”。但是这里有点儿小技巧,比如struct B事关国家安全,绝对不能让别人知道它的结构,因此不能将其放进头文件中。这时候可以采用下面的方法: struct B; // 告诉编译器在某处声明了一个struct B struct A { struct B * b; // 变成指针 int c; }; 通过这种方法,你就可以将struct B的声明移到某个.c文件中,从而达到了隐藏信息的目的。
- 17
宏是什么,预处理是什么意思? 你经常遇到一些#define之类的东西,这些东西是干什么用的?有什么作用?有人告诉你说这些叫做宏(macro),你对这个单词的中文和英文都很不能接受,甚至如果你看一些台湾的资料,把这些东西叫做“巨集”,这就更让你摸不到头脑了。这不奇怪,因为这实在是C语言当初从那些低级语言演变过来的过程中遗留的产物,现在时髦的语言比如VB,Java中都不存在了。 你可以这么理解,如果你不想在程序中重复的书写同一段代码,例如,你的程序中有一个结构,还有很多地方都需要对这个结构赋值,每次你都要写十几行同样的代码给它的每个成员一个初始值,很快你就感到厌烦了。你很想简单一些,可是不知道怎么办,这时候宏可以帮助你。你可以 声明一个宏,在这个宏中,对结构的每个成员赋值。然后在每次真的想赋值的时候,写一行代码就完成了。别急,别急,我知道你想说什么,你想说其实你有自己的办法,写一个函数不就可以了么?一样每次赋值只需要一行代码。你说的没错,这两种办法都可以,但是有一些区别。这种区别只有在编译后的汇编代码中你才能发现。为了避免你让我举出汇编代码的例子,我决定利用一下编译器。假设你有下面的程序: #define setValue(x) x.a = 10; x.b=5; x.c=1; struct S { int a; int b; int c; }; int main() { struct S s; setValue(s); return 0; } 该程序名为test.c。下面,我们执行: gcc -E test.c -o test.txt 看看我们得到了什么?一个名字为test.txt的文件,这个文件的内容如下: struct S { int a; int b; int c; }; int main() { struct S s; s.a = 10; s.b=5; s.c=1;; return 0; } 首先要解释一下,gcc -E的含义,-E这个参数表示要求gcc在进行预处理之后就停止,不要继续工作下去了,先休息休息。
- 18
内存的分配和释放(静态,动态) 这是一个持久的话题,没有新手不在这上面绊蒜(栽跟头)的。很多老手常常在这个问题上告诫新手,这方面的问题以前也经常出现在面试的题目中 ,搞得十分神秘。 其实,你只要记得一句话,释放自己分配的内存。一切问题都可以应付,相信我,就这么简单,当然,如果你没记住,也没什么大不了的如何理解呢?执行一次动态内存分配,就应该记得执行一次内存的释放。例如一个malloc对应一个free,一个new对应一个delete。就这么简单。可为什么说记不住也没什么大不了呢?我说的是,在某些情况下,你忘记了这个一一对应的关系对程序也没什么影响,如果你不是在写一个daemon的话。进程终止后,自然一切进程空间内的东西都化为乌有,你忘记了释放又有什么关系呢?(尽管这样,我仍然建议你严格遵守前面的原则,我说没什么大不了的,只是为了澄清一点概念) 但是实际情况要复杂的多,例如: 任何时候,如果你需要一个内存块来做点儿什么的话,那么只有两个来源,堆和栈。它们有什么区别呢?其实非常简单,栈上的内存空间是在编译时刻由编译器划出来的,编译之后就已经确定了相对的地址,只要一运行,即使你什么都不作,它也立刻就存在了。堆上的内存空间则需要你的程序“动态”的,也就是在运行时刻,通知操作系统,由操作系统来完成分配,而在这之前,是不存在的。因此我们可以这么认为,栈上的内存不需要你释放,堆上的内存必须由你释放。 你使用了asctime这个函数,你发现它给你返回了一个字符串,这个字符串使用的空间是从哪里来的?是否要你释放一下呢?答案是不需要,C库中尽量避免了这种情况,就是返回给你一个动态分配的内存块,然后需要你自己来释放。它通常的策略是返回给你一个静态变量。如果你对这种方式不满(例如,你在写一个多线程的程序),你可以使用以_r结尾的相应函数代替。_r结尾的函数给了你更多的自主,你需要自己先搞到一块内存(堆上的或者栈上的),然后将这个内存块地址告诉它。因此,_r结尾的函数都是线程安全的,也全部比对应的函数多一个参数。通过使用_r结尾的函数,你就可以坚定的贯彻“释放自己分配的内存”这个原则了。 类似char * s = "this is a string";这样的语句,s这个指针指向的内存是否需要释放呢?答案还是不需要。"this is a string"所需要的内存在程序被编译的时候就已经确定下来了,在栈上分配。我们怎么判断这一点呢?好在linux给我们提供了足够的工具,我们可以用size这个程序来观察程序的代码(text)段。通过将这个字符串变长或者变短,我们会发现text段的长度也随之变化。而动态分配的内存大小对代码段的大小是没有影响的。这个内存块不是你分配的,所以你不要释放。 你已经使用free释放了一块内存,但是随后你发现如果你引用这块内存,还是可以得到与原来一样的内容。这也不奇怪,free只处理一个内存块的索引表,并不处理内存块中的内容。它在内存块的索引表中标识出这块内存处在free的状态,然后就返回。很多超级新手认为free会将内存块清0(或者其它的什么值),这是幻想。 同样的道理,如果你在函数中返回栈上的一个内存块的指针,在函数返回后仍然可以得到与在函数中一样的内容。这也是因为函数返回的时候,只是更改了栈指针,并没有人去管栈内的内容。当然前提是该函数返回后没有进行其它的函数调用,这样栈内内容就可以保持不变。但是一旦发生了函数调用,栈指针又向下压,栈内的内容就可能改变了。因此,绝对不能返回栈上的内存块指针,即使有的时候看上去很正确。
- 19
linux编译的程序能不能在sun上跑? 如果你没有这样的例子,可以参照: #include <stdio.h>; int main() { printf("hello world\n"); return 0; }