超级新手问答（C/C++ Newbie's FAQ) 【百科全说】

新手必看。
学习C/C++肯定会问到以下几个问题，下面让这个经验帮你解惑吧！

步骤/方法

01

vi, vim是编译器么？ vi means visual editor，是软件世界第一个全屏幕编辑器，最初的作者是现在Sun microsystem的Bill Joy。 vim means Vi IMproved，可以看作是增强的vi。很不幸，他们都不是编译器，如果你已经写好了first.c，那么不能指望vi们将你的源代码变成执行程序。
02

gcc, g++这些都是干什么用的 gcc means GNU C Collector，是GNU的旗舰软件，自由软件，C语言编译器。 g++ 是GNU的C++编译器。
03

那么cc, CC, ld, make这些程序又是干什么的呢？ cc是unix world中对c编译器的叫法，就是c compiler。 CC是对c++编译器的叫法，这两个名称都不特指某一厂家的产品。例如HP提供的HP-UX上c编译器叫cc，Solaris上的c编译器也叫cc ld means link editor，是连接器的通称，并不特指某一个具体的产品。但是他们都是用来连接目标文件的。 make means ???，make程序根据Makefile/makefile中指定的规则，以及一些默认的规则，完成从源代码到最终代码的处理过程。不光可以用来编译连接程序，也可以做其它的一些有依赖，分阶段的事情。
04

我已经安装了linux，如何开始我的C/C++之旅呢？ step 1: typein a helloworld program(1) in your favorate editor, I think it must be a vim step 2: save your program to hello.c and then quit from the editor step 3: typein 'gcc hello.c' step 4: typein 'a.out' 这时候，你应该可以看到你的第一个程序已经顺利运行了！我们将上面的四个步骤概括一下，然后遵循这几个步骤，你就可以不断的生产出各样的程序了第一步：编辑程序第二步：编译程序第三步：运行程序
05

我的程序运行结果与我想象的不同！如果你的第一反应是"printf这个函数（或者gcc或者其他的库什么的）有问题！"，那么我想你是个自恋狂，记住，整个系统中唯一没有经过测试的就是你的代码，任何东西都是没有问题的，除了你的代码。（当然gcc也可能有问题，但是被你遇到的几率可以暂时看作是0）我们有两种方式来解决这个问题：第一种方式是使用printf函数在可能出问题的地方输出相关变量，好处是可以快速的上手，不需要其他的知识。坏处是如果你没有足够的技巧，你有可能忘记删除这些函数，以及在程序比较大的时候每次增加了新的printf都要重新编译，太浪费时间。第二种方式是使用调试器，比如gdb。但是gdb就象你知道的其他大部分调试器一样，是符号调试器，他们依赖于编译器产生的符号表。符号表通常可以通过给编译器指定-g参数来生成。如果没有符号表，gdb很难使用（仍然可以使用，如果你熟悉汇编语言的话）。
06

Core dump! 你的程序现在已经很复杂了，在你增加了某一个十分强劲的功能后，一执行，屏幕上出现一行小字： Segmentation fault(core dump) 然后一切就都安静了下来。可以说太糟糕了，unix所能提供的最坏的界面都让你遇到了。怎么办呢？如果你记得了在编译程序的时候使用-g参数，那么现在它就派上了用场。你可以： gdb a.out core 然后你就可以通过gdb的where命令查看问题出在了什么地方。 segmentation fault的意思是段违例，一般由于你的程序越界写造成。例如你的数组长度是8，但是你企图向相当于第10个元素的位置写入数据，就可能会产生这个问题。core dump产生的原因不止是segment fault，还有可能是其他的，总之是因为有坏人向你的程序发送了一个不可捕获的信号。如果这句话的意思你不明白，没有关系，也不需要明白，那是以后的事。
07

printf的头文件在哪里？你在星巴克里跟女朋友聊天并同时向邻座的单身女孩抛媚眼的时候，脑子里还在想一个想了很长时间但是一直没有答案的问题，到底如何向屏幕输出一行文字呢？这时候，两个笨蛋从你旁边经过，他们正在讨论printf，你听到后，觉得：哦，这才是我想要的，对printf，没错。但是你那如编译器一般的大脑马上提醒你，找不到函数原型，应该包含什么头文件呢？于是你停止聊天和抛接媚眼，打开手提电脑，通过某种无线装置接入到internet，在bbs上发了一个帖子： where the printf() is defined? 但是出乎你的意料，尽管这是一个刚果人都经常光顾的bbs，但是居然过去了5分钟之后，仍然没有人回答你。看来这个问题偏难，你微笑着对你的女朋友说。事实上，你不应该问这样的问题。你应该学会自己解决这样的问题，我提供给你几个途径： main printf(如果该关键字有多个entry，则应该用man -a或者man -k，或者直接指定section） find /usr/include -name "*.h" -print | xargs grep printf search on Google
08

我已经有多个.c 文件了，应该如何编译呢？经过一段时间的开发，你的程序目前已经从一个简单的foo.c变成了两个文件，foo.c和bar.c，我们假定foo.c中定义了main函数。那么： gcc -g bar.c 将报告你没有main函数。这让你很恼火，是否应该合并两个文件呢？还是...？正确的做法是编译时刻增加一个“只编译”的参数-c： gcc -g -c bar.c gcc -g -c foo.c gcc -o a.out foo.o bar.o 这样之后，你的程序可以运行了。我们在前面提到三个步骤，编辑，编译，运行。但实际上，我们忽略了一个重要的步骤就是连接，我们前面的例子中，编译和连接都是一步完成的（不指定-c 的话），因此我们没有提起。但是你大概会问，连接不应该是用ld么？为什么在这里用gcc完成了呢？ld当然是可以完成任务的，但是它并不知道我们在写一个c程序，c程序的main函数是由_start()函数调用的，而start函数是在runtime目标文件中(通常叫做xxcrt.o)实现的，任何c程序都必须连接这个runtime目标文件。如果用ld作为连接器，我们不得不自己指定这个目标文件的位置以及文件名。但是，如果用gcc，则方便的多，它知道我们要额外连接那些东西，它提供给我们一个更简单的使用界面，尽管它仍然是通过调用ld来工作的。
09

Why a.out? 迄今为止，你发现你的执行程序一直叫a.out，这个名字很古怪，也很土，你说呢？如果你想改变一下你的程序名字，应该： gcc -o win.exe foo.c bar.c 这样，你的程序就叫做win.exe，而不是a.out了。 a.out这个名字的起源估计是某人的一时冲动，例如我小时侯经常把程序中的变量依次称为aint, bint...(绝对的坏习惯，这里先不说这个)。但是后来执行文件因此得名，甚至执行文件的格式也因此得名（早期的unix执行文件格式称为a.out格式，当然现在已经进化为ELF了）。
10

如何生成动态库和静态库？静态库是一个目标文件的简单集合。由ar(archive，归档的意思)生成。 ar -cr libfoo.a foo.o bar.o 通常命名方式是libxxx.a，但是你不遵守也没有太大的问题。应用程序在使用你的库的时候，通常只需要告诉ld你的库名字即可，这个名字就是libxxx.a中的xxx，例如ld -lfoo。意思是告诉ld，连接一个名字为libfoo.a或者libfoo.so的库。如果你的库名字不遵循libxxx.a的格式，ld就找不到，给应用开发造成麻烦。另外，静态的意思是每个用到该库的应用程序都拥有一份自己的库拷贝，应用程序运行的时候，即使将库删除也没有问题因为应用程序自己已经有了自己的拷贝。动态库结构复杂一些，通常是一个ELF格式的文件。可以有三种方法生成： ld -G gcc -share libtool 用ld最复杂，用gcc -share就简单的多，但是-share并非在任何平台都可以使用。GNU提供了一个更好的工具libtool，专门用来在各种平台上生成各种库。动态库实际上应该叫做共享库，只是很多人从windows的Dynamic Linked Library这个词学习过来，把unix的共享库称做动态库。所有应用程序共享一份库拷贝，所以，即使连接完了，也不能将其删除。而且需要在LD_LIBRARY_PATH这个环境变量中正确的设置库所在的位置，否则程序运行会报告找不到这个库。
11

我有了10个.c文件，还是一个一个编译么？有没有工程的概念（就象vc的dsp）？确实一个一个编译很土。我们有更好的办法，就是make。make程序是一个类似脚本执行程序一样的东西。它根据你提供的Makefile(或者小写的makefile）来工作，它可以处理复杂的依赖关系，就象你希望的那样，如果修改了一个头文件，那么包含它的所有.c程序都应该被重新编译。但是很不幸，这种依赖关系需要你自己指定。你首先要了解makefile的语法，然后根据语法来写makefile。当程序很多得时候，makefile也变得复杂。如果你希望得到makefile得更详细信息，可以man make或者在linux里面： info make 但是没有更简单的办法么？好在世界上除了你我之外还有很多人注意到了这个问题。目前有两个简单的办法： imake，imake是依赖已经建立好得一个库信息数据库，可以帮助你完成连接遇到的问题，尤其是写X Window程序，很多人用imake automake/autoconf，这两个程序更加完善和简单。但是使用稍微复杂一些，你需要看更多的手册才能掌握，但是非常好用，简单到如果你增加了一个.c文件，只需要在Makefile.am中增加一个文件名即可，头文件的依赖完全自动生成。这两个简单的办法已经超过了新手可以接受的范围，如果你确实是新手，还是学着自己写makefile好一些。
12

我要学习linux kernel的源代码，遇到了一些问题，能告诉我怎么办么？如果前面的问题有你不清楚的，我建议你还是找一本浅显一些的教材，然后敲些例子程序来学习。现在大家的趋势好象是言必称kernel，好象不太对劲。学习的对象如果不适合自己的层次，只能导致进度减慢。
13

printf()这个函数如何使用？这个问题好象与前面的问题类似，但是因为太多人问类似的问题，所以只好单独列出来了。你不应该问这样的问题，你应该首先想到的是man，这个伟大的助手。 man printf 当然，不同的OS，能够提供给你的man略有不同，例如man的参数等等。所以当你接触到一个新的unix变种的时候，有必要先： man man 这样可以知道man应该如何使用。另外，当man解决不了你的问题的时候，最好的办法是自己写一个测试程序，在自己的$HOME中保持一个test目录是我的习惯，遇到任何不能肯定的问题，都可以在这里先实验一番。这些办法都比到bbs上去提问高效。
14

Windows vs Linux? 这里扯出这个问题好象有些奇怪。这个文档主要是以linux为背景讲的，因此很少涉及到Windows平台下面的东西。但是这不等于说Windows不好，只是顾及了我自己的一些偏好。开始学习的初期，这些因素的影响不大，不用加入到孰优孰劣的无聊争论中。
15

我要学习C++，需要C语言的知识么？ C++和C这两种语言的关系在The C++ Programming Language这本书的1.6节讲的已经很清楚了，如果你有什么疑问，可以仔细读一读。应该可以不需要C语言的知识就可以开始学习C++，但是有些C的基本常识，再学习C++，肯定是有帮助的。
16

哪些东西应该放进头文件中，哪些不应该？头文件相当于一个模块接口的描述，应该尽可能的简单明了。我们可以根据下面的公式来判断哪些东西应该进入头文件，哪些只要在源程序中声明就可以了：这个结构是否会在其它源程序中被使用？ yes 进入头文件 no 不进入头文件实际上，还会有一些被“株连”的结构啊，宏啊什么的被编译器要求放进头文件。例如： struct A { struct B b; // 用到了另外一个结构 int c; }; 这就是我所谓的“株连”。但是这里有点儿小技巧，比如struct B事关国家安全，绝对不能让别人知道它的结构，因此不能将其放进头文件中。这时候可以采用下面的方法： struct B; // 告诉编译器在某处声明了一个struct B struct A { struct B * b; // 变成指针 int c; }; 通过这种方法，你就可以将struct B的声明移到某个.c文件中，从而达到了隐藏信息的目的。
17

宏是什么，预处理是什么意思？你经常遇到一些#define之类的东西，这些东西是干什么用的？有什么作用？有人告诉你说这些叫做宏(macro)，你对这个单词的中文和英文都很不能接受，甚至如果你看一些台湾的资料，把这些东西叫做“巨集”，这就更让你摸不到头脑了。这不奇怪，因为这实在是C语言当初从那些低级语言演变过来的过程中遗留的产物，现在时髦的语言比如VB,Java中都不存在了。你可以这么理解，如果你不想在程序中重复的书写同一段代码，例如，你的程序中有一个结构，还有很多地方都需要对这个结构赋值，每次你都要写十几行同样的代码给它的每个成员一个初始值，很快你就感到厌烦了。你很想简单一些，可是不知道怎么办，这时候宏可以帮助你。你可以声明一个宏，在这个宏中，对结构的每个成员赋值。然后在每次真的想赋值的时候，写一行代码就完成了。别急，别急，我知道你想说什么，你想说其实你有自己的办法，写一个函数不就可以了么？一样每次赋值只需要一行代码。你说的没错，这两种办法都可以，但是有一些区别。这种区别只有在编译后的汇编代码中你才能发现。为了避免你让我举出汇编代码的例子，我决定利用一下编译器。假设你有下面的程序： #define setValue(x) x.a = 10; x.b=5; x.c=1; struct S { int a; int b; int c; }; int main() { struct S s; setValue(s); return 0; } 该程序名为test.c。下面，我们执行： gcc -E test.c -o test.txt 看看我们得到了什么？一个名字为test.txt的文件，这个文件的内容如下： struct S { int a; int b; int c; }; int main() { struct S s; s.a = 10; s.b=5; s.c=1;; return 0; } 首先要解释一下，gcc -E的含义，-E这个参数表示要求gcc在进行预处理之后就停止，不要继续工作下去了，先休息休息。
18

内存的分配和释放（静态，动态）这是一个持久的话题，没有新手不在这上面绊蒜（栽跟头）的。很多老手常常在这个问题上告诫新手，这方面的问题以前也经常出现在面试的题目中，搞得十分神秘。其实，你只要记得一句话，释放自己分配的内存。一切问题都可以应付，相信我，就这么简单，当然，如果你没记住，也没什么大不了的如何理解呢？执行一次动态内存分配，就应该记得执行一次内存的释放。例如一个malloc对应一个free，一个new对应一个delete。就这么简单。可为什么说记不住也没什么大不了呢？我说的是，在某些情况下，你忘记了这个一一对应的关系对程序也没什么影响，如果你不是在写一个daemon的话。进程终止后，自然一切进程空间内的东西都化为乌有，你忘记了释放又有什么关系呢？（尽管这样，我仍然建议你严格遵守前面的原则，我说没什么大不了的，只是为了澄清一点概念）但是实际情况要复杂的多，例如：任何时候，如果你需要一个内存块来做点儿什么的话，那么只有两个来源，堆和栈。它们有什么区别呢？其实非常简单，栈上的内存空间是在编译时刻由编译器划出来的，编译之后就已经确定了相对的地址，只要一运行，即使你什么都不作，它也立刻就存在了。堆上的内存空间则需要你的程序“动态”的，也就是在运行时刻，通知操作系统，由操作系统来完成分配，而在这之前，是不存在的。因此我们可以这么认为，栈上的内存不需要你释放，堆上的内存必须由你释放。你使用了asctime这个函数，你发现它给你返回了一个字符串，这个字符串使用的空间是从哪里来的？是否要你释放一下呢？答案是不需要，C库中尽量避免了这种情况，就是返回给你一个动态分配的内存块，然后需要你自己来释放。它通常的策略是返回给你一个静态变量。如果你对这种方式不满（例如，你在写一个多线程的程序），你可以使用以_r结尾的相应函数代替。_r结尾的函数给了你更多的自主，你需要自己先搞到一块内存（堆上的或者栈上的），然后将这个内存块地址告诉它。因此，_r结尾的函数都是线程安全的，也全部比对应的函数多一个参数。通过使用_r结尾的函数，你就可以坚定的贯彻“释放自己分配的内存”这个原则了。类似char * s = "this is a string";这样的语句，s这个指针指向的内存是否需要释放呢？答案还是不需要。"this is a string"所需要的内存在程序被编译的时候就已经确定下来了，在栈上分配。我们怎么判断这一点呢？好在linux给我们提供了足够的工具，我们可以用size这个程序来观察程序的代码(text)段。通过将这个字符串变长或者变短，我们会发现text段的长度也随之变化。而动态分配的内存大小对代码段的大小是没有影响的。这个内存块不是你分配的，所以你不要释放。你已经使用free释放了一块内存，但是随后你发现如果你引用这块内存，还是可以得到与原来一样的内容。这也不奇怪，free只处理一个内存块的索引表，并不处理内存块中的内容。它在内存块的索引表中标识出这块内存处在free的状态，然后就返回。很多超级新手认为free会将内存块清0(或者其它的什么值)，这是幻想。同样的道理，如果你在函数中返回栈上的一个内存块的指针，在函数返回后仍然可以得到与在函数中一样的内容。这也是因为函数返回的时候，只是更改了栈指针，并没有人去管栈内的内容。当然前提是该函数返回后没有进行其它的函数调用，这样栈内内容就可以保持不变。但是一旦发生了函数调用，栈指针又向下压，栈内的内容就可能改变了。因此，绝对不能返回栈上的内存块指针，即使有的时候看上去很正确。
19

linux编译的程序能不能在sun上跑？如果你没有这样的例子，可以参照： #include <stdio.h>; int main() { printf("hello world\n"); return 0; }

超级新手问答（C/C++ Newbie's FAQ)

步骤/方法

相关推荐