-1

抱歉问一个很基础的问题。
昨天做笔试题,其中有一道问“以下哪些属于segmentfault?”,没有能答上来……

想整理一下相关的知识点,发现搜索segmentfault就全都是这个论坛的信息,所以想请问一下大家:
1.segmentfault是什么方面的概念?这是linux下会出现的错误吗,还是C++特有的,或者各种语言都存在段错误?看什么书有相关的知识呢?
2.除了segmentfault还有哪些fault?

希望各位大神解答下了,非常感谢!

2018-04-11 提问

1 个回答

0

Update1

注意, 因爲窩太垃圾了, 以下答案很有可能存在不嚴謹, 甚至錯誤的部分, 窩也在不斷的修訂. 所以, 想踩的話請隨意, 但是窩不太想刪, 刪了話自己可能沒有動力總結了, 好吧, 窩的確很自私. 但是窩相信終有一天這個答案會self-contained並且邏輯不再混亂.

Update2

I don't have Chinese input method editor, so I will write in English(but too lazy to translate the original contexts into English, So previous Chinese wording preserved)

很不幸, 之所以你搜segmentfault都是這個論壇, 有兩個原因,

  1. 因爲這個網站的域名就是segmentfault.com.
  2. 是因爲你搜索的姿勢不對, 它不是一個單詞...而是一個詞組: segment fault. 當然, 也有縮寫: segfault, 或者Segmentation-fault.

1.1. segment fault既不是linux特有的, 也不是c++特有的, 甚至從語言規範中, 它不屬於c++, 因爲c++的標準文檔中沒有對Segmentation fault沒有過定義. 喂雞百科中它被定義爲:

In computing, a segmentation fault (often shortened to segfault) or access violation is a fault, or failure condition, raised by hardware with memory protection, notifying an operating system (OS) the software has attempted to access a restricted area of memory (a memory access violation).

長話短說, 就是軟件訪問了不該訪問的memory, 而硬件具有內存保護功能. 具體的說, 就是當MMU檢測到非法內存被訪問了, 那麼它就讓CPU產生一個exception.

1.2. c或者c++這種既接近底層, 又古老的語言會引起段錯誤.
1.3. 書沒什麼好推薦的, 畢竟這玩意一般第一天寫c/c++就會碰到...碰到多了自然知道了, 非要推薦的話去看些操作系統之類的書(CSAPP, OSTEP, etc)會有比較深刻的認知吧,比如trap. 不過也別迷信讀書, 畢竟現在互聯網這麼發達. 你把英文喂雞上的關於它的內容看一邊也差不多了.

2.1. bus error, stack overflow(更新: 有一種說法是stack overflow本身不是錯誤(error/fault), 但是它的存在會觸發其它錯誤(error/fault), 其中之一就是Segmentation fault, 因爲call stack溢出後, 程序有可能對非法地址進些讀寫操作. ......好多好多呢, 你去這個列表看下,
2.2. 至於Segmentationfault這倆詞語, 我們從操作系統講起:

假想下你的操作系統就是一個巨大的庫, 所有操作(包括應用軟件)都只要調用這個庫(的API)就行了, 沒有任何權限限制, 這其實就是早期操作系統的設計形態, 後來人們逐漸意識到這麼做是不安全的, 放到今天應該會很容易明白, 比如你肯定不希望手機流氓軟件(應用軟件)訪問你在磁盤上的個人信息吧, 但是我們依然要確保操作系統有權限訪問, 所以我們需要一場革命, 帶來一個新的內存保護機制, 或者說是一個新的文件系統, 當然, 這個文件系統肯定不能作爲一個庫, 不然還是什麼都沒有改變, 最終, 這個革命者名爲system call, 其實現是通過硬件(CPU的trap)指令, 伴隨它的還有user mode, kernel mode(這兩個mode是針對CPU的, 比如, CPU可以用一個bit來表徵, 0代表kernel mode, 1代表kernel mode等. 具體的做法就是system call賦予操作系統更高的硬件優先級. 應用軟件處於user mode, 不能進行讀寫磁盤/物理內存等操作, 它將某些數值放在寄存器或棧幀, 表示自己希望從操作系統處得到那些東西, 然後應用軟件調用trap)指令, 即執行system call, 此時CPU轉換爲kernel mode, 並且跳轉到一些指令處, 這些指令是屬於操作系統的, 他們會聆聽(通過之前的寄存器或者棧幀)應用軟件, 然後也切換到kernel mode, 執行這些請求.

However, how can we separate user mode from kernel mode? Two approaches:

  1. Protection ring
  2. Have a single address space for all software, and rely on the programming language's virtual machine to make sure that arbitrary memory cannot be accessed – applications simply cannot acquire any references to the objects that they are not allowed to access

好, 爲了鞏固記憶, 接下來我們換一種問法, 什麼情況下system call會被執行呢?
答案還是trap)(需要注意的是此處的trap)不同於上面的trap)指令, 是兩回事, 這裏的trap)是一個泛指, 是interrupt的子集, 特指非硬件層面的interrupt). 經常, trap)也可以用其同義詞--falut或者exception來代替. 有些地方會將這些分開, 比如如果你關注國外各個大學的操作系統(設計(與實現)的課的話, 會發現他們往往會對其定義有差別, 比如由硬件還是軟件觸發之類, 具體如fault有時會特指page fault, 再比如Intel microprocessor manuals裏將synchronous interrupts定義爲exceptions, asynchronous interrupts 定義爲interrupts, 但是很多時候大家對其區分不是很嚴格, 經常一個interrupt signal就包括前面倆貨了, 不過這個實現都是平臺相關的, 可能別的體系就有另一套說辭, 或者能更一步細化, 比如在古老的Linux/i386中, 其實現就是interrupt 0x80

說完fault, 我們再回到Segmentation, 其實它就是一段內存, 但是帶有一個值來標記內存, 並且還包含偏移量, 當然也分爲物理內存和虛擬內存, 這裏只說虛擬內存, 因爲你編寫的c/c++程序用到的都是虛擬內存而不是物理內存. Segmentation fault]合在一起就是一個trap/exception/fault/software interrupt, 因爲它訪問了不該訪問的內存.

推广链接