廣義后綴自動機(jī)的前置知識點(diǎn)是后綴自動機(jī)和字典樹(Trie樹)的相關(guān)內(nèi)容,因?yàn)檫@兩個知識點(diǎn)穿插在一起更容易理解和構(gòu)建知識框架。
當(dāng)我們的是動機(jī)如何儲存一個字符串的所有子串?該怎么辦?怎么做?后綴自動機(jī)的作用就展現(xiàn)出來了。
首先,后綴自動機(jī)起源于劉研繹在其 2015 國家隊(duì)論文《后綴自動機(jī)在字典樹上的拓展》上提出的一種結(jié)構(gòu),即將后綴自動機(jī)直接建立在字典樹上。
廣義SAM是一種用于維護(hù)Trie的子串信息的SAM的簡單變體。將多個模式串插入到Trie后,即可使用廣義SAM維護(hù)多模式串的信息。這是廣義SAM最廣泛的應(yīng)用之一,其基本思想是將多串的信息進(jìn)行壓縮,使得SAM在仍滿足節(jié)點(diǎn)數(shù)最少的同時 包含所有子串的信息。此時SAM中的一個狀態(tài)可能同時代表多個串中相應(yīng)的子串。
一種顯然的做法是先使用多個模式串構(gòu)造Trie樹,再在Trie上構(gòu)建SAM。
常見的偽廣義后綴自動機(jī):
(1)通過用特殊符號將多個串直接連接后,再建立 SAM;
(2)對每個串,重復(fù)在同一個 SAM 上進(jìn)行建立,每次建立前,將last指針置零。
方法1和方法2的實(shí)現(xiàn)方式簡單,而且在面對題目時通??梢赃_(dá)到和廣義后綴自動機(jī)一樣的正確性。所以在網(wǎng)絡(luò)上很多人會選擇此類寫法,例如在后綴自動機(jī)一文中最后一個應(yīng)用,便使用了方法1 。
但是無論方法1還是方法2,其時間復(fù)雜度較為危險。
字典樹的使用也是尤為需要注意的一點(diǎn),首先應(yīng)對多個串創(chuàng)建一棵字典樹,這不是什么難事,如果你已經(jīng)掌握了前置知識的前提下,可以很快的建立完畢。這里為了統(tǒng)一上下文的代碼,給出一個可能的字典樹代碼。
后綴自動機(jī)的建立:如果我們把這樣一棵樹直接認(rèn)為是一個后綴自動機(jī),則我們可以得到如下結(jié)論:
對于節(jié)點(diǎn)i,其 len[i] 和它在字典樹中的深度相同
如果我們對字典樹進(jìn)行拓?fù)渑判?,我們可以得到一串根?jù) len 不遞減的序列。BFS的結(jié)果相同。
C語言網(wǎng)提供由在職研發(fā)工程師或ACM藍(lán)橋杯競賽優(yōu)秀選手錄制的視頻教程,并配有習(xí)題和答疑,點(diǎn)擊了解:
一點(diǎn)編程也不會寫的:零基礎(chǔ)C語言學(xué)練課程
解決困擾你多年的C語言疑難雜癥特性的C語言進(jìn)階課程
從零到寫出一個爬蟲的Python編程課程
只會語法寫不出代碼?手把手帶你寫100個編程真題的編程百練課程
信息學(xué)奧賽或C++選手的 必學(xué)C++課程
藍(lán)橋杯ACM、信息學(xué)奧賽的必學(xué)課程:算法競賽課入門課程
手把手講解近五年真題的藍(lán)橋杯輔導(dǎo)課程