向山大概聽明白了。
或者說,唯一讓向山懵逼了一瞬間的,也就是英格麗德舉出的那個(gè)例子。
他沒想到會(huì)在這種場合聽到這種……奇怪的例子。
但是,除此之外,好像並沒有什麼更有價(jià)值的東西。
隻能說,任何專業(yè)人士,在超出自己專業(yè)領(lǐng)域之後,就不比一般人更加智慧吧。
雖然在英格麗德眼中,這些外星人的書寫方式有趣極了,但歸根結(jié)底,這就是一種壓縮算法。
而這無法解釋向山現(xiàn)在在琢磨的問題。
“所有外星機(jī)械的設(shè)計(jì)圖紙、裝配工藝、材料製造的參數(shù),再加上它們自身運(yùn)行的ai,加在一塊,是如何壓縮到兩三百mb這個(gè)水平的”。
外星人使用了兩種壓縮算法。
一種大致可以稱作“字典算法”,即“將高頻出現(xiàn)的排列組合用,做成對(duì)應(yīng)字典,然後用字典內(nèi)編號(hào)代碼來替代該組合”。這種手段人類也在使用。當(dāng)然,如果“字典”做得很大,那麼數(shù)據(jù)本體就可以壓縮得很小。但有些時(shí)候,又會(huì)形成“字典比數(shù)據(jù)本體還要大”的情況。
外星人大概是選擇了一個(gè)恰好的數(shù)值,保證“本體+字典”的大小最小。
另外就是英格麗德所說的這種二維的符號(hào)矩陣。
但不管怎麼樣,信息的無損壓縮一定是有極限的。
而這種二維矩陣的算法,不管外星人將讀取規(guī)則設(shè)計(jì)得怎樣花裏胡哨,它都存在一個(gè)“上限”的。
就如英嘉所說,如果多增加一個(gè)“下一個(gè)終止/方向符號(hào)無效”的符號(hào),固然可以增加讀取路線的數(shù)量,但是卻會(huì)導(dǎo)致符號(hào)之中混入大量除了表示“下一個(gè)終止/方向符號(hào)無效”之外沒有其他任何意義的符號(hào),“字典”的集合之中也要增加項(xiàng)目。
“讀取路線”的增加,會(huì)導(dǎo)致“摻雜過多隻與讀取規(guī)則有關(guān)的符號(hào)”以及“字典”的膨脹。
同字典算法一樣,到最後,同樣也會(huì)出現(xiàn)“讀取規(guī)則”大小大於數(shù)據(jù)本體大小的問題。
這裏麵同樣存在一個(gè)平衡點(diǎn)。
按照向山估計(jì),關(guān)於讀取規(guī)則的符號(hào)可能也就那麼幾個(gè),不會(huì)太多。
而二維的符號(hào)矩陣也存在另一個(gè)問題。就好像“填字遊戲”一樣,一個(gè)空間坐標(biāo)上的符號(hào),要受到來自四個(gè)方向內(nèi)容的製約。這反而使得信息的表達(dá)不像一維的文字那樣自由。
“就用你舉的例子來說吧……”向山是如此說的:“雖然那個(gè)古代詩人在八百四十字裏麵壓縮了七千九百五十八首詩,但是我敢肯定,這七千九百、將盡八千首的詩,單獨(dú)拆出來的話,沒有一首可以流傳千古吧,說不定還存在那個(gè)什麼……格律啊韻腳不那麼工整的情況。”
英格麗德有些好奇:“你看上去好像是剛剛才知道這玩意的……”
“如果那個(gè)文字遊戲裏麵拆出來的詩足夠優(yōu)秀的話,肯定會(huì)上課本。那我肯定會(huì)有印象。”向山在這一點(diǎn)上倒是非常確信:“仔細(xì)一想,古代多半沒有標(biāo)點(diǎn)符號(hào),斷句也得後人來猜……”
英格麗德捂臉:“我猜你想說‘句讀’。”
向山無視了英格麗德的提示:“你看,從這一點(diǎn)來看,這種文字遊戲,對(duì)信息的壓縮,損失很大,效率也就那樣。它甚至不是‘壓縮任意八千首詩’,以壓縮算法的標(biāo)注來看……嘶……”
向山好像意識(shí)到了什麼……
——不是“壓縮了任意八千首”……不一定是壓縮……
——什麼……
向山似乎是想到了什麼。但是那個(gè)“什麼”的靈感與他一直以來的思維有衝突。這來之不易的點(diǎn)子就這麼從向山意識(shí)間滑落,消失不見。
向山站起來,撓了撓頭:“我要說什麼來著……”
英格麗德坐在凳子上,抬頭看著突然發(fā)神經(jīng)的朋友:“那個(gè)……‘以壓縮算法的標(biāo)注來看’?”
“以壓縮算法的標(biāo)準(zhǔn)來看,這玩意沒什麼了不得的……”向山繼續(xù)思索道:“不怕失真的信息……為什麼呢……”
不……
應(yīng)該說,這信息絕對(duì)不是“不怕失真”的。
不然的話,外星人完全可以使用信息密度更高的存儲(chǔ)方式,而不是這種符號(hào)石板。
使用這種符號(hào)石板,就意味著那些外星人也非常懼怕意外導(dǎo)致的噪音。他們選擇了抗噪性極強(qiáng)而信息密度不高的手段。
抗噪性、信息密度、“字典”與“讀取順序規(guī)則”與“壓縮率”,以及壓縮過程中可能丟失的信息……
“還是想不明白啊……”向山低聲說道。
實(shí)際上,這個(gè)問題幾乎困擾了所有留在羅摩項(xiàng)目的人員。
這方麵的進(jìn)展幾乎停滯了。
好在“研究外星遺產(chǎn)”是一個(gè)巨大的項(xiàng)目,可以分割為很多的子項(xiàng)目,這方麵進(jìn)度不佳,不影響其他方麵取得進(jìn)展。
比如,來自歐洲的研究者們就根據(jù)記錄下來的“報(bào)廢機(jī)器人最後的位置”,推測“奧貢”在地球降落時(shí)所經(jīng)曆的事情。
根據(jù)模擬計(jì)算,這些機(jī)器是在很早的時(shí)候就已經(jīng)盡數(shù)報(bào)廢了。但與此同時(shí),奧貢的發(fā)動(dòng)機(jī)早就停止工作,整體幾乎沒有加速度,所以這些報(bào)廢的機(jī)器人就在失重狀態(tài)下,集中趴在奧貢的後半段,隨著這件的流逝而發(fā)生微弱的劣化。
最後,這些報(bào)廢的機(jī)器人才在人工加速與減速之中激烈碰撞。
換言之,這些報(bào)廢的機(jī)器人原本就集中在奧貢靠近發(fā)動(dòng)機(jī)的一側(cè)。
它們很有可能是按照程序報(bào)廢的。
但是這又引出了一個(gè)全新的問題。
“這些機(jī)器人為什麼會(huì)停擺?”
奧貢內(nèi)還有許多原材料。而這些機(jī)器人也大量使用了迴收成本很低的合金。盡可能統(tǒng)一的材質(zhì)也是為了降低迴收難度。因此,這個(gè)“一代複製一代”的輪迴,應(yīng)該還沒有到斷絕的時(shí)候。
甚至就連奧貢內(nèi)存儲(chǔ)的裂變?nèi)剂隙紱]有消耗完。
這個(gè)循環(huán)過程,沒有達(dá)到它的理論極限。
它一定是出了什麼問題。
但另一方麵,人類又沒有找到可以證明“故障”的痕跡。
或許證據(jù)已經(jīng)在落地過程中消失了。
又或者,停擺的形式有些超乎想象?