頭上懸著三把劍:
如何逆轉非編碼區(qū)基因突變進程?
腺病毒如何通過影響非編碼RNA影響植物?
倒計時2548天。
每當看到著四行字時,盧赫都覺得真的有一個大寶劍虛貼在自己的后腦勺上,好像下一秒就要被破瓢。
頭痛。
不過并不是每一個人都像他一樣痛苦。因為倒計時的盡頭是什么,只有少數(shù)人知曉。
事實上,也就是像他一樣的小年輕才會糾結為什么會從13年縮水到7年?;爝^職場的老油條對此都是見怪不怪的:
拖延癥是打工人的專屬,領導們一般都有強迫癥和妄想癥。因為他們總是恨不得項目一申下來,立刻就給做完。
所以重要的時間節(jié)點,一般都會往前定,給出一定的余量與緩沖。對于這種關乎人類存亡的事情,余量6年更是無可厚非。
至于7年的真正緣由誰知道誰不知道,分辨起來也很簡單。
只要搬把椅子坐到門口,翹著二郎腿,心不在焉地掃一眼來人的表情,便可輕易知曉:
剛被奇奇怪怪的早餐摧殘過,神情呆滯地直視一眼橫幅便一股腦往里沖的,大概率是不知道的。
本來腳步輕快,卻在看到橫幅后停頓一下,然后開始皺眉的,大概率是知道的。
雖然這個鑒別同胞的想法在盧赫腦中存在很久了,但他從未真正實踐過。
因為研究的推進比他想象得要快,短短幾天內,基于海晝天基因組的數(shù)據(jù)集已經(jīng)建好了,他們可以開始煉丹了。
之所以稱之為煉丹,是因為機器學習模型的訓練過程,受到超參數(shù)的影響。
所謂超參數(shù)就是人為預先設定的參數(shù),設得好,模型訓練得就快;設得不好,模型可能壓根就不收斂。
至于什么是好,什么是不好,只有全知全能老天爺才能知道。
天心最難揣度。
說到底,除了扎實的基礎和豐富的經(jīng)驗以外,想要快速訓練出一個能用的模型、煉出一個能不把人吃死的丹藥,運氣最重要。
而煉丹是要時間的,七七四十九天之后,如果這丹藥不能用,那么這時間就被完全浪費掉了。
所以,他跟著那幫專業(yè)煉丹的人開了大半天的會,討論了怎樣分配有限的煉丹爐。
雖然他聽不懂那些高深的特征增廣、小樣本學習、時間序列預測、給數(shù)據(jù)驅動模型添加物理約束等理論。但作為一個通識課上學了9個學時,就被要求一個暑假里手擼一個圖像識別算法的高材生,他有他自己的想法。
他要用強化學習。
“對于強化學習而言,我們的樣本太少了?!蹦睦锒家獡揭荒_的鄭K一如既往地苦著臉說。
“少就少唄,又不是不能用。再說了,我們不是正在用老鼠造模嗎?造完了樣本就多了?!北R赫不以為然。
“具體思路呢?”鄭K憂心忡忡地問。
“跟你們一樣。特征是某時間點的基因組,標簽是未來的突變位點,然后讓單堿基編輯的載著相應向導RNA的CRISPR系統(tǒng)在那里等著,一旦突變了,就立刻給修復。把病扼殺在搖籃里。
非要說有什么不同,第一,我這是黑箱,只能發(fā)揮作用,卻不知道怎么發(fā)揮作用;第二,我這基本算是端到端的、全自動的,人工干預只在定期查基因組和設計CRISPR系統(tǒng),這部分工作未來也有希望自動化。
功過相抵,中規(guī)中矩?!?p> 散會后,盧赫坐到電腦跟前,摩拳擦掌。
雖然不是專業(yè)人士,但一直跟進這方面進展的他,始終覺得那些在數(shù)年間如雨后春筍般涌現(xiàn)出來的大幾十種方法里,強化學習最有前途。
因為這是最接近人類本能學習方式的一種。
它的原理也很簡單,就是讓懵懂的小人工智障在環(huán)境里學習,它的每個動作都對應一個獎勵或者懲罰。
就像還在蹣跚學步的小時候的我們一樣,我們看到了火,好奇心趨勢我們走近,我們感受到了溫暖,獎勵加一;手賤去摸了一下被燙到,懲罰加一。
于是,聰明的我們就會知道,火很暖和但不能靠得太近。
只不過與人不同得是,小人工智障無法一次就學會,而是需要大量數(shù)據(jù)去支撐它在環(huán)境里反復探索,直到把自己訓練成人工智能。
如果用玩超級瑪麗來打比方,小人工智障在游戲的第一幀獲得初始狀態(tài);
在此基礎上,我們可以逼迫它往前走一步,不論前方是不是有蘑菇怪。這樣它會主動做出第一個行動。
這時,它所處的環(huán)境發(fā)生了變化,獲得了新的狀態(tài);
同時,根據(jù)它死沒死,環(huán)境會給它一個獎勵或懲罰。
如此循環(huán)下去,便得到了一個由狀態(tài)、行動和獎勵組成的序列。小人工智障的目標就是調整自己的狀態(tài)和行動,以使獎勵的期望值最大。
如果訓練的順利,它便有望進化為一命通關的人工智能外掛。
不同時間點的海晝天的基因組就是環(huán)境,逼迫小人工智障跑到基因組的某一個位置上改一個或多個堿基就是行動,根據(jù)改了以后海晝天得不得病來施加獎勵和懲罰。
如果順利的話,訓練成功的人工智能便可以精準地找到潛在突變區(qū),為CRISPR系統(tǒng)的設計指引方向。
不過,凡事總有意外。
人在制定規(guī)則的時候總有疏漏,可能會讓小人工智障憑借逆天的腦回路鉆空子。因為它們有無限條生命,可以快速試錯。
一些煉丹者寫出的地獄笑話廣為流傳:
一個機械手被要求把木塊挪到桌子的指定地點,小人工智障的解法是挪桌子;
要求物體高速運動,于是小人工智障把自己設計得特別高,依靠不斷跌倒獲得速度;
生物生存需要消耗能量,但是繁育后代不消耗,于是小人工智障演化出來的生活方式就是不斷生育后代,然后把后代吃掉;
要求自動修復文檔,如果輸出的結果和目標文檔的內容一致就被認為是修好了。于是小人工智障把原文檔刪掉了,這樣它的內容為空,然后再輸出一個空的結果就和它一致了。
又或者要求玩俄羅斯方塊不輸,于是小人工智障一直暫停游戲,不贏,但永遠不輸。
。。。。。。
想到這里,他不禁笑出了聲。基于現(xiàn)有數(shù)據(jù)的訓練程序很快就寫好了,他很期待這個漏風的煉丹爐的表現(xiàn)。
步伐輕快地回到住處,他撈起塑料瓶做成的簡易噴壺,給種在臉盆里的干枯冬青木仔仔細細地噴了一圈水,顯得格外悠閑。
煉丹什么的,比得就是心態(tài)。如果爐子爆炸之前自己先不耐煩了,那就是輸了。
七七四十九天而已,搖著扇子窩在一旁等著,時間很快就會過去的。
非奇異矩陣
今天打賞和投票的新老朋友們,給你們鞠躬了┏○。