polyhedron
2.63K subscribers
1.07K photos
15 videos
108 files
344 links
polyhedron 的自媒體備份。有事請聯繫telegram 的 @ngiamzsjit 或進入我的“半地穴式聊天室”留言(當前鏈接 https://t.me/+m22RQOc_uJdhNjE1
Download Telegram
完了,這回我眞看出問題了。還是序列比對,之前有個地方我沒注意,就是S蛋白(spike)中閒有一個內切位置,在病毒進入細胞後,蛋白內切酶把S蛋白切成兩個亞基,在很多冠狀病毒一般是由胰蛋白酶(trypsin)完成的,包括SARS等。

這次問題就是在這個內切位置上了。之前我比對序列的時候,沒有留意這個位置。而這個位置正好是Covid-19和其它所有毒株,包括與其最近的雲南蝙蝠冠狀病毒 RaTG13都不同的(穿山甲在這段和Covid-19更遠),而且這前後的序列相對都比較保守(圖1,第1條序列是Covid-19,第2條是雲南蝙蝠RaTG13,第6條是人SARS)。Covid-19插入了4個氨基酸殘基(PRRA,即脯氨酸-精氨酸-精氨酸-丙氨酸),而前後的序列相比RaTG13都沒有變化。4個殘基就是12個核苷酸鹼基,並不是一種很容易發生的突變。而這一突變正好造成了一個furin內切酶識別位點。

furin是一種蛋白內切酶,識別的蛋白序列爲RXXR(R是精氨酸,X是任一殘基)。PRRA加上後面緊跟着的R正好形成了furin識別位點。我覺得有問題的頭一點是在保守區引入了這樣一個插入,形成了識別位點。(之前我寫過一篇東西,說印度團隊的分析不靠譜,是因爲他們分析說有插入的地方太不保守,不同毒株什麼樣的長度都有。但這次是只有Covid-19與別的株不同。)因爲這個地方正好是切開兩個蛋白亞基,多兩個少兩個殘基一般並不很影響蛋白構象。

再看,這個位點會不會是被人有意引入的呢?結果發現,2009年眞就有人做過實驗了,發在PNAS上,就是把SARS在這個位置的RSTSQ變成了RRSRR,即引入了furin識別位點(原先是胰蛋白酶(trypsin)的識別位點)。結果發現病毒侵染效率提高了(圖2)。

所以,這個地方眞的很像人工設計的了。不過現在還沒有一個除這個位點以外其它部分都特別像Covid-19的母本病毒序列被公佈。

參攷文章:
李鑫 (2020) 武汉2019冠状病毒S蛋白可能存在Furin蛋白酶切位点 http://www.chinaxiv.org/abs/202002.00004
Wong MC (2020) Evidence of recombination in coronaviruses implicating pangolin origins of nCoV-2019 https://www.biorxiv.org/content/10.1101/2020.02.07.939207v1
Belouzard S (2009) Activation of the SARS coronavirus spike protein via sequential proteolytic cleavage at two distinct sites https://www.pnas.org/content/106/14/5871
image_2020-02-15_03-47-22.png
128.5 KB
image_2020-02-15_03-48-34.png
404.6 KB
Wong_MC_2020_Evidence_of_recombination.pdf
910.5 KB
Belouzard_S_2009_Activation_of_the.pdf
594.3 KB
我有了個重大發現:所有本次新冠病毒的共祖可能早在12月之前的數月;在武漢的爆發也許與一個蛋白突變有關。

大概說一下:還是這個网站 http://fight-ncov.genowis.com/nextstrain-ncov?branchLabel=aa&c=country&m=div&p=full ,收集了幾十條新冠病毒的全序。网站把武漢最大的一個星簇作爲最左,同時一般也以爲這個是時閒最早。但以我對Y染色體和線粒體的經驗,最大的擴張處未必是最早的節點。這個其實是棵無根樹。尤其因爲病毒的演化速率會不符合分子鐘假設,而無根樹最早分化的節點(如“Y染色體亞當”和“線粒體夏娃”)需要通過outgroup來定根。現代人的Y染色體和線粒體可以用黑猩猩或尼安德特人來定根,而新冠病毒我自然想到用和其最接近的雲南蝙蝠冠狀病毒RaTG13來定。

結果,我發現最大的那個餅並不是樹根!眞正的樹根其實是在圖1和圖2標紅的位置。有三個突變,C8782T(圖3),T28144C(圖4),C24034T(圖5),RaTG13都是和圖2偏右的樣本一致。說明整個新冠肺炎的始祖是在紅叉處(但截至目前並沒有測到過序列全同的樣本,最少的也是差一步)。而ORF8(某個被翻譯的蛋白)上的T>C突變造成了一個絲氨酸到亮氨酸(Ser > Leu)的殘基改變,有可能是病毒毒力增強的重要位點。同時還說明,武漢有可能不是病毒的原發地,12月之前該病毒在人閒已經傳播數月,只是在武漢因毒力增強爆發纔爲人所知。最接近樹形眞正根部的這些樣本也許能提供病毒最初來源的更多線索。

順道說一下,中南大學的黃石敎授,爲什麼說人類的共祖不在亞洲而是非洲,就是因爲你定根定錯了!
等鑽石公主号上患者的全序出來吧。不知道會不會是單系羣,是根部簇裏的還是武漢爆發簇裏的。

估計人類以前從來沒有這麼詳細硏究過一個物種(雖然病毒不一定該用物種這個詞)的微演化(就是從分子水平的每一個突變來觀察其變化,而非只從宏觀的表型來看)。雖然新冠病毒只有29000多個鹼基長,不到人線粒體長度(約16569 bp)的兩倍,但人線粒體平均3000年一個突變,新冠只要10天左右一個突變,突變速度接近人線粒體的十万倍。這就是爲什麼做動物實驗喜歡用小鼠而非猴子類似,小鼠比猴子傳代快得多,積累數據的速度也快。當然新冠的宿主是人,只能觀察,不可以主動實驗。
Forwarded from cmp0xff
各位,我和一些豆瓣普通網友,最近在翻譯介紹德國媒體中,跟(主要是本地)疫情有關的新聞。成果發表在
t.me/covid19_eu_zh_c

歡迎各位關注跟轉發,也歡迎有語言或技術能力的朋友加入我們!
Marcus JH (2020) Genetic history from the Middle Neolithic to present on the Mediterranean island of Sardinia
撒丁島古DNA文章 https://www.nature.com/articles/s41467-020-14523-6.pdf