新浪微雹不知道是因爲故意想要搞陰謀論,還是人工智障,把我上面那篇文章屏蔽了。在知乎寫的回答也被審覈中。
以上內容發到我在github的雹了。不知道圖片放在新浪能否看到? https://biopolyhedron.github.io/2020/02/01/coronavirus-spike-alignment/
多面體的雹子 polyhedron's blog
武漢冠狀病毒是人工改造插入了HIV片段?
關於說武漢冠狀病毒是非典類似的冠狀病毒加以HIV片段改造的說法,我這裏來給出我的分析。 太長不看:印度團隊的分析有問題,我並不能看出武漢病毒有人爲改造的痕跡。 緣起是印度硏究者1月31号發在bioRxiv上的這篇文章«Uncanny similarity of unique inserts in the 2019-nCoV spike protein to HIV-1 gp120 and Gag»
不好意思,剛纔我說的有問題,原話爲:
但剛又看了一遍以後,好像應該說之前發現的蝙蝠類SARS病毒ZC45和ZXC21是由類武漢肺炎病毒和其它更接近SARS的病毒剪接產生。。。我腦子有點兒亂,歡迎指正。
這篇文章分析發現,武漢肺炎病毒確爲重組(或稱嵌合)產物。其首尾共一半的序列與某種蝙蝠的類SARS病毒(圖B的藍線)較爲接近,而中閒的一半與類SARS病毒差別很大,前、中、後三段構建的演化樹如圖C。
但因2020.01.27由武漢病毒所釋出了據稱於2013年採集的蝙蝠毒株RaTG13(Genbank編号MN996532,圖B的紅線),該序列在病毒全序列上均與武漢肺炎病毒更爲接近,因此認爲該次重組很久之前發生在野外,而非實驗室內剪接而成。
但剛又看了一遍以後,好像應該說之前發現的蝙蝠類SARS病毒ZC45和ZXC21是由類武漢肺炎病毒和其它更接近SARS的病毒剪接產生。。。我腦子有點兒亂,歡迎指正。
※太長不讀:冠狀病毒序列確實存在嵌合現象,但可能並非發生在武漢肺炎的祖先中,而是發生在舟山蝙蝠冠狀病毒的祖先中。進一步排除武漢肺炎病毒爲人工拼接造成的可能。※
今天又讀了幾篇文章,檢査了幾條序列,進一步降低了對【武漢肺炎病毒爲人工編輯形成】的懷疑。之前我寫的反駁印度人的文章(为什么说「新型冠状病毒是人造的」不靠谱?https://www.zhihu.com/question/367703105/answer/994116144 )提到了,【他們提出的懷疑,即spike基因內插入四段HIV序列的說法】不靠譜。但還是需要看更大範圍內是否有嵌合現象(chimera)。
結果確實有幾篇文章報導了幾種冠狀病毒之閒存在嵌合現象,即一個病毒的不同區段的來源不同,或者說用不同的區段畫出的演化樹的樹形不同。人的Y染色體和線粒體就幾乎不會出現這種嵌合情況,比如說一個人的Y染色體一段是從這個爸爸來的,而另一段是從那個爸爸來的。而微生物和病毒中,不同來源的核酸片段重新組合並不罕見。假如出現某個病毒的兩個部分分別明確從兩個已知來源拼接而來,就有說明這個病毒有人工改造而來的可能。
《柳葉刀》雜誌上發表的«Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding»確實表明了武漢肺炎病毒和其樹上最接近的ZC45 (MG772933)和ZXC21 (MG772934)兩條在舟山發現的蝙蝠冠狀病毒序列(以下稱作“舟山蝙蝠冠狀病毒”)在不同區段上顯示的演化關係不同(圖1),即在病毒的前段和後段,武漢肺炎病毒和這兩條序列最近而離SARS序列更遠。但在病毒基因組中段,武漢冠狀病毒距離舟山蝙蝠病毒及SARS一樣遠,亦即舟山蝙蝠病毒和SARS更近,而武漢冠狀病毒比較遠。這樣是否能說明武漢病毒是由一種接近舟山病毒的未知野生病毒,在其中段用某些未知序列替換掉了而製造的呢?
有一篇James Lyons-Weiler的文章 https://jameslyonsweiler.com/2020/01/30/on-the-origins-of-the-2019-ncov-virus-wuhan-china/ 就是這樣懷疑的。其大意也被豆瓣一位网友引述( https://www.douban.com/note/750967797/ )。他比對了武漢病毒和舟山病毒,發現中閒有1378個鹼基的長度是相互對不上的(圖2)。於是,他認爲這1378個鹼基片段是人工替換插入的。其位置是在spike蛋白上。之前Ji et al.的這篇文章 https://onlinelibrary.wiley.com/doi/pdfdirect/10.1002/jmv.25682 也提出spike序列有未知來源,而且這段未知序列從密碼子使用頻率來看可能和蛇有關,並提出武漢病毒可能是類蝙蝠SARS-like序列(即類似舟山蝙蝠序列)與和蛇相關的冠狀病毒序列拼接而來。
上面那篇James Lyons-Weiler的文章又說,這1378鹼基序列最近匹配是在SARS的spike蛋白上,還有一個pShuttle-SN vector (AY862402),但其實這個載體序列就是用SARS做的,和SARS除了尾部幾個鹼基有區別以外,幾乎就是SARS的序列。之所以上面圖2用這1378個鹼基的序列沒有比對到蝙蝠舟山病毒,而圖3匹配到這個人工載體,純粹是因爲人工載體短,從而E值更顯著,而且blast一段,總歸會給一個最優匹配結果,但實際上匹配是很差的,有大量鹼基替換和插入/刪除(圖3)。結果這個作者得出一個可能性,並說這個是most likely。這個我就看不懂了,明明序列區別這麼大。
好在武漢病毒所在GenBank釋出了據稱於2013年在雲南採集的菊頭蝠毒株RaTG13的基因組(Genbank編号MN996532)。對於該序列,希臘團隊Paraskevis et al.於1月27号在bioRxiv上貼出了文章«Full-genome evolutionary analysis of the novel corona virus (2019-nCoV) rejects the hypothesis of emergence as a result of a recent recombination event»。本文圖4,即該文章的Fig. 1證實了和上面柳葉刀相似的情況,即病毒的前+後段,舟山蝙蝠病毒ZC45和ZXC21和武漢病毒更近,而在病毒中段,舟山病毒和SARS更近(舟山病毒和武漢病毒的比較爲B圖的藍線,SARS等病毒和武漢病毒的比較爲下面那一坨線)。而值得注意的是新放出來的雲南蝙蝠病毒RaTG13在病毒的所有區段都和武漢病毒更接近(B圖的紅線)。那麼根據最簡單的解釋,應該是說武漢肺炎病毒+雲南蝙蝠病毒是一支和SARS稍遠的病毒(但仍然比MERS那些近得多),而舟山病毒是由前+後段的類武漢病毒加上中段的類SARS病毒拼接而成的嵌合子,而這個拼接應該是發生在很久以前(兩株舟山病毒的共祖之前),遠非最近幾年的事。而武漢:雲南不同段的相似性大體和武漢:SARS的相似性成比例,符合自然演化的特徵:有些基因如spike(圖A的S)保守性較差,而覆膜蛋白(圖A的E)非常保守。
有人提出的覆膜基因E,即使武漢病毒和SARS也極爲接近,因此說明是由SARS改造的,不過是因爲其高度保守,而且覆膜基因太短了,只有75個殘基,而且太保守,不像spike有1273個殘基,自然E的區別就少了。
而且因爲武漢肺炎病毒和雲南蝙蝠病毒在各處均有或多或少的變異,這一點上很大程度排除了武漢肺炎病毒是人工改造而來的可能。因爲雖然說現在人工有能力製造較長的片段(整個冠狀病毒也就是29855 bp,不到人線粒體長度的兩倍),在這種序列上不需要用各種眞核生物轉基因需要的複雜技術,從頭合成就行,但如果想人工設計這麼一個病毒,還是需要用幾段已知蛋白做拼接的,在整個病毒的所有區段搞出或大或小的各種突變並不是人類設計的風格,用這種設計方法能有功能而且天衣無縫讓人査不出來人工痕跡就更難了。也就是說,就我目前從序列和演化角度看到的所有證據仍都不能支持武漢肺炎病毒是人工設計合成的,在沒有更新的序列證據的情況下(比如發現跟武漢序列差少數但集中的幾段區別的病毒序列),我傾向於武漢肺炎病毒是自然存在並傳給人的。
還有一件事是,很多人說,一個病毒從蝙蝠傳給人,一定要經過中閒宿主。從經驗來說,確實很多病毒有從蝙蝠到人的中閒宿主,但從生物演化角度來說,蝙蝠和很多哺乳動物中閒宿主到人的距離基本是一樣遠的(圖5,上面的框是翼手目,下面的框是靈長目),大概沒有說有中閒一個宿主,傳染就更容易的道理,除非是從接近人的概率來說,我覺得是否存在中閒宿主並不成爲一個是否爲自然傳給人的鐵證。
今天又讀了幾篇文章,檢査了幾條序列,進一步降低了對【武漢肺炎病毒爲人工編輯形成】的懷疑。之前我寫的反駁印度人的文章(为什么说「新型冠状病毒是人造的」不靠谱?https://www.zhihu.com/question/367703105/answer/994116144 )提到了,【他們提出的懷疑,即spike基因內插入四段HIV序列的說法】不靠譜。但還是需要看更大範圍內是否有嵌合現象(chimera)。
結果確實有幾篇文章報導了幾種冠狀病毒之閒存在嵌合現象,即一個病毒的不同區段的來源不同,或者說用不同的區段畫出的演化樹的樹形不同。人的Y染色體和線粒體就幾乎不會出現這種嵌合情況,比如說一個人的Y染色體一段是從這個爸爸來的,而另一段是從那個爸爸來的。而微生物和病毒中,不同來源的核酸片段重新組合並不罕見。假如出現某個病毒的兩個部分分別明確從兩個已知來源拼接而來,就有說明這個病毒有人工改造而來的可能。
《柳葉刀》雜誌上發表的«Genomic characterisation and epidemiology of 2019 novel coronavirus: implications for virus origins and receptor binding»確實表明了武漢肺炎病毒和其樹上最接近的ZC45 (MG772933)和ZXC21 (MG772934)兩條在舟山發現的蝙蝠冠狀病毒序列(以下稱作“舟山蝙蝠冠狀病毒”)在不同區段上顯示的演化關係不同(圖1),即在病毒的前段和後段,武漢肺炎病毒和這兩條序列最近而離SARS序列更遠。但在病毒基因組中段,武漢冠狀病毒距離舟山蝙蝠病毒及SARS一樣遠,亦即舟山蝙蝠病毒和SARS更近,而武漢冠狀病毒比較遠。這樣是否能說明武漢病毒是由一種接近舟山病毒的未知野生病毒,在其中段用某些未知序列替換掉了而製造的呢?
有一篇James Lyons-Weiler的文章 https://jameslyonsweiler.com/2020/01/30/on-the-origins-of-the-2019-ncov-virus-wuhan-china/ 就是這樣懷疑的。其大意也被豆瓣一位网友引述( https://www.douban.com/note/750967797/ )。他比對了武漢病毒和舟山病毒,發現中閒有1378個鹼基的長度是相互對不上的(圖2)。於是,他認爲這1378個鹼基片段是人工替換插入的。其位置是在spike蛋白上。之前Ji et al.的這篇文章 https://onlinelibrary.wiley.com/doi/pdfdirect/10.1002/jmv.25682 也提出spike序列有未知來源,而且這段未知序列從密碼子使用頻率來看可能和蛇有關,並提出武漢病毒可能是類蝙蝠SARS-like序列(即類似舟山蝙蝠序列)與和蛇相關的冠狀病毒序列拼接而來。
上面那篇James Lyons-Weiler的文章又說,這1378鹼基序列最近匹配是在SARS的spike蛋白上,還有一個pShuttle-SN vector (AY862402),但其實這個載體序列就是用SARS做的,和SARS除了尾部幾個鹼基有區別以外,幾乎就是SARS的序列。之所以上面圖2用這1378個鹼基的序列沒有比對到蝙蝠舟山病毒,而圖3匹配到這個人工載體,純粹是因爲人工載體短,從而E值更顯著,而且blast一段,總歸會給一個最優匹配結果,但實際上匹配是很差的,有大量鹼基替換和插入/刪除(圖3)。結果這個作者得出一個可能性,並說這個是most likely。這個我就看不懂了,明明序列區別這麼大。
好在武漢病毒所在GenBank釋出了據稱於2013年在雲南採集的菊頭蝠毒株RaTG13的基因組(Genbank編号MN996532)。對於該序列,希臘團隊Paraskevis et al.於1月27号在bioRxiv上貼出了文章«Full-genome evolutionary analysis of the novel corona virus (2019-nCoV) rejects the hypothesis of emergence as a result of a recent recombination event»。本文圖4,即該文章的Fig. 1證實了和上面柳葉刀相似的情況,即病毒的前+後段,舟山蝙蝠病毒ZC45和ZXC21和武漢病毒更近,而在病毒中段,舟山病毒和SARS更近(舟山病毒和武漢病毒的比較爲B圖的藍線,SARS等病毒和武漢病毒的比較爲下面那一坨線)。而值得注意的是新放出來的雲南蝙蝠病毒RaTG13在病毒的所有區段都和武漢病毒更接近(B圖的紅線)。那麼根據最簡單的解釋,應該是說武漢肺炎病毒+雲南蝙蝠病毒是一支和SARS稍遠的病毒(但仍然比MERS那些近得多),而舟山病毒是由前+後段的類武漢病毒加上中段的類SARS病毒拼接而成的嵌合子,而這個拼接應該是發生在很久以前(兩株舟山病毒的共祖之前),遠非最近幾年的事。而武漢:雲南不同段的相似性大體和武漢:SARS的相似性成比例,符合自然演化的特徵:有些基因如spike(圖A的S)保守性較差,而覆膜蛋白(圖A的E)非常保守。
有人提出的覆膜基因E,即使武漢病毒和SARS也極爲接近,因此說明是由SARS改造的,不過是因爲其高度保守,而且覆膜基因太短了,只有75個殘基,而且太保守,不像spike有1273個殘基,自然E的區別就少了。
而且因爲武漢肺炎病毒和雲南蝙蝠病毒在各處均有或多或少的變異,這一點上很大程度排除了武漢肺炎病毒是人工改造而來的可能。因爲雖然說現在人工有能力製造較長的片段(整個冠狀病毒也就是29855 bp,不到人線粒體長度的兩倍),在這種序列上不需要用各種眞核生物轉基因需要的複雜技術,從頭合成就行,但如果想人工設計這麼一個病毒,還是需要用幾段已知蛋白做拼接的,在整個病毒的所有區段搞出或大或小的各種突變並不是人類設計的風格,用這種設計方法能有功能而且天衣無縫讓人査不出來人工痕跡就更難了。也就是說,就我目前從序列和演化角度看到的所有證據仍都不能支持武漢肺炎病毒是人工設計合成的,在沒有更新的序列證據的情況下(比如發現跟武漢序列差少數但集中的幾段區別的病毒序列),我傾向於武漢肺炎病毒是自然存在並傳給人的。
還有一件事是,很多人說,一個病毒從蝙蝠傳給人,一定要經過中閒宿主。從經驗來說,確實很多病毒有從蝙蝠到人的中閒宿主,但從生物演化角度來說,蝙蝠和很多哺乳動物中閒宿主到人的距離基本是一樣遠的(圖5,上面的框是翼手目,下面的框是靈長目),大概沒有說有中閒一個宿主,傳染就更容易的道理,除非是從接近人的概率來說,我覺得是否存在中閒宿主並不成爲一個是否爲自然傳給人的鐵證。
Zhihu
为什么说「新型冠状病毒是人造的」不靠谱? - 知乎
之前在新浪微雹的分析( https://weibo.com/1180557177/IsdHAoqfw )被設置不可見了,不知道是出於什麼目…