合成生物學是一門匯集生物學、基因組學、工程學和信息學等多種學科的交叉學科,其實現的技術路徑是運用系統生物學和工程學原理,以基因組和生化分子合成為基礎,綜合生物化學、生物物理和生物信息等技術,旨在設計、改造、重建生物分子、生物元件和生物分化過程,以構建具有生命活性的生物元件、系統以及人造細胞或生物體。簡而言之,合成生物學是以“建構”為核心的新型交叉技術學科,將生物學與其他學科及范式進行深度交叉融合,充分發揮定量、設計、工程化等特征,正在發展成為一個基礎性和工具性學科,被認為是認識生命的鑰匙和改變未來的顛覆性技術,被譽為“第三次生物科學革命”,是推動人類從“認識生命”(“造物致知”)到“設計生命”(“造物致用”)跨越的重要技術路徑。
通俗來講,合成生物學就像奶牛產奶的過程:奶牛吃進低價值的草,而產出的卻是高價值的牛奶。在合成生物學中,底盤細胞相當于奶牛,各種原料相當于低價值的草料。通過基因技術編輯過的底盤細胞,添加低廉原料后經過發酵等一系列工藝產生的高價值的化學或生物原料,就相當于生產的牛奶。高價值的牛奶最終幫助企業換取到金錢,合成生物學就完成了一整套“點石成金”的閉環過程。根據麥肯錫研究,生物制造的產品可以覆蓋60%化學制造的產品,未來生物制造的方式有望對醫藥、化工、食品、能源、材料、農業等傳統行業帶來巨大影響,在2030-2040年期間,合成生物學技術每年將為全球帶來2萬億至4萬億美元的直接經濟效益。
合成生物學的前世今生
1911年,“synthetic biology”一詞最早由法國物理化學家Stephane Leduc在其所著的《生命的機理》(The Mechanism of Life)一書中首次提出,在該書中其試圖利用物理學理論解釋生物起源和進化規律,認為“構成生物體的是其形態”,并歸納為“合成生物學是對形狀和結構的合成”。
合成生物學的起源可以追溯到1961年弗朗索瓦·雅各布(Francois Jacob)和雅克·莫諾(Jacques Monod)的一篇里程碑式的出版物。他們對大腸桿菌中lac操縱子的研究的見解使他們假定存在調節性雙基因表達。
隨著20世紀70年代和80年代分子克隆和PCR的發展,基因操作在微生物學研究中變得廣泛,為設計人工基因調控提供了技術手段。
到20世紀90年代中期,自動DNA測序和改進的計算工具使完整的微生物基因組得以測序,用于測量RNA、蛋白質、脂質和代謝物的高通量技術使科學家能夠生成大量的細胞成分及其相互作用。這種分子生物學的“放大”產生了系統生物學領域,因為生物學家和計算機科學家開始將實驗和計算結合起來,對細胞網絡進行反向工程。
合成生物學真正被廣泛關注始于21世紀初,一系列顛覆性成果在這個階段陸續發布。
2000年,波士頓大學Collins團隊受噬菌體λ開關和藍藻晝夜節律振蕩器的啟發,設計合成了雙穩態基因網絡開關;普林斯頓大學Elowitz和Leibler基于負反饋調控原理設計了基因振蕩網絡。
2002年,紐約州立大學石溪市分校Wimmer團隊通過化學合成病毒基因組獲得了具有感染性的脊髓灰質炎病毒-人類歷史上首個人工合成的生命體。
2010年,美國Venter團隊宣布首個“人工合成基因組細胞”誕生。他的團隊設計、合成和組裝了1.08Mb的支原體基因組(JCVI-syn1.0),并將其移植到山羊支原體受體細胞中,產生了僅由合成染色體控制的新支原體細胞。
2013年,青蒿素的生物合成生產。
2014年,拓展遺傳密碼子入選Science年度十大科學突破。美國Scripps研究所Romesberg團隊設計合成了一個非天然堿基配對:X和Y,并將它們整合到大腸桿菌基因組。理論上,遺傳字母表從4個變成6個密碼子可以從64個擴充到216個,這意味著在控制條件下,未來的生命形式有無限種可能。
2016年,Nielsen等人發表了Cello,這是一個卓越的端到端計算機輔助設計系統,用于E.coli 中的邏輯構造。在過去十年中,這可能是合成生物學家最滿意的,因為它通過標準化、表征和自動化設計實現了許多生物學工程功能。
2017年,基于CRlSPR的快速診斷。
2018年,具有邏輯控制的CAR-T細胞;具有合成融合染色體的酵母;自組織多細胞結構。
2019年,大腸桿菌基因組全合成;大腸桿菌基因組碳固定;大麻素的合成生產。
進入21世紀,合成生物學的發展可分為4個階段:
1、創建時期(2000-2003年):產生了許多具備領域特征的研究手段和理論,特別是基因線路工程的建立及其在代謝工程中的成功運用;
2、擴張和發展期(2004-2007年):工程技術進步較緩慢,領域有擴大趨勢;
3、快速創新和應用轉化期(2008-2013年):這一階段涌現出的新技術和工程手段使合成生物學研究與應用領域大為拓展;
4、發展新階段(2014年后):工程化平臺的建設和生物大數據的開源應用相結合,全面推動生物技術、生物產業和生物醫藥“民主化”發展。
合成生物學的關鍵底層技術
合成生物學產業鏈分布情況
合成生物學具有強科技屬性,從微觀的基因合成到宏觀的放大生產的發酵工程 存在大量know-how,技術壁壘高,按照所處的行業上下游,可被劃分為三個層面:工具層/原料層、軟件/硬件層以及應用層。
1、產業鏈前端:以基因編輯相關技術公司為主,為元件構建提供技術支撐,技術要求包括基因合成、編輯、組裝、測序等。
2、產業鏈中端:以合成生物學平臺公司為主,通過搭建技術平臺,形成項目經驗積累,為下游客戶提供研發支撐。
3、產業鏈后端:則以產品型公司為主,主導產品的放大生產與下游市場應用,市場可延伸至醫療、化工、食品、農業等多種領域。
關鍵底層技術發展--DNA合成成本下降
DNA合成成本下降速率快過摩爾定律,合成片段長度、精度大幅提升推動基因合成下游應用。
1、20世紀80年代開發的基于亞磷酰胺的DNA合成法為DNA合成儀的創制奠定了基礎,之后三種芯片式原位合成技術(光刻合成、電化學脫保護合成、噴墨打印)和超高通量合成技術相繼被開發出來,推動了合成DNA效率的提升和成本的下降,2021年每Mb堿基合成的平均費用已由2001年的超過5000美元下降至0.006美元,未來隨著第四代酶促合成技術的發展和成熟,DNA合成有望進一步降低成本,實現更大規?;a;
2、目前工業化DNA合成工藝通常從化學合成寡核苷酸起始,更長的DNA分子是以寡核苷酸為原料通過酶促反應逐步拼接和組裝得到,寡核苷酸單步合成效率雖然已高達99.5%,但合成長度達到200bp時產率即降至約35%,由于該產率雜質過多難以純化得到目的片段,而要合成kb級長度的寡核苷酸單步合成效率必須達到99.9%以上才能獲得同樣的產率,隨著微陣列式DNA合成技術的出現,合成所需的反應濃度更低(飛摩爾級),同時保證了成本和合成的準確度,當該技術目前主要缺陷在于合成錯誤率較柱式法更高,仍有進一步提升的空間。
關鍵底層技術發展--基因編輯與迭代
基因編輯:在生物體的基因組中特定位置插入、刪除、修改或替換DNA?;蚓庉嬕蕾囉诮涍^基因工程改造的核酸酶,也稱“分子剪刀”,在基因組中特定位置產生位點特異性雙鏈斷裂(DSB),誘導生物體通過非同源末端連接(NHEJ)或同源重組(HR)來修復DSB,人工主導或干擾這個修復過程就可以把特定DNA序列進行刪除或者插入外源基因。
基因編輯技術的迭代:1996年,第一代代基因編輯技術,經基因工程改造的鋅指核酸酶(ZFNs)被設計出來,開啟人工改造生命體的旅程。2009年,第二代基因編輯技術類轉錄激活因子效應物核酸酶(TALENs)誕生。但前兩代技術構建周期長,步驟繁瑣,難以進行高通量基因編輯,極大限制了其推廣應用。直到2012年,CRISPR技術橫空出世,與ZFNs和TALENs技術相比,CRISPR/Cas9的設計要簡單得多,而且成本很低,對于相同的靶點,CRISPR/Cas9有相當甚至更好的靶向效率。
CRISPR/Cas9:實現基因編輯能力的重大飛躍。作為第三代基因編輯技術,相比前兩代,其優勢明顯:1)構建簡單方便快捷,適用于任何分子生物實驗室;2)用于基因組的點突變編輯優于ZFN或TALEN;3)CRISPR/Cas9精確的切口酶活性用于基因治療安全性高于ZFN或TZLEN。根據頭豹研究數據,2016-2018年,中國CRISPR/Cas9行業市場規模(按銷售額統計)從9.7億元人民幣增長至24.8億元人民幣,年復合增長率高達59.6%。
關鍵底層技術發展--DNA組裝與測序
DNA組裝:技術相對成熟、低成本、自動化、一體化是未來發展方向。受到技術的限制,DNA片段從頭合成的長度有限,更長基因或基因組有賴于通過核苷酸片段的酶促組裝或體內組裝獲得,通常使用的寡核苷酸組裝方法有兩種:連接酶組裝法(LCR)和聚合酶組裝法(PCA)。使用短初始片段組裝染色體或基因組長度DNA所需的分層組裝次數較多,過程中所需的克隆挑選和測序等質控成本也會相應增多,具有低成本、自動化和一體化特性的微流控組裝體系將成為寡核苷酸體外合成和組裝整合平臺開發的方向。
DNA測序:測序技術不斷迭代,測序成本、長度、速度均得到指數級提升。DNA序列決定了DNA分子中核苷酸排列順序。大規?;蚪M測序工作可以提供有關自然界生物的信息,幫助合成生物學家從中構建生物元件和裝置,同時測序可以驗證制造的系統是否符合預期以及快速、廉價和可靠的測序可以促進所合成的生命系統的快速檢測和鑒定。DNA測序技術在過去幾十年間得到了快速的發展,從最初的Sanger測序發展到四代納米孔測序,基因測序成本也由2001年每基因組的接近1億美元下降至2021年的0.006美元。隨著技術的迭代,測序長度、速度等都有了質的飛躍。
資料來源:上海市華興健康產業合作促進中心、BiG生物創新社、生物制品圈等