与片段CAGAp互补色的片段是TCTGp为什么不是UCUGp

君,已阅读到文档的结尾了呢~~
(水生生物学专业论文)水稻胞质FBA基因在鱼腥藻7120中的表达及其对光合碳同化的调控论文,基因,专业,碳同化,基因的,水生生物学,藻基因,及其对,及其对光合,学专业
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
(水生生物学专业论文)水稻胞质FBA基因在鱼腥藻7120中的表达及其对光合碳同化的调控
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口在植物中生产胰岛素的方法
专利名称在植物中生产胰岛素的方法
技术领域本发明涉及植物基因工程方法及胰岛素的生产。更具体地,本发明涉及在植物种子内生产胰岛素的方法。
背景技术 胰岛素是维持哺乳动物,包含人类,和其它脊椎动物体内血液葡萄糖体内稳态所需的重要肽激素。在健康的个体中,血液葡萄糖水准上升会刺激胰脏的β细胞分泌胰岛素。然后胰岛素多肽结合肌肉、肝脏、脂肪组织内的特异受体,导致这些靶组织的葡萄糖摄取量增加,新陈代谢提高,肝葡萄糖生产降低。这些反应的累积效果保持血液葡萄糖浓度在一恒定水平。
在患糖尿病的个体中,胰岛素浓度异常低,本身呈现慢性高血糖。慢性高血糖的临床表现多样,包含目盲、肾衰竭,如不治疗,最终导致死亡。估计在工业化国家,糖尿病在第三大死亡原因,在心血管疾病和癌症之后(Barfoed H.C.,1987,Chem.Eng.Prog.8349-54)。为使血液葡萄糖被细胞有效摄取和新陈代谢,糖尿病患者可以通过例行施用胰岛素来治疗。世界人口大约0.7%患有胰岛素依赖性糖尿病(I型糖尿病)(Winter J.等人,2000,J.of Biotechnol.)。此外,估计未来25年中诊断出糖尿病的患者数将倍增至约3亿(Kjeldsen T.等人,2001,Biotechnol.Gen.Eng.Rev.)。因此,亟需有能力以成本有效性方式大量制造人胰岛素,以满足预见成长中的全球胰岛素需要。
体内人胰岛素多肽是利用胰β-细胞生产,形成单一110个氨基酸的多肽链前体,即前胰岛素原,其在N-末端位置包括24个氨基酸的前序列,在链生物合成完成时被立刻切除(Steiner,D.F.2000,J.Ped.Endocrinol.Metab,)。胰岛素原是由B链和A链组成,其由连接肽(C-肽)连接。激素包装分泌过程中,C-肽被激素原转化酶PC2和PC1/PC3裂解去除(Steiner,D.F.2000,J.Ped.Endocrinol.Metab.)。遗留的是成熟的人胰岛素,51个氨基酸的蛋白质,其由二种多肽链组成,A(长度为21个氨基酸)和B(长度为30个氨基酸),通过二个链间二硫键连接。此外,A链包括一个链内二硫键。
人胰岛素可使用多种不同的方法制备。通常使用微生物,如大肠杆菌(Escherichia coli)(Frank等人,1981,PeptidesProceedings of7th American Peptide Chemistry Symposium(Rich &Gross,eds),PierceChemical Co.,Rockford,Ill.729-739页;Chan等人,1981,Proc.Natl.Acad.Sci.USA 4)、酿酒母菌(Saccharomyces cerevisiae)(Thim等人,1986,Proc.Natl.Acad.Sci.USA 0)重组生产胰岛素。Wang等人(Biotechnol.Bioeng.,-79)已示出真菌,如巴斯德毕赤酵母(Pichia pastoris),亦可适用于胰岛素生产。其它制法选项包扩在非人类哺乳动物细胞系内生产(Yanagita,M等人,1992,FEBS lett 31155-59),从人体胰脏分离、肽合成,或由猪和牛胰岛素半合成转化成人胰岛素。然而,所有这些方法均比希望的产率要低且成本高。
使用植物作为生物反应器大量生产重组蛋白质是公知的,并已生产过多种蛋白质,包扩人体治疗用蛋白质。例如,美国专利4,956,282,5,550,038和5,629,175揭示在植物内生产γ-干扰素;美国专利5,650,307,5,716,802和5,763,748揭示在植物内生产人血清白蛋白;而美国专利5,202,422,5,639,947和5,959,177涉及在植物内生产抗体。基于植物的重组蛋白质生产系统提供的一个显著优点是通过提高植物生长的土地面积,蛋白质生产可廉价地扩大规模到提供大量蛋白质。反之,发酵和细胞培养系统需要大的空间、设备和能量需求,使大规模生产的成本高。然而,尽管事实上使用植物为生物反应器被大量报道,且尽管上述预期的巨大增加的大量胰岛素需求,现有技术只提供了有限数目的方法证明在植物内生产胰岛素(参见Arakawa等人,Nature Biotech,-938;PCT 01/72959)。
Arakawa等人揭示融合蛋白质的生产,包括在转基因马铃薯植物的块茎内生产胰岛素。然而,胰岛素仅代表转基因块茎内存在的总可溶性蛋白质含量的直至0.05%而已。在总可溶性蛋白质的0.05%水平,大量的生物量必须进行蛋白质提取,致使与使用马铃薯块茎相关的生产从经济上不利。此外,Arakawa等人不涉及从马铃薯块茎组织中分离胰岛素,但提议了通过诱导免疫耐受防止I型糖尿病发作的方法,其包括通过喂转基因马铃薯块茎以口服胰岛素。
PCT专利申请WO01/72959揭示了融合蛋白质的生产,包括在转基因烟草的叶绿体中生产胰岛素。然而,虽然存在有关人蛋白质在植物组织内累积水平的缺点,但WO01/72959的发明仅限于在叶绿体内生产而造成在绿色组织,主要是烟叶中累积胰岛素。由于绿色组织相对高的含水量,因此必须处理大量的生物量。此外,生产胰岛素需在收获时立即从生物量提取,因为叶物质在储存时很快变质。
因此,鉴于现有技术所提供的与在植物内重组生产胰岛素的方法相关的缺点,目前尚未明了是否可以及如何利用植物的合成能力实现在植物内商业化生产胰岛素。本领域亟需改进在植物内商业化生产胰岛素的方法。
发明简述本发明涉及在植物内生产胰岛素的改良方法。具体地,本发明涉及在种子内生产胰岛素的方法。
因此,本发明提供了在植物内表达胰岛素的方法,包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括可操纵连接的如下组分(i)在植物种子细胞内可控制表达的核酸序列;及(ii)编码胰岛素多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内以及(c)令植物细胞成长为成熟植物,其可结种子,其中种子表达胰岛素。
在本发明的一个优选实施方案中,可在植物种子细胞内控制表达的核酸序列是种子偏好启动子,如菜豆蛋白启动子。
在本发明的一个优选实施方案中,胰岛素以可以在种子细胞内膜包围的细胞内区室(membrane enclosed intracellular compartment)内累积胰岛素多肽的方式表达。因此,本发明提供了在植物内表达胰岛素的方法,所述方法包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括下列可操纵连接的组分(i)可在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列和(iii)编码可将胰岛素多肽保持在膜包围的细胞内区室的多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;以及(c)令植物细胞成长为成熟植物,其可结种子,其中种子表达胰岛素。
在本发明又一优选的实施方案中,膜包围的细胞内区室是内质网(ER)或ER衍生的储存小泡。因此,本发明提供了在植物内表达胰岛素的方法,所述方法包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括下列可操纵连接的组分(i)可在植物种子细胞内控制表达的核酸序列;及
(ii)编码胰岛素多肽的核酸序列;(iii)编码可将胰岛素多肽保持在ER或ER衍生的储存小泡内的多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;以及(c)令植物细胞成长为成熟植物,其可结种子,其中种子表达胰岛素。
在又一优选的实施方案中,在核基因组整合条件下,把嵌合核酸构建体导入植物细胞内。在如此条件下,嵌合核酸序列稳定地整合进植物基因组内。
在另一优选的实施方案中,编码胰岛素的核酸序列根据植物密码子使用表对进行优化并将编码连接肽(C-肽)的核酸序列缩短。本发明所用优选的核酸序列编码人、牛或猪胰岛素。按照本发明,使用编码胰岛素原序列的核酸序列,其中胰岛素原经修饰,把C-肽长度缩短。
在另一方面,本发明提供了包括胰岛素的植物种子的回收方法。因此,本发明提供了一种获得包括胰岛素的植物种子的方法,包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括下列可操纵连接的组分(i)可在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;(c)令植物细胞成长为成熟植物,其可结种子;以及(d)从所述植物获得种子,其中种子包括胰岛素。
优选种子内存在的全部种子蛋白质的至少0.1%为胰岛素。
种子可用来获得子代植物群,其中每个都包括表达胰岛素的多个种子。
本发明还提供了可结表达胰岛素的种子的植物。在本发明一个优选实施方案中,可结种子的植物包括嵌合核酸序列,其在5’至3’转录方向包括(a)可在植物种子细胞内控制表达的第一核酸序列,其可操纵的连接于;(b)编码胰岛素多肽的第二核酸序列,其中种子含有胰岛素。
优选地,种子内存在的全部种子蛋白质的至少0.1%是胰岛素。
在一个优选的实施方案中,嵌合核酸序列整合于植物核基因组内。
在本发明另一优选实施方案中,使用植物为红花,亚麻植物或芥属(Arabidopsis)植物。
在另一方面,本发明提供了表达胰岛素的植物种子。在本发明一个优选的实施方案中,植物种子包括嵌合核酸序列,在5’至3’转录方向包括(a)可在植物种子细胞内控制表达的第一核酸序列,其可操纵的连接于;(b)编码胰岛素多肽的第二核酸序列。
优选地,种子内存在的全部种子蛋白质的至少0.1%是胰岛素。种子是利用种子细胞合成所需胰岛素多肽的来源,其可经提取,而且胰岛素可用来治疗糖尿病患者。
本发明的其它特征和优点通过下列详述可容易明白。然而,应理解表示本发明优选实施方案的详细说明和特定实施例仅是为了阐明本发明,因此通过改详细说明,本领域技术人员可以容易地知道在本发明精神和范围内的多种变化和修饰。
本发明通过附图描述,其中图1表示pSBS4404的胰岛素融合蛋白(PRS-D9scFv-Klip27-MI-KDEL)的核苷酸序列(SEQ ID NO1)和推定的氨基酸序列(SEQ ID NO2)。预期的氨基酸序列用单字母符号表示。PRS信号肽的推定氨基酸序列用斜体字,而D9scFv的推定氨基酸序列用黑体字,KLIP27序列的推定氨基酸序列下划线,微型胰岛素(mini-insulin)序列的推定氨基酸序列用斜黑体字,最后KDEL序列用黑体下划线。
图2表示pSBS4405胰岛素融合蛋白质(OLEO-KLIP8-KLIP27-MI)的核苷酸序列(SEQ ID NO3)和推定的氨基酸序列(SEQ ID NO4)。预期的氨基酸序列用单字母符号表示。拟南芥(Arabidopsis thaliana)18kDa油质蛋白的推定氨基酸是斜体字,KLIP8序列的推定氨基酸序列用黑体,KLIP27序列的推定氨基酸序列下划线,而微型胰岛素的推定氨基酸序列用斜黑体。
图3表示4414胰岛素融合蛋白(PRS-MI-四元(tetrabasic)接头-D9Scfv-KDEL)的完整核酸序列(SEQ ID NO5)和氨基酸序列(SEQID NO6)。预期氨基酸序列以单字母符号表示。PRS信号肽的推定氨基酸序列用斜体,微型胰岛素(B30四元)的推定氨基酸序列用黑体,四元接头序列的推定氨基酸序列下划线,D9scFv的推定氨基酸序列用斜黑体,最后KDEL序列用黑体下划线。
图4(A-D)表示根据考马斯染色SDS-PAGE和蛋白质印迹分析胰岛素融合蛋白在转化的拟南芥(4404-2、-17、-20和4405-4)品系中的重组表达。箭头分别指在还原条件下,38.5kDa和34.2kDa融合多肽、PRS-D9(scfv)-KLIP27-MIw/KDEL和OLEO-KLIP8-KLIP27-MI的迁移位置。图4A(考马斯染色凝胶)和4B(相当于以抗胰岛素E2E3探测的蛋白质印迹)表示来自野生型(wt)的总种子蛋白质以及表达构建体的转基因种子品系。图4B(考马斯染色凝胶)和4D(相当于以抗胰岛素E2E3探测的蛋白质印迹)表示由野生型制备的油体蛋白质以及表达同样构建体的转基因种子。图4(E-F)表示根据考马斯染色SDS-PAGE和蛋白质印迹分析,胰岛素融合蛋白在转化的拟南芥品系(14-20)中的重组表达。分子量标记(M)为10,15,25,37,50,75,100,150kDa。对照包扩hIN(重组人胰岛素标准)和hProIN(重组人胰岛素原标准),在非还原条件下分离。
图5表示在可得到的T3种子品系(4404-2、-17、-20,4405-4、-13、-19)和T2种子品系(4414-9和-20)中测定的表达水平。转基因水平和%摩尔MI表达根据光密度测定法测定。
图6表示考马斯染色SDS-PAGE(15%)分析洗脱前的油体制备物(-OB)、用甲酸洗脱后的OB制备物(-OB’),以及浓缩的洗脱物质(-E)。箭头指融合多肽的迁移位置。野生型对照基本上在洗脱后不含任何主要蛋白质,而浓缩的4404物质含有融合蛋白,某些截短产物(可能是水解的融合蛋白)以及可能有共同洗脱的一些白蛋白。
图7表示层析谱,显示与在C18柱上胰蛋白酶裂解的洗脱4404融合蛋白相比,人胰岛素标准的特征性住留时间。hIN标准是重组人胰岛素标准(0.5μg)。
图8表示人胰岛素标准(A)的质谱分析,与从17.0-17.5分钟所集的胰蛋白酶裂解和HPLC纯化的4404(B)级分比较。
图9表示总可提取种子蛋白质和表达4405的品系的油体(OB)制备蛋白质的考马斯染色SDS-PAGE(15%)分析,与野生型(非重组)种子比较。箭头指示融合多肽的迁移位置。
图10表示层析谱,显示人胰岛素标准的特征性住留时间,与胰蛋白酶裂解的、在C18柱上通过RP-HPLC制备的4405OB制备物比较。hIN标准是重组人胰岛素标准(0.5μg)。
图11表示人胰岛素标准(A)的质谱分析,与从17.0-17.5分钟收集的胰蛋白酶裂解和HPLC纯化的4405(B)级分比较。
图12表示胰蛋白酶裂解的4405油体制备物(虚线)的层析谱,与人胰岛素标准(实线)比较。在7-35mS/cm间收集洗脱的裂解的胰岛素级分并利通过冷冻干燥浓缩以供胰岛素生物分析。
图13表示B6雄鼠在注射负对照(空白圆形=生理盐水安慰剂,实心圆形=胰蛋白酶裂解的野生型油体),正对照(空白方形=Humulin R,空白三角形=Roche hIN)后的血清葡萄糖水平变化,与从4405油体(实心菱形=SBS hIN DesB30)制备的植物衍生胰岛素比较。
图14表示二种代表性品系(09-8)的油体蛋白质的考马斯染色凝胶,比较油质蛋白-hPIN融合蛋白(黑色箭头所示)与非转化(wt)芥的迁移。表达水平通过光密度测定法测量,测得平均为总种子蛋白质的约0.10%。此水平计算如上,并超出非转化种子(wt)内、构成总种子蛋白约0.04%的同样分子量的内源蛋白质的共同迁移。
发明详述如上所述,本发明涉及在转基因植物中生产胰岛素的改良方法。本发明人等意外发现通过在植物种子内以重组方式生产胰岛素可在植物内使胰岛素累积水平超过全部细胞蛋白质的0.1%。此等表达水平比以前所达到的高至少10倍,使胰岛素在植物内的商业化生产成为可行。在种子内生产提供了把胰岛素做为原始物质储藏和运输的可行性,因为胰岛素保有从储藏种子提取时的活性。此外,需经提取的生物量数量有限,因植物种子内存在的水含量相对低。
因此,本发明提供了在种子内表达胰岛素的方法,所述方法包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括下列可操纵连接的组分(i)可在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;以及(c)令植物细胞成长为成熟植物,其可结种子,其中种子表达胰岛素。
按照本发明,意外发现如果以在允许胰岛素多肽在种子细胞内被隔离(sequestration)在膜包围的细胞内区室中的方式在种子内表达胰岛素,则胰岛素在植物种子内累积的水平可以达到以前未达到的水平。因此,本发明提供了在植物内表达胰岛素的优选方法,所述方法包括(a)提供嵌合核酸构建体,在5’至3’转录方向包括下列可操纵连接的组分(i)可在植物种子细胞内控制表达的启动子;及(ii)编码胰岛素多肽的核酸序列(iii)编码可将胰岛素多肽保持在膜包围的细胞内区室里的多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;以及(c)令植物细胞成长为成熟植物,其可结种子,其中种子表达胰岛素。
术语和定义除非另有定义,本文所用全部技术和科学术语应具有本发明所属技术领域的技术人员通常所知的同样意义。如果容许,凡专利、专利申请案、专利公告,及其他出版物,含有来自GenBank、SwissPro及本申请参考的数据库的核酸和多肽序列,均全部在此并入参考。
本文所用“核酸序列”指核苷或核苷酸单体的序列,这些核苷或核苷酸单体由天然存在的碱基、糖或糖间(intersugar)(骨架)键组成。此术语亦包含修饰或被取代的序列,其包括非天然存在的单体或其部分。本发明核酸序列可为脱氧核糖核酸序列(DNA)或核糖核酸(RNA),并可包括天然存在的碱基,包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶。所述序列亦可含有修饰的碱基。该修饰碱基的例子包括氮杂(aza)和脱氮(deaza)腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶,以及黄嘌呤和次黄嘌呤。
术语“编码胰岛素的核酸序列”和“编码胰岛素多肽的核酸序列”在此可以互换使用,是指编码胰岛素多肽的任何和全部核酸序列和编码胰岛素原和前胰岛素原的任何核酸序列,所述胰岛素多肽包括表1内所列胰岛素多肽(SEQ ID No7-145)以及任何哺乳动物胰岛素多肽。本文所用“胰岛素原”指包括连接肽或“C-肽”连接B和A胰岛素多肽链的胰岛素多肽。在天然人胰岛素中,C-肽是31个氨基酸残基的多肽链,残基B30连接到残基A1。术语“前胰岛素原”指胰岛素原分子,其另外包括N-末端信号序列,其指导在ER核糖体发生的翻译。编码胰岛素多肽的核酸序列又包括任何和全部下列核酸序列(i)编码与上述胰岛素多肽序列基本上一致的多肽的序列;或(ii)在至少中度严格杂交条件下与上述任何核酸序列杂交、或在至少中度严格条件下与其杂交但使用同义密码子的序列。
术语“基本上一致”指两个多肽序列优选至少75%一致,更优选至少85%一致,及最优选至少95%一致,例如96%、97%、98%或99%一致。为确定两个多肽序列间一致性百分比,将这两个序列的氨基酸序列排列对比,优选使用Clustal W算法(Thompson,J.D.,Higgins DG,Gibson TJ,1994,Nucleic Acids Res.22(22)),以及BLOSUM 62评分矩阵(Henikoff S.和Henikoff J.G,1992,Proc.Natl.Acad.Sci.USA 19),以及缺口罚值10和缺口延伸罚值0.1,以便在两个序列间得到最高阶匹配,其中序列之一的总长的至少50%参与对比。可用来序列对比的其它方法是Needleman和Wunsch对比法(J.Mol.Biol.,),由Smith和Waterman加以修正(Adv.Appl.Math.,),故在二序列间可得最高阶匹配,而且确定了两个序列间一致的氨基酸数。计算两个氨基酸序列间百分比一致性的其它算法是一般技术所知,包括例如Carillo和Lipton所述(SIAM J.Applied Math.,)以及在Computational Molecular Biology,lesk,e.d.Oxford University Press,New Nork,1988,BiocomputingInformations and Genomics Projects。一般而言,此等计算采用计算机程序。在此方面可用的计算机程序包括但不限于GCG(Devereux等人,Nucleic Acids Res.,)BLASTP、BLASTN和FASTA(Altschul等人,J.Molec.Biol.,)。
“至少中度严格杂交条件”指选择的条件促进两个互补核酸序列在溶液中选择性杂交。杂交可发生于核酸序列分子全部或部分。杂交部分典型上长度至少为15(例如20、25、30、40或50)个核苷酸。本领域技术人员均知核酸双链体或杂种的稳定性通过Tm确定,在含钠缓冲液内是钠离子浓度和温度的函数(Tm=81.5℃-16.6(log10[Na+]+0.41(%(G+C)-600/1),或类似方程式)。因此,在洗涤条件下决定杂种稳定性的参数是钠离子浓度和温度。为鉴定与已知核酸分子类似但不一致的分子,可假设1%误配导致Tm会降约1℃,例如如果找寻的核酸分子有>95%一致性,最后洗涤温度会降约5℃。基于如此考量,本领域技术人员能够轻易选择适当的杂交条件。在优选实施方案中,选用严格杂交条件。举例而言,可采用下列条件达成严格杂交根据上述方程式,在Tm-5℃,于5×氯化钠/柠檬酸钠(SSC)/5×Denhardt’s溶液/1.0%SDS杂交,接着在60℃,利用0.2×SSC/0.1%SDS中洗。中度严格杂交条件包括在42℃的3×SSC中的洗涤步骤。然而,须知使用其它缓冲液、盐和温度,可实现同等的严格性。有关杂交条件的其它指导可参见Current Protocols in Molecular Biology,JohnWiley & Sons,N.Y.,.1-6.3.6以及Sambrook等人,MolecularCloning,a Laboratory Manual,Cold Spring Harbor Laboratory Press,1989,第3卷。
本文所用术语“胰岛素”和“胰岛素多肽”可互换使用,指包括表1内所列胰岛素多肽(SEQ ID NO7-145)在内的任何和全部胰岛素多肽,也指的是包括如下所述的氨基酸残基序列的多肽分子,所述氨基酸残基序列(i)与构成上述任何胰岛素多肽的氨基酸序列基本上一致,或(ii)由一种核酸序列编码,该核酸序列在至少中度严格条件下能够与编码在此所述的胰岛素的任何核酸序列杂交,或在至少中度严格条件下能够与编码在此所述的胰岛素、但使用了同义密码子的核酸序列杂交。术语胰岛素和胰岛素多肽包括胰岛素原多肽和微型胰岛素多肽。胰岛素多肽优选是人、猪或牛来源。
术语“可保持胰岛素多肽于膜包围的细胞内区室中的多肽”用来指当与胰岛素多肽连接时,可将胰岛素多肽隔离在膜包围的并且位于植物细胞的细胞内空间、由植物细胞质膜所界定的亚细胞结构中的任何多肽。
术语“可保持胰岛素多肽于ER或ER衍生储存小泡内的多肽”,用来指当与胰岛素多肽连接时,可将胰岛素多肽隔离于内质网或在内质网所衍生的储存区室如植物细胞内的油体中的任何多肽。
本文所用术语“油体”指植物种子细胞中的任何油或脂肪储存细胞器(例如Huang(1992)Ann.Rev.Plant Mol.Biol.所述)。
在核酸序列中所用术语“嵌合”指非天然连接的至少两个连接的核酸序列。嵌合核酸序列包含不同天然来源的连接的核酸序列。例如,构成连接于编码人胰岛素的核酸序列的植物启动子的核酸序列可视为嵌合的。嵌合核酸序列亦可包括同样天然来源的核酸序列,条件是它们天然不连接。例如,构成由特殊细胞类型所得启动子的核酸序列可与编码从同样细胞类型所得多肽的核酸序列连接,但通常其不与构成该启动子的核酸序列连接。嵌合核酸序列亦包括这样的核酸序列,其包括与任何非天然存在的核酸序列连接的天然存在的核酸序列。制备包含编码胰岛素的嵌合核酸序列和能够在植物种子细胞中控制表达的启动子的重组表达载体本发明方法和组成物可用的编码胰岛素的核酸序列可为编码胰岛素多肽的任何核酸序列,所述胰岛素多肽包括任何胰岛素原和前胰岛素原。
本领域熟知编码胰岛素的核酸序列的例子,一般从多种哺乳动物来源中可轻易取得,包括人(Bell,G.I.等人,1980,Nature 28426-32)、猪(Chance,R.E.等人,1968,Science )、牛(D’Agostino,J.等人,1987,Mol.Endocrinol,)、羊(Peterson,J.D.等人,1972,Biol.Chem.1)等,以及从植物来源获得(Oliveira,A.E.A.等人,1999,Protein Pept.Lett.615-21)。可用的胰岛素编码序列包括编码SEQ ID NO7至SEQ ID NO145所示多肽链的序列。编码胰岛素多肽链的各相对应核酸序列可经由表1所提供SwissProtein识别号码轻易识别。使用这些核酸序列,使用本领域技术人员已知的技术可以鉴别其它的新胰岛素编码核酸序列。例如文库,像表达文库、cDNA和基因组文库,均可筛选,而且在含有来自测序计划的序列信息的数据库中可以查寻类似序列。可使用把编码胰岛素多肽的另外核酸序列分离的其它方法,并按照本发明发现和使用新序列。在优选实施方案中,核酸序列编码的胰岛素是人、猪、牛胰岛素。
现有技术已知许多胰岛素类似物(例如参见美国专利5,461,031;5,474,978;5,164,366和5,008,241),可用于本发明。本文可使用的类似物包括人胰岛素分子,其中B-链的氨基酸残基28(B28)从其天然的脯氨酸残基改变成天冬氨酸、赖氨酸或异亮氨酸。另一实施方案中,在B29的赖氨酸残基经修饰成脯氨酸。此外,A21的天冬酰胺可改变为丙氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、甲硫氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸或缬氨酸。而且,在B3的天冬酰胺亦可修饰为赖氨酸。本文可用的胰岛素类物其它例子包括缺少B30残基的人胰岛素,通常亦称为“desB30”或”B(1-29)”缺少最后3个氨基酸残基的胰岛素”B(1-27)”;在B1缺少苯丙氨酸残基的胰岛素分子以及其中A链或B链具有N-末端或C-末端延伸的类似物,例如B链可通过添加两个精氨酸残基而延长N-末端。
在优选实施方案中,所用核酸序列编码胰岛素是胰岛素原。在又一优选实施方案中,使用编码胰岛素的核酸序列分子,其中C-肽已相对于其天然形式被修饰过。C-肽内的氨基酸残基可被取代,而C-肽可加长或缩短。因此,本文所用术语“微型胰岛素(mini-insulin)”指经修饰的胰岛素多肽,C-肽长度相比于其天然形式被缩短。优选实施方案中,使用微型胰岛素。微型胰岛素分子的C-肽优选短于20个氨基酸残基,更优选短于15个氨基酸残基,最优选短于9个氨基酸残基,例如7、5或3个残基。如天然胰岛素分子情形,微型胰岛素C-肽优选在其C-和N-末端包括裂解位点。此种裂解位点可为本领域已知的任何常规位点,例如可被溴化氰裂解的甲硫氨酸,可被胰蛋白酶等类似的蛋白酶或羧肽酶裂解的单一碱基残基或一对碱基残基。例如,C-肽可包括C-末端赖氨酸,例如Ala-Ala-Lys(SEQ ID NO146),或紧接Gly A1残基前的二元加工位点,例如Asn-Lys-Arg(SEQ IDNO147)或Arg-Arg-Lys-Gln-Lys-Arg(SEQ ID NO148)或紧接GlyA1残基前的四元加工位点,例如Arg-Arg-Lys-Arg(SEQ ID NO149)。因此,本发明可用的微型胰岛素分子包括B(1-29/30)-X1-X2-X3-Y1-A(1-21)其中,X1为任何氨基酸;X2为任何氨基酸;X3为Lys或ArgY1为肽键或1-17个氨基酸残基;B(1-29/30)为含有氨基酸残基1-29或1-30的人胰岛素B链的B链;A(1-21)为含氨基酸残基1-21的人胰岛素A链的A链。
在优选实施方案中,X1为碱性氨基酸残基(Lys或Arg),Y1为肽键或1-17个氨基酸残基,其中C-末端残基为碱性氨基酸残基(Lys或Arg)。
此外,本文可用的微型胰岛素分子包括下式代表的那些B(1-27)-X2-X3-X1-Y-A(1-21)其中X1为1-18个氨基酸残基的肽,包括至少一个芳族氨基酸残基;X2为在B链28位的Pro、Asp、Lys或Ile之一;X3为在B链29位的Pro、Lys、Ala、Arg或Pro-Thr之一;Y为Lys或Arg;B(1-27)为含氨基酸残基1-27的人胰岛素B链的B链;及A(1-21)为含氨基酸残基1-21的人胰岛素A链的A链。
本发明所用编码微型胰岛素多肽的核酸分子的另外例子包括如下所述的那些Markussen等人,Walter de Gruyter & CO.1987,Peptides189-194页;Thim等人,1989,Genetics and molecular biology ofindustrial microorganisms,American Society for Microbiology,322-328页;以及美国专利4,916,212;5,324,641及6,521,738。制造胰岛素类似物的、编码胰岛素的核酸序列的变化形式可用本领域技术人员所知多种核酸修饰技术制得,包括例如定点诱变、定向突变、随机突变、添加有机溶剂、基因改组或其组合,以及本领域技术人员所知的其它技术(Shraishi等人,1988,Arch.Biochem.Biophys,;Galkin等人,1997,Protein Eng.Carugo等人,1997,Proteins 2810-28;Hurley等人,1996,Biochem,8Holmberg等人,1999,Protein Eng.)。
按照本发明,意外发现若在种子内表达胰岛素,优选以在种子细胞内的胰岛素多肽被隔离在膜包围的细胞内区室中的方式表达,则胰岛素在植物种子中可累积到前所未有的水平。在本发明优选的实施方案中,胰岛素多肽被隔离在ER或ER衍生的储存小泡内。为实现胰岛素在ER或ER衍生的储存小泡内的这种累积,按照本发明,将编码胰岛素的多肽连结至造成胰岛素多肽被保持在ER或ER衍生的储存小泡内的多肽,而非从ER转运出,例如转运到质外体。可以用于本发明的、保持胰岛素多肽在ER中的多肽包括能够将胰岛素隔离在ER中的任何多肽。这种多肽可以合成或得自任何生物来源。在本发明的优选实施方案中,能够保持胰岛素的多肽是包含C-末端ER保留基序的多肽。这种C-末端ER保留基序例子包括KDEL、HDEL、DDEL、ADEL和SDEL序列(分别为SEQ ID NO150-154)。其它例子包括HDEF(SEQ ID NO155)(Lehmann等人,2001,Plant Physiol127(2)436-49),或靠近位于2和3、3和4或4和5位置的两个精氨酸残基(Abstract from Plant Biology 2001 Program,ASPB,2001年7月,Providence,Rhode Island,USA)。编码C-末端ER保留基序的核酸序列优选连接到编码胰岛素多肽的核酸序列,其方式为把能够将胰岛素保持于ER内的多肽连接到胰岛素多肽的C-末端。
为了在ER衍生的储存小泡内隔离胰岛素多肽,将胰岛素多肽连接到能够将胰岛素多肽保持在ER衍生的储存小泡内的多肽。本发明中可以使用的能够将胰岛素多肽保持在ER衍生的储存小泡内的多肽可以是能够将胰岛素多肽隔离在ER衍生的储存小泡内的任何多肽。能够将胰岛素保持在ER衍生的储存小泡内的多肽可以合成或得自任何生物来源。在优选的实施方案中,ER衍生的储存小泡是油体,而胰岛素多肽连接到油体蛋白质或其能够将胰岛素多肽保持在ER衍生的储存小泡内的足够部分。在此方面可用的油体蛋白质包括天然与油体结合的任何蛋白质。特别优选的油体蛋白质为油质蛋白。例如芥油质蛋白(van Rooiien et al.(1991)Plant Mol Biol.9)玉米油质蛋白(Bowman-Vance等人,1987,J.Biol.Chem.79;Qu等人,1990,J.Biol.Chem.3)胡萝卜油质蛋白(Hatzopoulos et al.(1990)Plant Cell )或芸苔(Brassica)油质蛋白(lee等人,1991,Plant Physiol.7),油体钙蛋白(caleosin),见例如Genbank登记号AF067857)以及油体固醇蛋白(steroleosin)(Lin等人,2002,Plant Physiol.128(4)1200-11)。在又一优选的实施方案中,油体蛋白质是植物油质蛋白,且与其它植物油质蛋白,如从拟南芥(SEQ ID NO156)或油菜(Brassica napus)(SEQ ID NO157)分离的油质蛋白,具有序列相似性。在另一实施方案中,油体蛋白质是得自植物、真菌或其它来源的油体钙蛋白或钙结合蛋白,并与油体蛋白质如分离自拟南芥的油质蛋白(SEQ ID NO158和SEQ ID NO159)具有序列同源性。在另一实施方案中,油体蛋白质为油体固醇蛋白(SEQ ID NO160),是一种固醇结合脱氢酶(Lin L-J等人,(2002),Plant Physiol 1)。编码胰岛素的多肽可以连接于油体蛋白质的N-末端以及C-末端及油体蛋白质的片段,如例如油质蛋白的中心结构域。例如通过制备油体(制备油体的方法学见例如美国专利6,650,554)及鉴定油体制备物中的蛋白质通过例如SDS凝胶电泳可以发现新的油体蛋白质。可以产生针对这些蛋白质的多克隆抗体并用于筛选cDNA文库以鉴别编码油体蛋白质的核酸序列。新的油体蛋白质可以进一步使用已知的编码油体蛋白质的核酸序列发现,使用例如本文提及的编码油体蛋白质的油体蛋白质序列,探查例如cDNA或基因组文库确定油体蛋白质的存在。
能够把胰岛素保持在ER或ER衍生的储存细胞器内的多肽典型地是不会被裂解的,而且胰岛素可以融合蛋白质的形式累积,其是例如在典型地使用KDEL保留信号来保持多肽于ER内时或使用油体蛋白质来保持多肽于ER衍生的储存细胞器内时的情况。
嵌合核酸序列可另含有把核酸序列靶向内膜系统的核酸序列(“信号肽”)。在本发明使用能够把多肽保持于ER内的序列,如KDEL、HDEL或SDEL多肽把胰岛素多肽保持在ER内的实施方案中,特别希望包括编码信号肽的核酸序列。此处可用的信号肽例子包含烟草发病相关蛋白(tobacco pathogenesis related protein)(PR-S)信号序列(SEQ ID NO161)(Siimons等人,1990,Bio/technology,)、凝集素信号序列(Boehn等人,2000,Transgenic Res.9(6)477-86),来自菜豆(Phaseolus vulgaris)富羟脯氨酸的糖蛋白的信号序列(Yan等人,1997,Plant Phyiol,115(3)915-24和Corbin等人,1987,Mol Cell Biol 7(12)4337-44)、马铃薯patatin信号序列(Iturriaga,G等人,1989,Plant Cell 和Bevan等人,1986,Nuc.AcidsRes.8)以及大麦α-淀粉酶信号序列(Rasmussen和Johansson,1992,Plant Mol.Biol.18(2)423-7)。此种靶向信号可在体内从胰岛素序列中裂解,典型地例如使用质外体靶向信号,如烟草发病相关蛋白-S(PR-S)信号序列(Sijmons等人,1990,Bio/technology,)的情况。其它信号肽可以使用SignalP万维网服务器预计(http//www.cbs.dtu.dk/services/SignalP),其预计不同生物体的氨基酸序列中信号肽裂解位点的存在和位置。一般而言,一级氨基酸序列极少有保守,不过,一般生理化学性质保守到某些程度。信号肽的概括结构有3区,短氨基末端“n区”,含带正电荷残基,中央疏水性“h区”大小范围在7至15个氨基酸,和羧基末端“C区”,含极性氨基酸,以及由膜结合信号肽酶可识别的裂解位点(Nakai K.,2000,Advances in Protein Chem )。可以用于本发明的靶向信号包括天然胰岛素信号序列(以人序列而言,长度为24个氨基酸)。在优选实施方案中,位于N末端的质外体靶向序列,如上述烟草PR-S序列,与位于C末端的ER保留序列,如KDEL序列组合使用。
在另一优选实施方案中,编码酵母α-因子前导序列的核酸序列与编码胰岛素的核酸序列的N末端连接。可以用于本发明的酵母前导序列或从酵母前导序列衍生的序列包括SEQ ID NO162至SEQ IDNO171所列序列(Kjeldsen等人,2001,Biotechnology and GeneticEngineering Reviews )。这种前导序列可以还包括位于编码前导序列的核酸C末端和编码胰岛素的序列N-末端的间隔肽(spacerpeptide)。按照本文,所述间隔序列典型长度在2和20个氨基酸之间。因此,例如可使用间隔序列的SEQ ID NO172和SEQ ID NO173(Kjeldsen等人,2001,Biotechnology and Genetic EngineeringReviews )。在本发明使用酵母前导序列的实施方案中,核酸序列编码的胰岛素多肽优选是微型胰岛素多肽。按照本文,在特别优选的实施方案中,使用与编码酵母分泌前导肽的核酸序列连接的、编码单链抗体的核酸序列,详述于实施例1。
嵌合核酸序列亦可包括造成N-和/或C-末端稳定蛋白质伸展的多肽。此种伸展可用来稳定和/或有助于胰岛素多肽链的折叠并另外可用于帮助纯化胰岛素。在这方面可用的多肽伸展包括例如编码单链抗体的核酸序列、编码Affibody?分子(Affibody AB)的核酸、编码霍乱毒素的无毒性B亚基(CTB)的核酸序列(Arakawa,T.等人,1998,Nat.Biotechnol,16938)或这些多肽的组合。在特别优选的实施方案中,通过使用例如上述KDEL序列,结合使用与允许胰岛素多肽与油体结合的稳定多肽,当发生植物细胞的完整性断裂时,例如当从植物细胞回收胰岛素多肽时,胰岛素多肽可被保持于膜包围的区室内,如ER内。此种稳定多肽的例子为单链抗体,其具有油体特异性。编码具有油体特异性的单链抗体的核酸序列可以从表达针对油体蛋白质的单克隆抗体的杂交瘤细胞系制备。在一个实施方案中,单链抗体特异性结合油质蛋白,如Alting-Mees等,(2000)IBC’s InternationalConference on Antibody Engineering,Poster#1。本发明的这个实施方案详见实施例1所述。
在又一实施方案中,裂解位点可位于胰岛素的N末端上游和C末端下游,使胰岛素多肽可从融合配偶体(partner)中裂解,而得分离的胰岛素。如此裂解位点的例子可见于WO98/49326(Method for thecleavage of fusion proteins)和相关申请以及lavallie等人(1994)Enzymatic and chemical cleavage of fusion proteins In Current Protocolsin Molecular Biology,16.4.5-16.4.17页,John Wiley & Sons,Inc.,NewYork NY。在优选的实施方案中,裂解位点是四元接头(例如Arg-Arg-Lys-Arg-SEQ ID NO149),其被胰蛋白酶裂解。在另一优选实施方案中,裂解位点为KLIP 8(SEQ ID NO174),其被包括凝乳酶的天冬氨酸蛋白酶裂解。
本发明又提供了从宿主细胞组分中分离异源蛋白质的方法,通过将油体级分分配,随后经由异源蛋白质-油体蛋白质融合体的特异性裂解,释放出异源蛋白质。任选裂解位点可位于异源多肽的N末瑞上游和C末端下游,使融合多肽裂解,并可利用相分离分离为其组分肽。
通过优化核酸序列使其使用选择用来表达胰岛素多肽的特定植物细胞类型的优选密码子使用,或通过改变已知的去稳定mRNA的基序可以改变编码胰岛素的核酸序列,以进一步改良表达水平(例如参见PCT专利申请97/02352)。把编码胰岛素多肽的核酸序列的密码子使用与植物细胞类型的密码子使用加以比较,得以识别可以被改变的密码子。通过改变密码子使用以构建合成基因见例如PCT专利申请93/07278所述。
在优选实施方案中,使用的编码胰岛素的核酸序列如SEQ IDNO1、SEQ ID NO3、SEQ ID NO5或SEQ ID NO195号所示。
按照本文,编码胰岛素的核酸序列连接于能够在植物种子细胞内控制胰岛素多肽表达的启动子。因此,本发明亦提供了连接于能够在植物种子细胞内控制表达的启动子的、编码胰岛素的核酸序列。在此可用的启动子为本领域已知,包括能够控制多肽在植物内表达的、任何植物衍生的启动子。一般而言,按照本文选用双子叶植物时,可用从双子叶植物物种所得的启动子,而选用单子叶植物物种时,可用单子叶植物启动子。可用的组成型启动子包括例如35S花椰菜花叶病毒(CaMV)启动子(Rothstein等人,1987,Gene )、稻肌动蛋白启动子(McElroy等人,1990,Plant Cell ;美国专利6,429,357)、遍在蛋白启动子,如玉米遍在蛋白启动子(美国专利5,879,903;5,273,894号),以及香芹遍在蛋白启动子(Kawalleck,P.等人,1993,Plant Mol.Biol.)。
在优选的实施方案中,所用启动于是导致胰岛素多肽在种子组织中优先表达的启动子。在此方面“种子偏好启动子”是控制重组蛋白质(即胰岛素)表达的启动子,故优选成熟植物内存在的重组蛋白质总量的至少80%存在于种子内。更优选成熟植物内存在的重组蛋白质总量的至少90%存在于种子内。最优选成熟植物内存在的重组蛋白质总量的至少95%存在于种子内。在此方面可用的种子偏好启动子包括例如菜豆蛋白启动子(Sengupta-Gopalan等人,1985,Proc.Natl.Acad.Sci.USA 4)芥18kDa油质蛋白启动子(美国专利5,792,922)或亚麻油质蛋白启动子(WO 01/16340);亚麻豆球蛋白样种子贮存蛋白(linin)启动子(WO 01/16340);亚麻2S贮存蛋白启动子(WO 01/16340);胚乳偏好启动子,如Amy32b启动子(Rogers &Milliman,J.Biol.Chem.,34-12240)、Amy6-4启动子(Kursheed & Rogers,J.Biol.Chem.,53-18960)或Aleurain启动子(Whittier等人,1987,Nucleic Acids Res.,5)或豆arcelin启动子(Jaeger GD等人,2002,Nat.Biotechnol.Dec;)。多种植物中可用的新启动子持续被发现。许多植物启动子的例子可见于Ohamuro等人(Biochem.of Plnts.,)。
在此可用某些能够增强胰岛素多肽表达的遗传元件。这些元件包括来自某些病毒的非翻译前导序列,如AMV前导序列(Jobling andGehrke,1987,Nature,)以及与玉米遍在蛋白启动子相关的内含子(美国专利5,504,200)。一般而言,可制备嵌合核酸序列,以便能够增强表达的遗传元件可位于编码胰岛素多肽的核酸序列的5’处。
按照本发明,包括能够在植物种子内控制表达的启动子的核酸序列连接于编码胰岛素多肽的核酸序列,其可整合于重组表达载体内,确保在种子细胞内的良好表达。因此,本发明包含重组表达载体,其在转录的5’至3’方向包括下列可操纵连接的组分(i)能够在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列;其中表达载体适于在种子细胞内表达。术语“适于在种子细胞内表达”指重组表达载体包括本发明的嵌合核酸序列,其连接到实现在种子细胞内表达所需的遗传元件。在此方面,表达载体内可包含的遗传元件包括转录终止区、一或多个编码标志基因的核酸序列、一或多个复制起点等。在优选实施方案中,表达载体又包括把载体或其一部分整合入植物细胞核基因组内所需的遗传元件,例如T-DNA左和右边界序列,其在本发明的使用土壤杆菌(Agrobacterium)转化植物细胞的实施方案中,促进整合进植物核基因组内。
如前述,重组表达载体一般包括转录终止子,其除了用做转录终止信号外,又可做为能够延长mRNA半衰期的保护元件(Guarneros等人,1982,Proc.Natl.Acad.Sci.USA,)。转录终止子一般从约200个核苷酸到约1000个核苷酸,并制备表达载体,以便转录终止子位于编码胰岛素的核酸序列的3’处。于此可用的终止序列包括例如胭脂氨酸终止区(Bevan等人,1983,Nucl.Acids.Res.)、菜豆蛋白终止子(van der Geest等人,1994,Plant J.)、arcelin终止子(Jaeger GD等人,2002,Nat.Biotechnol.Dec;)、根癌农杆菌(Agrobacterium tumefaciens)的章鱼碱合酶基因的终止子或其它类似的功能元件。转录终止子可按An所述获得(An,1987,Methods in Enzym.153292)。
按照本发明,表达载体还可含有标记基因。本发明可用的标记基因包括可分辨转化细胞与非转化细胞的所有基因,包括所有可选择和可筛选标记基因。标记基因可为抗性标记,如抗生素抗性标记,例如抗卡那霉素(美国专利6,174,724)、氨苄青霉素、G418、博来霉素、潮霉素,其使得可以利用化学手段或针对化学剂,如通常植物毒性甘露糖的耐受性标记(Negrotto等人,2000,Plant cell Rep.)选择特性。于此可用的其它方便标记包括能够输送抗除草剂如草甘膦(glyphosate)(美国专利4,940,935;5,188,642)、草铵膦(phosphinothricin)(美国专利5,879,903)或磺酰基脲(美国专利5,633,437)的抗性的标记。抗性标记当连接于编码胰岛素多肽的核酸序列附近时,可用来维持对尚未失去编码胰岛素多肽的核酸序列的植物细胞或植物群的选择压力。可用来通过目测检查鉴定转化体的可筛选标记包括β-葡糖醛酸酶(GUS)(美国专利5,268,463和5,599,670)以及绿色萤光蛋白(GFP)(Niedz等人,1995,Plant Cell Rep.,14403)。
适合把核酸序列导入植物内的重组载体包括基于土壤杆菌属和根瘤菌属(Rhizobium)的载体,如Ti和Ri质粒,包括例如pBIN19(Bevan,Nucl.Acid.Res.,-8721)、pGKB5(Bouchez等人,1993,C R Acad.Sci.Paris,Life Sciences,3)、pCGN系列双元载体(McBride和Summerfelt,1990,PlantMol.Biol.)以及其它双元载体(例如美国专利4,940,838)。
本发明的重组表达载体、核酸序列和嵌合核酸序列可按照分子生物学领域技术人员熟知的方法学制备。这些制法典型地涉及大肠杆菌(Escherichia coli)菌种以及中间克隆宿主。大肠杆菌载体和植物转化载体的制备可用通常已知技术完成,如限制消化、连接、凝胶电泳、DNA测序、聚合酶链反应(PCR)及其它方法学。这些方法学允许连接本发明涉及的核酸序列和多肽。有多种克隆载体可进行制备重组表达载体所需的必要步骤。在大肠棹菌内具有复制系统功能的载体当中,有如pBR322载体、pUC系列载体、M13mp系列载体、pBluescript等。典型地,这些克隆载体含有标记,以便选择转化细胞。核酸序列可导入这些载体内,而载体可导入在适当培养基内生长的大肠杆菌内。重组表达载体在收获和裂解细胞时,可容易地从细胞回收。再者,关于重组载体制备的一般指导可例如参见Sambrook等人,MolecularCloning,a Laboratory Manual,Cold Spring Harbor Press,1989,第3卷。
制备包括能够表达胰岛素的种子的植物按照本发明,嵌合核酸序列被导入植物细胞内,而细胞成长为可结种子的成熟植物,其中种子表达胰岛素多肽。
依此,可选择任何植物物种或植物细胞。于此使用的特殊细胞包括从拟南芥、巴西坚果(Betholettia excelsa)、蓖麻子(Riccinuscommunis)、椰子(Cocus nucifera)、胡荽(Coriandrum sativum)、棉花(Gossypium spp.)、落花生(Arachis Hypogaea)、加州希蒙得木(Simmondsia chinensis)、亚麻子/亚麻(Linum usitatissimum)、玉米(Zeamays)、芥菜(Brassica spp.和Sinapis alba)、油椰子(Elaeis guineeis)、橄榄(olea eurpaea)、油菜籽(Brassica spp.)、稻(Oryza sativa)、红花(Carthamus tinctorius)、大豆(Glycine max)、南瓜(Cucurbita maxima)、大麦(Hordeum vulgare)、小麦(Traeticum aestivum)和向日葵(Helianthusannuus)获得的细胞。
根据本文优选的实施方案,使用得自含油种子植物的植物物种或植物细胞。此处可用的含油种子植物包括花生(Arachis hypogaea)、芥菜(Brassica spp.和Sinapis alba)、油菜籽(Brassica spp.)、鹰嘴豆(Cicerarietinum)、大豆(Glycine max)、棉花(Gossypium hirsutum)、向日葵(Helianthus annuus)、(Lentil Lens culinaris)、亚麻子/亚麻(Linumusitatissimum)、白三叶草(Trifolium repens)、橄榄(olea eurpaea)、油椰子(Elaeis guineeis)、红花(Carthamus tinctorius)和narbon豆(narbonbean)(Vicia narbonensis)。
根据本文一个特别优选的实施方案,使用红花、拟南芥或亚麻。
把植物重组表达载体导入植物细胞内的方法学,在此也称为“转化”,为本领域熟知,典型地根据选择的植物细胞而变化。把重组表达载体导入细胞内的一般技术包括电穿孔、化学介导的技术,例如CaCl2介导的核酸摄取颗粒撞击(biolistics);使用天然感染核酸序列,例如病毒衍生的核酸序列,或土壤杆菌属或根瘤菌属衍生序列、聚乙二醇(PEG)介导的核酸摄取,微注射以及使用碳化硅晶须。
在优选实施方案中,选用转化方法,其使嵌合核酸序列整合入植物细胞基因组内,且优选植物细胞核基因组。依此,这视为特别希望的,因为使用此方法将在有性生殖时得以把嵌合核酸序列转移给子代植物。在此方面可用的转化方法包括颗粒撞击和土壤杆菌介导的方法。
双子叶植物物种的转化方法是熟知的。一般而言,使用土壤杆菌介导的转化,因其效率高而且即使不是全部,也是许多双子叶植物物种通常有易感性。土壤杆菌转化一般涉及转移双元载体,如上述双元载体之一,其包括将本发明的嵌合核酸序列从大肠杆菌转移到适当的土壤杆菌菌株(例如EHA101和LBA4404),通过例如利用携带重组双元载体的大肠杆菌菌株以及携带能够动用双元载体至靶土壤杆菌菌株的辅助质粒的大肠杆菌菌株的三亲交配,或通过土壤杆菌菌株的DNA转化(Hofgen等人,Nucl.Acids Res.,)进行。可用来转化双子叶植物细胞的其它技术包括颗粒撞击(Sanford,1988,Trends in Biotechn.,);电穿孔(Fromm等人,1985,Proc.Natl.Acad.Sci.USA.,8);PEG介导的DNA摄取(Potrykus等人,1985,Mol.Gen.Genetics,);微注射(Reich等人,Bio/Techn.,-1004);以及碳化硅晶须(Kaeppler等人,1990,Plant Cell Rep.,)或使用例如浸汲法(flower dippingmethodology)的植物体内(in planta)转化(Clough和Bent,1998,Plant J.,)。
单子叶植物物种可用多种方法转化,包括颗粒撞击(Christou等人,1991,Biotechn.Weeks等人,Plant Physiol.,7-1084;Gordon-Kamm等人,Plant Cell,-618)PEG介导的DNA摄取(欧洲专利92225)或土壤杆菌介导的转化(Goto-Fumiyuki等人,1999,Nature-Biotech,)。
根据选作转化细胞靶的植物物种和植物细胞类型(例如幼苗衍生细胞类型,如下胚轴和子叶或胚组织),可以稍微变化确切的植物转化方法。上述特别优选的实施方案中,使用红花、拟南芥或亚麻。获得红花转化体的方法可见Baker和Dyer(Plant Cell Rep.,-110)。其它植物物种特异转化方案可见于Biotechnology inAgriculture and Forestry 46Transgenic Crops I(Y.P.S.Bajaj编),Springer-Verlag,New York(1999),Biotechnology in Agriculture andForestry 47Transgenic Crops II(Y.P.S.Bajaj编),Springer-Verlag,NewYork(2001)。
转化后,植物细胞成长,出现分化组织,如芽和根,再生成熟植物。典型地再生多个植物。植物再生方法一般是植物物种和细胞类型依赖性的,本领域技术人员已知。有关植物组织培养的进一步指导可参见例如Plant Cell and Tissue Culture,1994,Vasil和Thorpe编,Kluwer Academic Publishers;以及Plant Cell Culture Protocols(Methodsin Molecular Biology 111),1999,Hall编,Humana Press。
一方面,本发明提供了包括胰岛素的植物种子的回收方法。因此,本发明提供了包括胰岛素的植物种子的获得方法,包括(a)提供嵌合核酸构建体,在转录的5’至3’方向包括下列可操纵连接的组分(i)能够在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;(c)令植物细胞成长为能够结种子的成熟植物;和
(d)从该植物取得种子,其中种子包括胰岛素。
在优选的实施方案中,多个转化植物被获得、生长、筛选所需嵌合核酸序列存在,可利用例如在使用除草剂抗性标记的选择性培养基上生长,通过将除草剂直接施于植物,或利用Southern印迹测试推定的转化体的存在。如果检测到嵌合核酸序列的存在,可选择转化植物以产生子代和最终的成熟植物,其包括多个种子,种子包含所需的嵌合核酸序列。这些种子可用来分离胰岛素,或经种植以产生二代或更多后代。一般需将多个转基因种子种植以获得转基因植物群,每个均包括含有编码胰岛素的嵌合核酸序列的种子。此外,一般需确保植物的纯合性,以确保重组多肽的连续遗传。纯合植物的选择方法为本领域技术人员所熟知。可用的纯合植物获得方法包括制备和转化单倍体细胞或组织,接着再生单倍体幼苗,随后例如以秋水仙碱(colchine)或其它微管破坏剂处理,转变成二倍体植物。植物可依其它常规农业惯例成长。
另一方面,本发明亦提供了能够结表达胰岛素的种子的植物。在本发明优选的实施方案中,能够结种子的植物包括嵌合核酸序列,其在5’至3’转录方向包括(a)能够在植物种子细胞内控制表达的第一核酸序列,其可操纵地连接于;(b)编码胰岛素多肽的第二核酸序列,其中种子含有胰岛素。
在优选的实施方案中,嵌合核酸序列稳定整合于植物核基因组。
又一方面,本发明提供了表达胰岛素的植物种子。在本发明优选的实施方案中,植物种子包括嵌合核酸序列,其在5’至3’转录方向包括(a)能够在植物种子细胞内控制表达的第一核酸序列,其可操纵地连接于;(b)编码胰岛素多肽的第二核酸序列。
按照本发明,所得种子内优选存在的总可溶性蛋白质的至少0.1%为胰岛素。在本发明又一优选实施方案中,所得种子内存在的总可溶性蛋白质的至少0.2%、0.3%、0.5%或1.0%为胰岛素。胰岛素多肽可以存在于多种不同形式的种子细胞中,例如下胚轴和胚轴,包括在胚根和胚叶中,若为单子叶植物物种,包括谷类和玉米,用于胚乳组织内。
从植物种子制备胰岛素一旦已获得植物种子,即可使用本领域已知的任何蛋白质纯化方法从种子中纯化胰岛素蛋白质。因此,本发明提供了从植物种子纯化胰岛素的方法,其中所述方法包括(a)提供嵌合核酸构建体,其在5’至3’转录方向包括下列可操纵连接的组分(i)能够在植物种子细胞内控制表达的核酸序列;和(ii)编码胰岛素多肽的核酸序列;(b)把嵌合核酸构建体导入植物细胞内;(c)令植物细胞成长为可结种子的成熟植物,其中种子表达胰岛素;(d)获得表达胰岛素的种子;以及(e)从种子中纯化所述胰岛素。
植物种子可用任何粉碎方法研磨,将种子细胞膜和细胞壁实质破坏。干法和湿法研磨条件均可用(美国专利3,971,856;Lawhon等人,1977,J.Am.oil Chem.Soc.,)。在此方面,适当的研磨设备包括胶体磨碎机、圆盘式磨碎机、IKA磨碎机、工业级匀浆器等。选用研磨设备依赖于种子类型和产量要求。固体种子污染物,如种子壳、纤维物质、不溶性碳水化合物、蛋白质及其它水不溶性污染物,可用例如基于大小排阻的方法,如过滤或基于重力的方法,如离心,从种子级分中除去。在优选的实施方案中,避免使用油提取中常用的有机溶剂,如己烷,因为此类溶剂有损胰岛素多肽。从种子可回收基本上纯的胰岛素,可用多种附加纯化方法,如基于离心的技术;基于大小排阻的方法,包括例如膜超滤和交叉流动超滤(crossflowultrafiltration);以及层析技术,包括例如离子交换层析、大小排阻层析、亲和层析、高效液相层析(HPLC)、快速蛋白质液相层析(FPLC)、疏水性相互作用层析等。一般而言,可用这些技术的组合获得基本上纯的胰岛素。
在本发明特别优选的实施方案中,通过将胰岛素多肽和油体接触而从种子污染物中分离胰岛素多肽。这个方法被认为是特别有利的,因为其允许以特别有效和便宜的方式除去种子污染物,包括种子蛋白质。如前所述,胰岛素多肽和油体的接触可以通过将胰岛素多肽连接于油体蛋白质或通过将胰岛素多肽连接于对油体具有亲和性的多肽如对油体具有亲和性的单链抗体来实现。在前一个实施方案中,胰岛素多肽被隔离在油体上的细胞内,因此可以和油体共同纯化。在后一个实施方案中,胰岛素多肽在膜包围的细胞内区室中表达时,在粉碎过程中种子细胞破碎时其将和油体结合。分离油体的方法如美国专利5,650,554所述。
药学胰岛素制剂可由纯化的胰岛素制备,这种制剂可用来治疗糖尿病。一般而言,纯化的胰岛素可与药学可接受的载体或稀释剂混合,其量足以对治疗患者实施治疗上有用的效果,而无不良副作用。为配制胰岛素组合物,将胰岛素重量级分以有效浓度溶解、悬浮、分散或其它方式混合于选用的载体或稀释剂内,以使治疗状况获得改善。药学胰岛素制剂优选配制为单次剂量施用。人胰岛素用于肠胃外输送的治疗有效量是本领域熟知的。使用胰岛素类似物或使用其它输送模式时,其治疗有效剂量可以备本领域技术人员使用已知测试方案或利用体内或体外测试数据推断,可容易地靠经验确定。然而,应理解浓度和剂量可按照减轻的病症的严重性而变化。又应理解针对任何特定对象,特异的剂量方案可根据施用或监督施用所述制剂的人员的个人判断随时间调整。
药学溶液或悬浮液可包括例如无菌稀释剂,例如水、乳糖、蔗糖、磷酸二钙或羧甲基纤维素。可用载体包括水、盐水溶液、葡萄糖水溶液、甘油、乙二醇、乙醇等,由此形成溶液或悬浮液。如有需要,药物组合物亦可含有无毒性辅助物质,如润湿剂;乳化剂;稳定剂;抗微生物剂,如苄醇和甲基安息香酸酚酯(methyl parabens);抗氧化剂,如抗坏血酸和亚硫酸氢钠;螯合剂,如乙二胺四乙酸(EDTA);pH缓冲剂,如乙酸盐、柠檬酸盐或磷酸盐缓冲液;及其组合。
胰岛素制品的最后制剂一般依赖于胰岛素输送模式而定。按照本发明制成的胰岛素可以任何所需方式输送;然而,胃肠外、口服、肺、口腔、鼻的输送形式视为最可能使用的输送模式。胃肠外制品可装在安瓿(ampoule)、用完即弃的注射器、玻璃、塑料或其它适当材料制成的单剂量或多剂量的小瓶内。
实施例提供下列实施例以供说明,而非限制。
实施例1制备表达为具有胰蛋白酶可裂解的前肽的微型胰岛素(MI)融合蛋白的胰岛素蛋白构建pSBS4404PRS-D9scFv-Klip27-MI-KDEL融合蛋白所研究的融合蛋白之一以烟草病原相关序列(PRS)开始(Sijmons等人,1990,Bio/technology,)开始,其作为信号肽以共翻译方式将表达靶定于ER。紧接下游为编码对拟南芥的18kDa油质蛋白具有特异性亲和性的单链Fv抗体(scFv)的序列,所述单链Fv抗体命名为D9scFv,接着是衍自酵母的TA57前肽的胰蛋白酶可裂解前肽(KLIP27)(Kjeldsen等人,2001,Biotechnology and GeneticEngineering Reviews )。这随后是微型胰岛素(MI),如Kjeldsen等人(2001)所述,在所述多肽的C末端添加了KDEL ER保留信号。
此质粒的主链pSBS4055是基于植物双元载体pPZP200,如Hajdukiewicz等人所述(Plant Molecular Biology,-994)。代替所述多克隆位点,以香芹(Petroselinum crispum)的遍在蛋白启动子/终止子驱动(Kawalleck等人,1993,Plant.Mol.Bio.,)、赋予宿主植物草铵膦抗性的pat基因(Wohlleben等人,1988,Gene 7025-37)插于左和右边界序列之间。除此盒外,亚克隆了驱动PRS的菜豆(phaseolus vulgaris)的β-菜豆蛋白启动子/终止子(Slightom等人,1983,Proc.Natl.Acad.Sc.USA 1)。使用标准PCR(Horton等人,1989,Gene 7761-68)把具有所附SphI/HindIII限制内切核酸酶位点的合成PRS-编码序列融合于菜豆蛋白启动子的3’端以产生pSBS4011。利用D9scFv cDNA克隆的PCR扩增产生SphI-D9scFv-XhoI,SwaI,HindIII插入序列(Sean Hemmingsen lab,未出版),其具有引物1325(GCATGCTGACATTGTGATGACACAGTC)-SEQ ID NO175和引物1326(AAGCTTGCATTTAAATACTCGAGACTGTGAGAGTGGTGCCTTG)-SEQ ID NO176。此片段随后在pSBS4011的SphI/HindIII位点的连接产生质粒pSBS4055。
Klip27-MI序列是由四种部分重叠的寡核苷酸合成,其掺入了拟南芥密码子使用,以提高在基于植物的表达系统中的有效翻译的成功。寡核苷酸1324(GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)-SEQ ID NO177和1323(CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAACA)-SEQ ID NO178,在其互补20个核苷酸重叠处退火,延伸形成Klip27-MI融合物的5’端,同时对寡核苷酸1322(CTAAGGCTGCTAAGGGAATTG)-SEQ ID NO179和1321(AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)-SEQ ID NO180进行相同处理形成3’端。在用Bsu36I限制消化后,将二半部分连接,产生完整的Klip27-MI编码序列。此基因融合物的PCR使用引物1364(CTCGAGTCAACCAATTGATGACACTGAATC)-SEQ ID NO181和1334(AAGCTTCAAAGTTCATCCTTGTTGCAATAGTTCTCCAATTG)-SEQ ID NO182附着了5’XhoI限制内切核酸酶裂解位点和3’KDEL DNA序列加上HindIII裂解位点,供随后连接入XhoI/HindIII切口pSBS4055。结果是质粒pSBS4404编码PRS-D9scFv-Klip27-MI-KDEL融合蛋白的DNA序列置于是在菜豆蛋白启动子/终止子的表达控制下双元载体内。菜豆蛋白启动子在种子发育期间控制转基因的时间特异性和组织特异性表达。4404胰岛素融合蛋白(PRS-D9scFv-Klip27-MI-KDEL)的完整核酸序列(SEQ IDNO1)和氨基酸序列(SEQ ID NO2)示于图1。
构建pSBS4405OLEO-Klip8-Klip27-MI融合蛋白所研究的第二融合蛋白以拟南芥的18kDa油质蛋白开始,在框内随后是凝乳酶可裂解前肽(Klip8)-SEQ ID NO175。紧接下游是衍自酵母的TA57前肽的编码胰蛋白酶可裂解前肽(Klip27)的序列,如上述(Kjeldsen等人,2001,Biotechnology and Genetic EngineeringReviews )。此融合于上述微型胰岛素(MI)(Kjeldsen等人,2001)。此融合蛋白的表达靶定在胚发育当中形成的初生(nascent)油体。
此质粒的主链pSBS4055是基于植物双元载体pPZP200,如Hajdukiewicz等人所述(Plant Molecular Biology,-994)。代替所述多克隆位点,由香芹的遍在蛋白启动子/终止子驱动(Kawalleck等人,1993,Plant.Mol.Bio.,)、赋予宿主植物草铵膦抗性的pat基因(Wohlleben等人,1988,Gene 7025-37)插入于左和右边界序列之间。除此盒外,亚克隆了驱动芥18kDa油质蛋白基因组序列Klip8融合的、菜豆β-菜豆蛋白启动子/终止子(Slightom等人,1983,Proc.Natl.Acad.Sc.USA 1)。使用标准PCR(Horton等人,1989,Gene 7761-68)把具有所附XhoI/HindIII限制内切核酸酶位点的油质蛋白基因Klip8序列融合于菜豆蛋白启动子的3’端,生成pSBS4010。
Klip27-MI序列由四种部分重叠的寡核苷酸合成,其掺入了拟南芥密码子使用,以提高基于植物的表达系统的有效翻译的成功。寡核苷酸1324(GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)-SEQ ID NO177和1323(CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAACA)-SEQ ID NO178在其互补的20个核苷酸重叠处退火,并延伸形成Klip27-MI融合的5’端,对寡核苷酸1322(CTAAGGCTGCTAAGGGAATTG)-SEQ ID NO179和1321(AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)-SEQID NO180进行相同处理形成3’端。用Bsu36I限制消化之后,将二半部分连接,形成全Klip27-MI编码序列。此基因融合的PCR使用引物1364(CTCGAGTCAACCAATTGATGACACTGAATC)-SEQ IDNO181和1329(AAGCTTCAGTTGCAATAGTTC)-SEQ ID NO183分别附着了5’XhoI限制内切核酸酶裂解位点和3’HindIII裂解位点,供随后连接于XhoI/HindIII切口pSBS4010。结果为质粒pSBS4405编码油质蛋白Klip8-Klip27-MI融合蛋白的DNA序列置于在菜豆蛋白启动子/终止子的表达控制下的双元载体内。菜豆蛋白启动子在种子发育期间控制转基因的时间特异性和组织特异性表达。4405胰岛素融合蛋白(OLEO-Klip8-Klip27-MI)的完整核酸序列SEQ ID NO3和氨基酸序列SEQ ID NO4如图2所示。
构建pSBS4414PRS-MI-四元接头-D9scfv-KDEL融合蛋白所研究另一融合蛋白以烟草病原相关序列(PRS)开始(Sijmons等人,1990,Bio/technology,),其用做以共翻译方式将表达靶定于ER的信号肽。紧接下游是编码微型胰岛素(MI)的序列,如Kjeldsen等人(2001)所述,除了微型C前肽区(AAK-SEQ ID NO146)用人胰岛素的B(1-29)和A(1-21)链之间的间插B30苏氨酸四元位点(B30T-RRKR)序列(SEQ ID NO149)序列取代。紧接着编码第二个四元接头的序列,接着是对拟南芥的18kDa油质蛋白具有物种特异性亲和性的单链Fv抗体(scFv),称为D9scFv。在多肽的C末端,添加了KDEL ER保留信号。
此质粒主链pSBS4055是基于植物双元载体pPZP200,如Hajdukiewicz等人所述(Plant Molecular Biology,-994)。代替上述多克隆位点,由香芹的遍在蛋白启动子/终止子驱动(Kawalleck等人,1993,Plant.Mol.Bio.,)、赋予宿主植物草铵膦抗性的pat基因(Wohlleben等人,1988,Gene 7025-37)插入于左和右边界序列之间。除此盒外,亚克隆了驱动PRS、来自菜豆的β-菜豆蛋白启动子/终止子(Slightom等人,1983,Proc.Natl.Acad.Sc.USA 1)。使用标准PCR(Horton等人,1989,Gene 7761-68)把具有所附SphI/HindIII限制内切核酸酶位点的合成PRS编码序列融合于菜豆蛋白启动子的3’端,产生pSBS4011。
Klip27-MI序列由四种部分重叠的寡核苷酸合成,其掺入了拟南芥密码子使用,以提高基于植物的表达系统的有效翻译的成功。寡核苷酸1324(GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)SEQ ID NO177和1323(CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAACA)SEQ ID NO178在其互补的20个核苷酸重叠处退火,并延伸形成Klip27-MI融合的5’端,对寡核苷酸1322(CTAAGGCTGCTAAGGGAATTG)SEQ ID NO179和1321(AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)SEQID NO180进行相同处理,形成3’端。用Bsu36I限制消化后,将二半部分连接,生成全Klip27-MI编码序列。此基因融合的PCR使用引物1363(GCATGCCCAACCAATTGATGACACTG)SEQ ID NO84和1334(AAGCTTCAAAGTTCATCCTTGTTGCAATAGTTCTCCAATTG)SEQ ID NO182附着5’SphI限制内切核酸酶裂解位点和3’KDELDNA序列加上HindIII裂解位点,供随后连接于SphI/HindIII切口pSBS4011。结果为质粒pSBS4402编码PRS-Klip27-MI-KDEL融合蛋白的DNA序列置于在菜豆蛋白启动子/终止子表达控制下的双元载体内。菜豆蛋白启动子在种子发育期间控制转基因的时间特异性和组织特殊性表达。植物表达载体pSBS4402用做模板,在胰岛素的B和A链间以及MI和D9 scfv间导入四元位点。
使用引物1515(GCATGCATGCCTTTGTTAATCAACATCTTTGTGG)SEQ ID NO185和1518(ACATTGTTCAACAATTCCTCTCTTTCTTCTAGTCTTAGGAGTGTAGAAAAATCC)SEQ ID NO186,使用pSBS4402为模板利用PCR将间插四元(B30T-RRKR)位点置于人胰岛素的可信B(1-29)-和A(1-21)-链之间。所得124bp片段与引物1517(GCATAAGCTTCAAAGCTCATCCTTTGAGC)SEQ ID NO187组合使用,使用pSBS3400为模板。注意pSBS3400是含有具有HindIII限制位点的D9scFv-KDEL片段的质粒。此PCR反应生成955bp产物,其把四元(RRKR)-D9Scfv-KDEL-HindIII导入到124bp SphI-MI片段。再将955bp片段连接和亚克隆于pGEM-T(Promega),得pSBS3403。全部SphI-MI(具有B30T-RRKR修饰的C前肽)-RRKR-D9Scfv-KDEL-HindIII片段插入预切口(SphI/HindIII)pSBS4402内,产生pSBS胰岛素融合蛋白(PRS-MI-四元接头-D9Scfv-KDEL)的完整核酸序列SEQ ID NO5和氨基酸序列SEQ ID NO6如图3所示。
具有pSBS4404、pSBS4405或pSBS4414的重组大肠杆菌和土壤杆菌属的转化和生长利用序列分析确认编码融合蛋白的cDNA的完整性后,把质粒pSBS4404、pSBS4405和pSBS4414转化大肠杆菌菌株DH5α,得以高水平表达。分离的质粒DNA(100ng)在冰上与100μl的DH5α感受态细胞混合20分钟。细胞再于42℃热击45秒,回到冰上2分钟。然后加1毫升SOC培养基,细胞在LB壮观霉素(10g/L胰胨、5g/L酵母提取物、5g/L NaCl、15g/L琼脂)平板上将转化细胞铺板前将细胞在37℃于225rpm的enviro摇床上温育1小时,并在37℃温育过夜。使用单一菌落接种5毫升LB-壮观霉素液体培养基。这些培养物在37℃成长过夜。按照QIAprep?Spin Miniprep Kit(Qiagen)从1毫升过夜培养物中分离重组质粒。再用分离的质粒通过电穿孔(25μF,2.5kV,200Ω)转化感受态土壤杆菌菌株EH101(Hood等人,1986;J.Bacteriol.)。重组土壤杆菌属铺板在AB壮观霉素/卡那霉素(20x AB盐,2M葡萄糖,0.25mg/ml FeSO4·7H2O,1M MgSO4,1M CaCl2)上,使用单一菌落接种5毫升AB壮观霉素/卡那霉素液体培养基。这些培养物在28℃生长过夜。再使用重组土壤杆菌属通过浸汲法(Clough等人,1998,Plant J.,)转化拟南芥。拟南芥栽培品种(C24)用于全部实验。把种子种植在4英寸花瓶内土壤混合物(三分之二Redi土、三分之一真珠岩,pH=6.7)或由Lehle Seeds供应的拟南芥土壤混合物(真珠岩、蛭石、泥煤、绿土(terra-green),pH=5.5)的表面。容许幼苗成长至6-8叶的丛生(rosette)阶段,直径大约2.5cm。花瓶在4℃的拱顶下放置4天冷处理,随即移至24℃生长室,约150μE持续光照和相对湿度60-70%。植物每隔2-3天浇水,每星期以1%Peters 20-19-18施肥。各花瓶含5-6株植物。植物达到约2cm时,把第一次结实(bolt)剪断,促使第二、第三结实的成长。剪断第一次结实后4-5天,植物准备用土壤杆菌感染。把具有拟南芥植株的花瓶倒置以让拟南芥植株被含有感兴趣的植物转化载体的过夜土壤杆菌培养物的重悬液500毫升感染20秒。重要的是土壤杆菌培养物含5%蔗糖和0.05%表面活性剂Silwet L-77(Lehle Seeds)。花瓶随后覆盖透明塑料拱顶24小时以维持较高湿度。让植物成长至成熟,收获未转化和已转化的种子的混合物。为选择转基因品系,推定已转化的种子以70%乙醇快洗灭菌,再用20%商用漂白剂洗15分钟,然后以ddH2O洗至少4次。约1000粒灭菌种子与0.6%熔化的顶层琼脂混合,均匀分布于含有0.3%蔗糖和80μM除草剂phosphionthricin(PPT)DL的半强度MS平板上(Murashige and Skoog,1962,Physiologia Plantarum )。平板再置于24℃生长室内,照明计划为8小时暗、16小时亮。7-10天后,推定转基因幼苗已成绿色并生长,而未转化幼苗苍白。生根后,推定转基因幼苗分别转移到花瓶(各个植物每隔三天浇水,每隔七天以1%Peter 20-19-18施肥),让其成长成熟。花瓶覆盖透明塑料拱顶三天,以保护敏感性幼苗。七天后,幼苗用Lehle Seeds的种子收集器系统覆盖,以防止种子因散布而损失。个别收获这些转基因植物的种子,预备分析之用。
胰岛素在拟南芥内的表达水平在第二实施例中,在转基因拟南芥成熟种子中确定融合蛋白D9scfv-KLIP27-MI-KDEL(4404)、OLEO-KLIP8-KLIP27-MI(4405)和PRS-MI-RRKR-D9Scfv-KDEL(4414)的表达水平。转基因产物示出存在于成熟种子的细胞提取物内。大约40颗转基因拟南芥种子以研钵和研杵在50μl的50mM Tris-HCl pH8.0中加以研磨。于浆液中加还原SDS-PAGE样品缓冲液(6×SDS样品缓冲液,0.35M Tris-HClpH6.8,30%甘油,10%SDS,0.012%溴酚蓝,5%β-硫基乙醇),短暂涡旋混合。再将样品短暂离心,在99℃放置10分钟。在冰上冷却2分钟后,把样品短暂离心。在还原条件下加样(10μl,相当于大约七颗种子)。
对于制备油体样品,取转基因和野生型种子(20mg)在250μl油体提取缓冲液(0.4M蔗糖,0.5M NaCl,50mM Tris-HCl pH8.0)内研磨。样品在10000g微离心10分钟。用26G 5/8的1毫升注射器除去水溶性级分,脂肪垫(fat pad)重悬于补充盐(20mM Na2HP4,pH8.0,0.5MNaCl)的100μl的磷酸盐缓冲液内。重悬的脂肪垫移至清洁离心管,再于10000g离心10分钟。再重复此程序三次,脂肪垫的最后重悬于100μl无盐的磷酸盐缓冲液(20mM Na2HPO4pH8.0)。在无盐磷酸盐缓冲液进行另二次洗涤,中间离心步骤按上述。最后的脂肪沉淀重悬于10μl的磷酸盐缓冲液(20mM Na2HPO4pH8.0)内。取出5μl份量,在1/10(v/v)50mM Tris-HCl pH8.0加2%SDS内煮沸,将油体蛋白溶解。样品在冰上冷却2分钟,在10000g离心5分钟。底层的蛋白质含量以BCA蛋白质分析测定(Pierce,Rockford,IL)。对于考马斯染色凝胶和蛋白质印迹分析,使用SDS-PAGE样品缓冲液,在还原条件下于15%SDS-PAGE凝胶上分离20μg总蛋白。
样品加样于不连续的15%SDS-PAGE凝胶,在150伏特分离约1.5小时。凝胶再经考马斯染色或印迹到PVDF膜(Immobilon-P,Millipore公司,Bedford,MA)以供蛋白质印迹分析。印迹样品用购自Abcam(Cambridge,UK)的针对胰岛素的单克隆抗体探查(CloneE2-E3Roth等人,1992)。胰岛素带使用二级山羊X鼠IgG F(ab’)2AP缀合物检测(Chemicon International,Temecula,CA)并使用NBT-BCIP在GARAP缓冲液(Tris-HCl pH9.5,100mM NaCl,5mM MgCl2)内显色。免疫反应性带相应于多肽带,以融合蛋白的预计分子量迁移,如图4A-4F所示。图4(A-F)示出胰岛素融合蛋白在转化的拟南芥系(4404-2、-17、-20,14-19和4414-20)内的重组表达,根据考马斯染色SDS-PAGE和蛋白质印迹分析。箭头分别指在还原条件下迁移的38.5kDa、34.2kDa和34.2kDa融合多肽、PRS-D9(scfv)-KLIP27-MIw/KDEL(4404)、OLEO-KLIP8-KLIP27-MI(4405)和PRS-MI-RRKR-D9Scfv-KDEL(4414)的位置。注意4414融合蛋白有预期的分子量34.2kDa,但在SDS-PAGE凝胶上具有较高的表观分子量。图4A(考马斯染色凝胶)和4B(相应于抗胰岛素E2E3探查的蛋白质印迹)示出野生型(wt)的总种子蛋白以及表达构建体的转基因种子系。图4C(考马斯染色凝胶)和4D(相应于抗胰岛素E2E3探查的蛋白质印迹)示出由野生型制备的油体蛋白以及表达同样构建体的转基因种子。图4D(考马斯染色凝胶)和4E(相应于抗胰岛素E2E3探查的蛋白质印迹)示出由野生型制备的油体蛋白以及表达同样4414构建体的转基因种子。分子量标记(M)为10、15、20、25、37、50、75、100、150、250kDa。对照包括hIN(重组人胰岛素标准)和hProIN(重组人胰岛素原标准),在非还原条件下分离。表达水平的不同是转化体当中克隆变异的结果。转基因和MI表达的大约蛋白水平示于图5。表达水平使用18kDa油质蛋白带做为内标准(相当于1.5%总种子蛋白)利用转基因带的光密度测定法测定。PRS-D9(scfv)-KLIP27-MIw/KDEL(4404)、OLEO-KLIP8-KLIP27-MI(4405)和PRS-MI-RRKR-D9Scfv-KDEL(4414)构建体的平均表达水平分别为0.21%总种子蛋白、0.12%总种子蛋白和0.79%总种子蛋白。
实施倒3pSBS4404的裂解和HPLC纯化从油体洗脱在第3实施例中,取1克转基因种子在12毫升提取缓冲液(0.4M蔗糖,0.5M NaCl,50mM Tris-HCl pH8.0)内匀浆,并以10000g离心10分钟,除去脂肪垫,置于1毫升20mM Na2HPO4、0.5M NaCl内,按上述再离心。重复二次,然后洗涤,把脂肪垫在750μl 20mMNa2HPO4内离心二次。通过在750μl 20mM甲酸pH4.1内洗涤最后的脂肪垫5次,每次洗涤之间在10000g离心,从油体洗脱4404融合蛋白进入下层液内。收集的洗脱级分(下层液)合并(pooled),并以2NNaOH中和至pH8.0。全部溶液然后置放在-80℃冷冻,冷冻干燥过夜以浓缩融合蛋白。冷冻干燥样品重悬于500μl的50mM Tris-HClpH8.0。然后将重悬的4404融合蛋白在NAP-5柱(AmershamPharmacia Biotech Ab,Uppsala,Sweden)上脱盐,再以缓冲液(50mM Tris-HCl pH8.0)再交换。脱盐级分再度冷冻,冷冻干燥过夜加以浓缩。最后浓缩的样品重悬于终体积105μl双蒸馏H2O中。洗脱结果如图6所示。图6是考马斯染色SDS-PAGE(15%)分析洗脱前的油体制备物(-OB),用甲酸洗脱后的油体制备物(-OB’)以及浓缩的洗脱物质(-E)。箭头指示迁移的融合多肽的位置。野生型对照基本上在洗脱后无任何主要蛋白质,而浓缩的4404物质含有融合蛋白,若干截短产物(可能是水解的融合蛋白)以及可能有共同洗脱的若干白蛋白。
表达4404的芥种子的裂解和HPLC分析浓缩的样品重悬于105μl的双重蒸馏水内,蛋白质含量利用BCA蛋白质分析按照厂商(Pierce,Rockford,IL,USA)测定。样品再用胰蛋白酶裂解(胰蛋白酶∶总蛋白比1∶300,在50mM Tris-HClpH8.0内,于冰上90分钟)。以10倍摩尔过量的TLCK(N-对-甲苯磺酰基-L-赖氨酸氯甲基酮)终止反应。然后经0.2μm滤器(Aerodisc?13mm注射滤器,有0.2μm Supof?膜,Pall公司,Ann Arbor,MI,USA)过滤全部反应物并使用C18柱(Zorbax 300SB-C18,AgilentTechnologies,Waldbronn,德国)以反相(RP)-HPLC分析。样品加载于柱并使用在0.1%(v/v)TFA内的5-50%(v/v)乙腈的19分钟线性梯度以1.0ml/min洗脱。此分析所得的层析如图7所示。曲线揭示了4404融合蛋白被胰蛋白酶裂解的产物,其在柱上与人胰岛素标准具有几乎相同的性质(保留时间分别17.011分钟和17.179分钟)。从17.0-17.5分钟收集HPLC级分并利用PSD MALDI/TOF质谱分析法使用Voyager-DE STR质谱仪(Applied Biosystems)分析。MS分析是利用NRC-Plant Biotechnology Institute,Saskatoon,Saskatchewan,Canada提供的BioAnalytical Spectroscopy services进行的。上述利用HPLC纯化的裂解的4404产物的解析见图8B,与图8A所示人胰岛素标准比较。用胰蛋白酶裂解的4404融合蛋白的观察质量为6191.51Da。人胰岛素标准(图8A)与裂解的4404产物(图8B)间的差异相应于具有保留再裂解的产物A链上的KDEL信号的Des-B30胰岛素(Des-B30胰岛素-KDEL)。
实施例4pSBS4405的裂解和HPLC纯化油体制备融合蛋白(OLEO-KLIP8-KLIP27-MI)可通过进行下述油体制备而被部分纯化。大约取1克转基因种子在12毫升提取缓冲液(0.4M蔗糖,0.5M NaCl,50mM Tris-HCl pH8.0)内匀浆并以10000g离心10分钟,除去脂肪垫,并置于1毫升的50mM Tris-HCl pH8.0,0.5M NaCl中,并按上述再离心。此重复二次,洗涤后,脂肪垫在750μl的50mMTris-HCl pH8.0内离心两次。油体制备除去大部分的背景蛋白质。从表达4405构建体的转基因芥种子所得油体制备的典型蛋白质图谱如图9所示。
表达4405的芥种子的裂解和HPLC分析重悬油体的总蛋白含量是利用将一级分制备物(5μl)在2%SDS,50mM Tris-HCl pH8.0内稀释10倍,煮沸5分钟,在10000g离心3分钟加以溶解而评估。然后,蛋白含量是利用BCA蛋白质分析按照厂商(Pierce,Rockford,IL,USA)测定。然后,样品用胰蛋白酶(胰蛋白酶∶总蛋白质比1∶300,在50mM Tris-HCl pH8.0,于冰上90分钟)裂解,从融合蛋白释出Klip27-MI片段。以10倍摩尔过量的TLCK(N-对-甲苯磺酰基-L-赖氨酸氯甲基酮)终止反应。样品以10000g离心10分钟,全部反应的下层液经0.2μm滤器(Aerodisc?13mm注射滤器,有0.2μm Supof?膜,Pall公司,Ann Arbor,MI,USA)过滤。图9表示全部可提取种子蛋白和从表达4405的系制备的油体(OB)蛋白的考马斯染色SDS-PAGE(15%)分析,与野生型(非重组)种子比较。箭头指示迁移融合多肽的位置。下层液使用C18柱(Zorbax300SB-C18,Agilent Technologies,Waldbronn,德国)以反相(RP)-HPLC进一步分析。样品加载于柱上,使用在0.1%(v/v)TFA内的5-50%(v/v)乙腈的19-分钟线性梯度以1.0ml/min洗脱。此分析所得层析见图10。曲线揭示了4405融合蛋白的胰蛋白酶裂解的产物,其在柱上具有与人胰岛素标准几乎相同的性质(保留时间分别为17.220分钟和17.179分钟)。从17.0-17.5分钟收集HPLC级分,使用Voyager-DE STR质谱仪(Applied Biosystems)利用PSD MALDI/TOF质谱分析法分析。利用NRC-Plant Biotechnology Institute,Saskatoon,Saskatchewan,Canada提供的BioAnalytical Spectroscopy services进行MS分析。如图11所示,用胰蛋白酶裂解的4405融合蛋白的观察质量为5706.30Da。人胰岛素标准(图8A)与裂解的4405产物(图11)间的差异相应于Des-B30胰岛素产物(Des-B30胰岛素)。Des-B30胰岛素为4405融合的正确胰蛋白酶成熟所预期的产物。
实施例5使用AKTA探查器(FPLC)纯化胰蛋白酶裂解的MI从4405裂解MI的纯化也是在AKTA探查器(explorer)(Amersham Pharmacia)上利用阴离子交换(Mono Q FF 1mL,AmershamPharmacia)通过加大规模的裂解反应部分纯化。裂解反应是在4405油体上进行,如上述,其由达30克的转基因种子制备。裂解反应的下层液经0.2μm滤器过滤或利用冷冻干燥在Savant Speed Vac上浓缩。过滤的样品反应可直接应用于柱,但浓缩样品需除去盐,才能有效结合柱。浓缩样品可通过令裂解的物质通过PD-10柱(AmershamPharmacia)、通过透析或稀释到盐浓度等于或低于5mS/cm而脱盐。脱盐样品用20mM Tris-HCl pH6.5平衡。样品可用0-40%NaCl,以1ml/min流速使用阶梯梯度分离。检测在214nm进行(在280nm检测较差,因为胰岛素内芳香族氨基酸含量低)。A溶剂是20mM Tris-HClpH6.5,而B溶剂是20mM Tris-HCl pH6.5,1.0M NaCl。收集与Roche胰岛素标准相同的导电性,再7-35mS/cm之间的洗脱级分(1ml)(参见图12)。图12表示胰蛋白酶裂解的4405油体制备物(虚线)与人胰岛素标准(实线)相比较的层析图谱。收集的级分利用HPLC、ELISA或蛋白质印迹(数据未示出)证明胰岛素的存在。所收集的样品再利用冷冻干燥浓缩,用于实施例6所述的胰岛素生物分析。
实施例6胰岛素耐受试验C57BI/6(B6)雄鼠中的生物分析进行生物分析,以确定来自胰蛋白酶裂解的4405的重组植物衍生物(Des-B30IN)的体内作用,与人胰岛素比较。B6小鼠体内的葡萄糖血浆水平在胰岛素标准、负对照和SBS胰岛素腹膜内注射之前和之后测定。从Jackson Laboratories(Bar Harbor,ME)购买约2月大的15只C57BI/6(B6)雄鼠。以自动血糖仪(glucometer)(One TouchUltra,Lifescan,Johnson & Johnson)测量血浆葡萄糖水平。正对照包括HumulinR?(Eli Lilly)和酵母重组人胰岛素标准,得自Roche。生理盐水溶液用做安慰剂。包括的负对照代表从通过与重组4405胰蛋白酶裂解的油体制备物同样处理的野生型(非组合)芥种子纯化的胰蛋白酶裂解的油体。
B6鼠关在笼内并随意进食,12小时暗-光循环。对于胰岛素耐受试验,对鼠腹膜内(IP)注射胰岛素(1U/kg体重),使用自动血糖计在0、15、30和60分钟测量葡萄糖水平。所有胰岛素耐受试验均在每天的同样时间(上午9:00)进行。进行胰岛素耐受试验时,在进行下一试验之间间隔至少二天。胰岛素耐受试验结果示于图13。从4405种子衍生的SBS DesB30胰岛素(实体菱形)与Humulin R?(空白方形)和Roche胰岛素(空白三角形)标准在注射后的研究过程中行为几乎相同(统计学上并无差异,p<0.05)。所测试的全部胰岛素与生理盐水安慰剂(空白圆形)和胰蛋白酶裂解的野生型芥油体(实体圆形)(负对照)比较,显著降低血浆葡萄糖水平(p<0.05)。
实施例7pSBS4401PRS-Klip27-MI-融合蛋白的构建所研究的融合蛋白之一以烟草病原相关序列(PRS)开始(Sijmons等人,1990,Bio/technology,),其以共翻译方式用于将表达靶向ER的信号肽。紧接下游是衍生自酵母TA57前肽的胰蛋白酶可裂解的前肽(KLIP27)(Kjeldsen等人,2001,Biotechnology andGenetic Engineering Reviews )。接着是Kjeldsen等人(2001)所述的微型胰岛素(MI)。
此质粒的主链pSBS4055基于Hajdukiewicz等人所述的植物双元载体pPZP200(Plant Molecular Biology,-994)。代替所述多克隆位点,以香芹的遍在蛋白启动子/终止子驱动(Kawalleck等人,1993,Plant.Mol.Bio.,)、赋予宿主植物草铵膦抗性的pat基因(Wohlleben等人,1988,Gene 7025-37)插于左和右边界序列之间。除此盒外,亚克隆了驱动PRS的菜豆的β-菜豆蛋白启动子/终止子(Slightom等人,1983,Proc.Natl.Acad.Sc.USA 1)。使用标准PCR(Horton等人,1989,Gene 7761-68)把具有所附SphI/HindIII限制内切核酸酶位点的合成PRS-编码序列融合于菜豆蛋白启动子的3’端以产生pSBS4011。
Klip27-MI序列是由四种部分重叠的寡核苷酸合成,其掺入了拟南芥密码子使用,以提高基于植物的表达系统的有效翻译的成功。寡核苷酸1324(GAAGAAGGAGAGCCTAAGTTTGTTAATCAACATCTTTGTGGATCTCATCTTGTTGAGGCTCTCTACCTTG)-SEQ ID NO177和1323(CCTTAGGAGTGTAGAAAAATCCTCTTTCTCCACACACAAGGTAGAGAGCCTCAACA)-SEQ ID NO178,在其互补的20个核苷酸重叠处退火,并延伸形成Klip27-MI融合的5’端,对寡核苷酸1322(CTAAGGCTGCTAAGGGAATTG)-SEQ ID NO179和1321(AAGCTTCAGTTGCAATAGTTCTCCAATTGGTAAAGTGAGCAAATAGAAGTGCAACATTGTTCAACAATTCCCTTAGCAGCCTT)-SEQID NO180进行相同的处理以形成3’端。在用Bsu36I限制消化后,将二半部分连接,生成全Klip27-MI编码序列。此基因融合的PCR使用引物1363(GCATGCCCAACCAATTGATGACACTG)-SEQ IDNO184和引物1329(AAGCTTCAGTTGCAATAGTTC)-SEQ ID NO183附着了5’SphI和3’HindIII限制内切核酸酶裂解位点用于随后连接至SphI/HindIII切口的pSBS4011(如上述)。结果为质粒pSBS4401编码PRS-Klip27-MI融合蛋白(SEQ ID NO189)的DNA序列(SEQ ID NO188)置于在莱豆蛋白启动子/终止子的表达控制下的双元载体内。菜豆蛋白启动子在种子发育期间控制转基因的时间特异性和组织特殊性表达。
具有pSBS4401的重组大肠杆菌和土壤杆菌的转化和生长利用序列分析确认编码融合蛋白的cDNA完整性后,质粒pSBS4401转化大肠杆菌菌株DH5α,得以高水平表达。分离的质粒DNA(100ng)在冰上与100μl的DH5α感受态细胞混合20分钟。再将细胞于42℃热击45秒,回到冰上2分钟。然后,添加1ml的SOC培养基,令细胞在225rpm的enviro摇床上于37℃温育1小时,再将转化细胞铺板于LB壮观霉素平板(10g/L胰胨、5g/L酵母提取物、5g/LNaCl、15g/L琼脂),并在37℃温育过夜。使用单一菌落接种5毫升LB壮观霉素液体培养基。这些培养物在37℃生长过夜。按照Qiagenmini prep从1毫升过夜培养物分离重组质粒。分离的质粒再用来通过电穿孔(25μF,2.5kV,200Ω)转化感受态土壤杆菌菌株EH101(Hood等人,1986;J.Bacteriol.,)。重组土壤杆菌铺板于AB壮观霉素/卡那霉素(20x AB盐,2M葡萄糖,0.25mg/ml FeSO4·7H2O,1M MgSO4,1M CaCl2),使用单一菌落接种5毫升AB壮观霉素/卡那霉素液体培养基。这些培养物在28℃生长过夜。再使用重组土壤杆菌通过如实施例1所述浸汲法(Clough等人,1998,Plant J.,)转化拟南芥植物。
胰岛素在拟南芥中的表达水平使用上述实施例2概括的方法,在转基因拟南芥成熟种子内测定融合蛋白KLIP27-MI(4401)的表达水平。在成熟种子的细胞提取物内未见有转基因产物存在。
实施例8构建pSBS4409OLEO-人胰岛素原(OLEO-hPIN)融合蛋白此融合蛋白以拟南芥的18kDa油质蛋白开始,在框内随后是编码人胰岛素原(hPIN)的基因。此融合蛋白的表达靶向在胚发育期间形成的初生油体。
此质粒主链pSBS4008基于Hajdukiewicz等人所述植物双元载体pPZP200(Plant Molecular Biology,-994)。代替}

我要回帖

更多关于 风光互补路灯 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信