计划、水稻基因组草图和完整图绘制、SARS 病毒基因组研究中承担了大量关键的科研任务,为华大基因的基因测序工作立下了汗马功劳。
2011年6月2日,深圳华大基因、德国汉堡大学医学院、中国疾病预防控制中心和军事医学科学院微生物流行病研究所测定了对德国爆发的大肠杆菌的基因组图谱,将其上传至NCBI ,登记号SRA037315.1,供全球分享。该大肠杆菌与2002年从中非艾滋病患者腹泻标本中分离的肠侵袭性大肠杆菌55989菌株的同源性超过93%, 通过基因水平转移获得了多种耐药基因,导致抗生素治疗无效,而具备高致病性 4。
虽然深圳华大基因的新发现的大肠杆菌基因还要依靠NCBI的认定,但是,深圳华大基因已经开始试水基因认定产业,推出了生物数据资源中心CLiMB(Comprehensive Library for Modern Biotechnology) 5,这是中国企业创建基因信息央行的大胆实验。
基因信息分行
随着人类基因组、植物基因组计划的实施,核酸、蛋白质等生物数据的数量正以前所未有的速度迅速增加,GenBank 等数据库的容量均以几何级数的速度不断扩容。
基因研究人员主要是通过手动操作在网上获取生物医学信息,加之对数据结构以及数据项含义的不熟悉、网络硬件条件的限制,致使查询效率低。如何从海量的基因信息一级市场中钩吊出有效的数据,这成为了基因信息研究的热点。
数据挖掘与生物信息学的结合技术, 使得从一级基因信息数据库中提取有用的序列、结构、功能等信息成为可能,使得二级基因信息数据库得以建构。这种二级生物信息数据库就相当于基因信息分行。
2011年7月6日,华大基因(BGI)和BioMed Central(简称BMC ,生物医学中心)共同主办的《GigaScience》杂志的执行编辑Scott Edmunds正式对外宣布该杂志已经开始接收数据,该期刊主要采用全文文献与大型数据库相结合的模式,为广大科学工作者提供前沿、有效的数据以及生物学发现等资源,并公开了首个可引用的数据库—德国大肠杆菌数据库,包括了最近流行的德国致病性大肠杆菌O104菌株等的基因组序列和组装数据, 华大基因在其官网上指出:大肠杆菌O104菌株的基因组序列还存放在NCBI上 6。 显然,德国大肠杆菌数据库就属于基因信息分行。
中国多项科研基金支持基因信息数据挖掘技术,这可以说是基因信息分行建设的实验。例如:中国科学院上海生科院系统生物学重点实验室生物信息中心的许庆炜等,在国家科技支撑计划课题(2008BAI64B01)的支持下,对生物医学文献热点数据自动化抽取工具HotDataSpider 进行了研究 7;北京科技大学信息工程学院的杨炳儒等,在国家科技成果重点推广计划资助项目( 2003EC000001)和国家自然科学基金资助项目( 60675030) 的支持下,对生物信息数据挖掘技术的典型应用进行了研究 8;江苏省农业科学院农业资源与环境研究所的栾德琴等,在国家863计划(编号: 2006AA10Z1E7-1, 2006AA10Z243-3)和江苏省农业科学院科研基金(编号: 6510716) 的支持下,对基因本体论在生物信息数据库中的应用进行了研究 9;北京大学心血管基础研究所的尚彤、 清华大学电子工程系的刘贝等,在国家重点基础研究发展规划项目(G2000056907) 的支持下,以NCBI的GenBank 数据库和EBI维护的Swiss2Prot数据库分别作为一级和二级数据库的信息来源,编写了专用软件从网上获取数据,并且进行分类整理,建立了心衰/ 高血压相关基因和蛋白数据库 10。
基因信息的知识产权问题
基因信息一级数据库版权争议问题不严重。由政府或由其它公共基金出资开发的Genbank、EMBL、DDBJ和蛋白质三维结构数据库PDB等一级生物信息数据库,免费为公众开放,以推动生物信息的传播与交流。但是,因经济紧张的原因,蛋白质序列数据库SWISS-PROT 已开始向商业用户每年收取数千至数万美元不等的费用。
基因信息二级数据库上的版权问题比较复杂。基因信息二级数据库一般是利用生物信息软件对原始数据的创造性的再加工,具备独特的结构编排,在一般情况下享有版权保护。有人认为对于政府出资兴建的基因信息二级数据库,不具备版权,也应当免费为公众开放。一旦基因信息二级数据库引用本身具有版权的文献和数据, 原始数据人的权利保护是需要研究的问题 11。
从生物信息的两级数据库上可以看出,中国在基因信息的获取、加工、利用上并没有太多优势,外国公司已经在利用其生物信息技术优势,通过专利来控制中国的生物产业。美国孟山都公司利用我国上海的野生大豆,绘制了大豆的遗传连锁图谱,并提交国际PCT专利申请,在国际上进行跑马圈地 12。中国的大豆产业已经“沦陷”,这显然是外国公司变相收取的“基因铸币税”造成的后果。
对此,中国以专利法中规定披露遗传资源来源的条款来加以应对。专利法第5条第2款:对违反法律、行政法规的规定获取或者利用遗传资源,并依赖该遗传资源完成的发明创造,不授予专利权。但是,该条款在实践中究竟能发挥多大的作用,这尚有待观察。
结语
因人才短缺、资金不足、配套不完善等种种困难,我国生物信息产业的发展与国际水平还存在不少差距,但是,当面对外国基因信息霸权的挑战,我国更要迎难而上,这需要科技人员在基因测序、数据库建设、网络开发、网络安全等核心技术上掌握自主知识产权,需要政府进行顶层设计建立中国基因信息央行。
国家级基因信息技术中心和数据服务中心——中国基因信息央行是一项系统工程,横跨生物、信息、知识产权、国家安全、法律、资金运作等多个领域,并非个别企业或院校所能实现和完成的,更需要政府在人、财、物上进行统筹协调、大力扶持,才能成功。
无论这个过程多么曲折,笔者认为:中国一定要建立起自己的基因信息央行,要象独立发行人民币一样独立发布基因登记号,这才能完善中国基因信息管理体系,中国的科研单位才能摆脱为外国基因信息央行提供基因来源的尴尬地位,中国的生产单位才能摆脱给外国基因公司交纳“基因铸币税”的被动局面。(作者系国家知识产权局医药生物发明审查部现代中药处副调研员)
推荐访问: 霸权 谁的 基因 银行