海外网搜索 海外网首页移动客户端评论资讯财经华人台湾香港城市历史社区视频新加坡德国荷兰滚动

基因检测成为"互联网+"的下一个风口?

2015-12-30 08:21:57 国际金融报
分享:

国内基因公司并不直接掌握基因测序的核心科技,花钱买套测序仪、拉几位生物医学专家组成团队,就能创立一个基因公司,基因公司的同质化现象非常严重。

  大数据该如何建

  如果没有百万级的样本来做对照,你很难真正断定某个人是否容易患某种癌症,因为基因测序只是告诉你某个人的基因是怎样的,但他患某种疾病的风险有多高,这个需要与众多患者做基因对比。遗憾的是,中国没有统一的基因数据库,基因数据零零散散地掌握在科研机构、企业手里

  当《国际金融报》记者向上海科委某处长询问上海的基因政策时,他告诉记者,应该关注王俊的动向——王俊作为基因产业创新的引领者,这也代表了基因业外部人士对基因产业的基本理解。

  华大基因创始人王俊直言:以后基因检测不在于测序技术本身,而在于大数据。王俊目前已辞去华大基因CEO职位,全力创立“碳云科技”公司,据传已经得到阿里巴巴等互联网公司投资,但王俊在电话中告诉《国际金融报》记者,“等春节前后等我公布。”

  王俊10月公开宣布,要做到2016年基因检测免费,而对于《国际金融报》记者关于如何免费的问题,王俊反复强调:“等我做出来再说。”

  其实,基因测序所生成的原始数据并不能直接反映有价值的信息,必须通过专业人员进行分析和解读。现今的生物信息分析涉及的数据存储、解读及共享是整个基因测序行业目前面临的最大难题,主要原因一是来自于数据量的庞大,二是源于数据的复杂性。大数据成为基因行业的发展瓶颈。

  胡鹏遇到的困难也是基因检测行业的共同瓶颈——缺乏数据,像胡鹏一样免费做基因检测的公司创始人,为了获得检测数据,都有自己的互联网战略。

  数据分析和解读可能会成为中国企业的优势,但短期只能烧钱看不到回报,门槛是数据库,这是限制企业数量和规模的主要原因。

  基因数据到底有多复杂?华大基因的内部人士坦言,“我们每个人的基因组大小单倍体是3Gb,基因测序深度30倍才能拿到比较全面的信息,也就是90Gb的数据量,百万人的基因组就是将近100Pb的海量数据,当然,这只是基因组数据,还不包括基因表达变化数据、体征数据等日常产生的生命信息数据。如此海量的数据,对数据的处理要求在目前的技术环境下,存在超级计算机和云计算两种策略,但云计算天然的互联网背景则更符合社会潮流发展的趋势。”

  “首先就样本量而言,如果没有百万级的样本来做对照,你很难真正断定某个人是否容易患某种癌症,因为基因测序只是告诉你某个人的基因是怎样的,但他患某种疾病的风险有多高,这个需要与众多患者做基因对比。”胡鹏告诉记者。

  华大基因被认为是国内基因企业中样本量最大的,仍然不足胡鹏所说的“百万人群”的样本量。华大基因在2015年1月启动“百万人基因组”项目,计划同时完成百万数量级的人类基因组等一系列数据收集分析工作,目前尚未宣布完成百万人的基因检测。

责编:邢若宸