高通量测序数据分析

http://www.microsci.com/

众所周知,数据分析是高通量测序应用于生物研究最关键的步骤,分析不好,得到的海量数据无异于一堆垃圾。下面是刚刚接触高通量测序数据分析的同学可能比较关心的几个问题。需要说明的是:这些都是基于微生物领域且数据量不是特别大的情况。其它领域(植物、动物、医学等等)的高通量测序数据处理我暂时还不太了解。

1. 是不是一定要用大型计算机?
除了序列拼接组装以外,其它分析不是一定要大型计算机,在普通的PC上也可以处理,当然,买一台或几台高性能的工作站电脑,能显著加快数据处理的速度。

2. 是不是一定要用Linux系统?
除了序列拼接组装以外,不一定非用Linux不可,在Window下可以完成数据处理。如果你想以后长期从事高通量测序数据分析工作,熟悉Linux是必须的,但是如果你是为了处理一下数据混混毕业(中国有很多研究生是这样,这是事实),我觉得没必要额外花些时间去学习使用Linux,虽然现在Linux已经变得不那么难用了

3. 序列拼接又要用大型计算机又要用Linux系统怎么办?
方法有两个:(1) 找商业公司组装拼接, (2)用亚马逊的云计算服务。

4. 是不是必须自己写些程序?
数据处理中经常要对文本文件中的内容进行调整、筛选、比对,据我所知现在还没有什么软件可以非常灵活的完成这些操作,将来也很难有,因为这些操作都是与实际数据相关的,没有统一的规律。现在大部分人都是用脚本程序来完成这些任务,因此数据分析过程中需要自己写点程序。在这方面比较适合的编程语言是Python和Perl,我觉得Python比较好用也比较有前途,但很多人还是用Perl,问其原因,得到的答复是是师兄师姐都用Perl,不得不用Perl。

5. 数据如何分析?
这个问题太难回答了,并且我觉得目前及将来很长一段时间,在网上应该找不到像DGGE操作步骤T-RFLP操作步骤DGGE数据分析方法等这类非常详细的教程类的东西。因为高通量测序技术及其数据分析方法现在发展非常快,时刻在变。唯一的办法就是自己去研究Paper,研究相关软件的说明书。

如转载,请以超链接形式注明:转载自:有个博客http://www.yelinsky.com/blog/ ]
本文链接地址:http://www.yelinsky.com/blog/archives/368.html

 

 

计算机虚拟药物筛选 http://www.microsci.com/

虚拟筛选是药物筛选技术发展的一个重要方向。虚拟筛选是在计算机上模拟药物的筛选过程,对化合物的活性做出预测,进而对较有可能成为药物的化合物进行有针对性的实体筛选,这种方法将显著降低药物开发成本。

分子对接技术是实现药物虚拟筛选的主要方法。分子对接是指配体分子与受体分子通过几何和能量匹配相互识别的过程。在虚拟筛选中,使用GASDOCK、DOCK、AUTODOCK等分子对接软件能有效地提高分子对接的效率。分子对接软件基于对接分子相关数据及对接参数,利用高性能计算机进行虚拟筛选。

 

一般来说, 每次虚拟筛选都是针对特定的靶标分子,从数以百万计的化合物中筛选出与靶标分子结合最好的候选化合物进行实体筛选。整个虚拟筛选过程需要用到数百万个配体分子的结构和能量数据,每次对接过程都需要一组特定的对接参数,每次对接过程完成后都会产生对接日志数据,记录此次对接的详细信息,选择哪些候选化合物进行实体筛选正是基于这些日志数据。

上海丰核信息科技有限公司 http://www.microsci.com/

做生物信息学的组织和机构

中科院计算技术研究所:http://www.bioinfo.org.cn/

上海交通大学生物信息学:http://cbb.sjtu.edu.cn/members.php

上海生命科学研究院生物信息学中心:http://www.biosino.org/pages/readme.htm

当然还有我们 上海丰核信息科技有限公司:http://www.microsci.com/

 

 

丰核信息宣传册

丰核信息宣传册点击下载:  FengHe_brochure

系统生物学 疾病有关基因 meta 文章

 

 

A Systems Approach to the Biology of Mood Disorders through Network Analysis of Candidate Genes.

Source

Human Genetics Branch, National Institute of Mental Health, National Institutes of Health, Bethesda, Maryland, USA.

Abstract

Meta analysis of association data of mood disorders has shown evidence for the role of particular genes in genetic risk. Integration of association data from meta analysis with differential expression data in brains of mood disorder patients could heighten the level of support for specific genes. To identify molecular mechanisms that may be disrupted in disease, a systems approach that involves analysis of biological networks created by these selected genes was employed.Interaction networks of hierarchical groupings of selected genes were generated using the Michigan Molecular Interactions (MiMI) software. Large networks were deconvoluted into subclusters of core complexes by using a community clustering program, GLay. Network nodes were functionally annotated in DAVID Bioinformatics Resource to identify enriched pathways and functional clusters. MAPK and beta adrenergic receptor signaling pathways were significantly enriched in the ANK3 and CACNA1C network. The PBRM1 network bolstered the enrichment of chromatin remodeling and transcription regulation functional clusters. Lowering the stringency for inclusion of other genes in network seeds increased network complexity and expanded the recruitment of enriched pathways to include signaling by neurotransmitter and hormone receptors, neurotrophin, ErbB and the cell cycle. We present a strategy to interrogate mechanisms in the cellular system that might be perturbed in disease. Network analysis of meta analysis- generated candidate genes that exhibited differential expression in mood disorder brains identified signaling pathways and functional clusters that may be involved in genetic risk for mood disorders.

© Georg Thieme Verlag KG Stuttgart · New York.

 

做进化树用什么软件好? 还有linux perl 怎么学呢

进化树的的请去看MEGA的使用,对于新手,LINUX上手是需要点时间的,但是是必要的,等你linux熟了之后就不会再问PERL的问题了,WIN下也可以用PERL只要用ACTIVperl就可以了,自己参看PERL的教学书籍,光看前两章就明白了,建议大家有什么问题先谷歌一下,那是最好的老师。

求预测蛋白质之间相互作用的生物信息学软件?

请问能够根据序列或者是结构来预测蛋白质之间相互作用的生物信息学软件有那些?

上海丰核信息

上海丰核信息

蛋白质功能预测

DNA甲基化

上海丰核信息科技有限公司  (做最专业的生物信息学分析)

http://www.microsci.com

DNA 甲基化是一种表观遗传(epigenetic) 修饰,在DNA 甲基转移酶催化下,利用S2腺苷甲硫氨酸提供的甲基,将胞嘧啶的第5 位碳原子甲基化,从而使胞嘧啶转化为52甲基胞嘧啶。在哺乳动物基因组中,DNA 甲基化的主要位点是Cp G二核苷酸,它在基因组中呈不均匀分布。在某些区域Cp G序列的密度比平均密度高10 ~ 20 倍, G + C 含量大于50 % ,其长度大于200 个碱基,这些区域命名为Cp G岛。大约50 %的人类基因中含有Cp G岛,常位于基因上游调控区的启动子,这些基因为管家基因或组织特异表达基因。启动子区的Cp G岛通常处于非甲基化状态,基因能正常表达,当其发生甲基化时,影响基因转录调控,使基因表达发生沉寂。与Cp G岛相反的是,基因组中散在分布的Cp G二核苷酸通常处于甲基化状态。DNA 甲基化在维持染色体结构、X染色体失活、基因印记和肿瘤的发生中起重要作用。

DNA 甲基化属于表观遗传学范畴,表观遗传学是一门新兴学科 ,它研究非DNA 序列变化引起的,在细胞分裂中可遗传的基因修饰作用,该种修饰影响DNA 和其他分子的相互作用,并通过细胞分裂和增殖遗传。其分子机制包括DNA 甲基化、组蛋白修饰、染色质重塑和RNA 干扰等,它们在基因转录调控过程中扮有重要角色。越来越多的研究表明,DNA 甲基化异常在多种肿瘤的发生中起重要作用,目前在该领域的研究主要集中在甲基化在转录调控中的作用机制、甲基化检测对肿瘤的诊断和预后评估以及应用甲基化抑制剂治疗肿瘤等方面。