天涯海角

My Web Home

Category Archives: 生物学方法

APPS: Extract high-quality plant RNA for NGS RNAseq

doi: 10.3732/apps.1300070

A Method for Extracting High-Quality RNA from Diverse Plants for Next-Generation Sequencing and Gene Expression Analyses

Roxana Yockteng, Ana M. R. Almeida, Stephen Yee, Thiago Andre, Colin Hill, and Chelsea D. Specht

  • Premise of the study: To study gene expression in plants, high-quality RNA must be extracted in quantities sufficient for subsequent cDNA library construction. Field-based collections are often limited in quantity and quality of tissue and are typically preserved in RNAlater. Obtaining sufficient and high-quality yield from variously preserved samples is essential to studies of comparative biology. We present a protocol for the extraction of high-quality RNA from even the most recalcitrant plant tissues.

  • Methods and Results: Tissues from mosses, cycads, and angiosperm floral organs and leaves were preserved in RNAlater or frozen fresh at −80°C. Extractions were performed and quality was measured for yield and purity.

  • Conclusions: This protocol results in the extraction of high-quality RNA from a variety of plant tissues representing vascular and nonvascular plants. RNA was used for cDNA synthesis to generate libraries for next-generation sequencing and for expression studies using quantitative PCR (qPCR) and semiquantitative reverse transcription PCR (RT-PCR).

 

Materials and Methods

Sampling — Plant material was collected from greenhouses and botanical gardens ( Table 1 ) and either stored in RNA later (Ambion, Carlsbad, California, USA) or frozen immediately in liquid nitrogen.  reserved tissue was placed in long-term storage at −80 ° C. For storage in RNA later , approximately 3 × the volume of RNA later : tissue is used. Tissue stored in RNA later and frozen (−80 ° C) was defrosted just enough to remove the tissue from the RNA later prior to extraction.

Basic protocol — The following protocol was modified from the manufacturer’s provided instructions for effective use of the Plant RNA Reagent from Life Technologies. As indicated, all solutions are prepared with sterile RNase-free water, and all supplies and handling materials are cleaned with RNase AWAY (Ambion) prior to dissection and storage. This protocol is optimized to isolate RNA from approximately 0.1 g of plant tissue. If the amount of plant tissue is increased, reagent volumes must be scaled appropriately.

Grinding the tissue— One of the critical points to obtain high yield in the extraction of genetic material is the grinding. It is essential to grind the tissue as finely as possible, maintaining samples as cold as possible during grinding to avoid degradation. Selection of FastPrep or mortars/pestle depends on the hardness of the tissue being processed.
A FastPrep FP120 Homogenizer (Thermo Savant, Carlsbad, California, USA) was used for grinding floral organs and soft leaf tissue. Approximately 0.1 g of frozen floral organs, whole flowers, and leaves or herbaceous stems were added to FastPrep 2-mL tubes (MP Biomedicals, Santa Ana, California, USA) 1/5 filled with bulk Lysing Matrix D (MP Biomedicals). FastPrep tubes containing the frozen tissue plus Lysing Matrix beads were shaken in the homogenizer (FastPrep) for 40 s at speed 6 (6 m/s) without buffer at room temperature.
For grinding hard tissue or ligneous tissue, such as cone scales from gymnosperms, the tissue was ground under liquid nitrogen in a mortar and pestle that was sterilized and baked (minimum 12 h at 150 ° C). The tissue was ground as finely as possible, and the powdered material was placed in a 1.5-mL tube. The manually ground sample can be added to the FastPrep tube with Lysing Matrix beads (see above) for additional pulverization.

RNA extraction— Once the tissue is sufficiently homogenized:

     1. Add 0.6 mL of cold (4 °C) Plant RNA Reagent (Life Technologies) to pulverized tissue. Mix by brief vortexing or flicking the bottom of the tube until the sample is thoroughly resuspended. If tissue was ground with a FastPrep, homogenize with the cold buffer for an additional 40 s. If the tissue is not completely ground, repeat 1–2 × until the tissue is pulverized. If the tissue was ground with a mortar and pestle and does not need additional grinding, continue with the next step.
     2. Incubate 5 min at room temperature. Placing the samples on a rotator or nutator will help to maximize surface area of the tissue with the extraction buffer.
      3. Clarify the solution by centrifuging for 2 min at 12,000 × g in a microcentrifuge at room temperature. Transfer the supernatant to a tube with Phase Lock Gel (5 Prime, Gaithersburg, Maryland, USA). Although the Phase Lock Gel tubes are not required, they greatly facilitate separation of the organic and aqueous phases and help ensure cleanliness of the sample.
      4. Add 0.1 mL of 5 M NaCl to the sample, tap tube to mix, and add 0.3 mL of chloroform–isoamyl alcohol (24 : 1). Mix thoroughly by inversion and centrifuge the sample at 4 ° C for 10 min at 12,000 × g to separate the phases. Transfer the aqueous (top) phase to an RNase-free tube.
      5. Add to the aqueous phase an equal volume of a mix of LiCl (4 M) (3/4 v) and isopropyl alcohol (1/4 v). Mix and let stand at −20 ° C for 30 min to overnight. If the tissue was stored in RNA later , mix and let stand at −20 ° C for a maximum of 3 h (not overnight). If the precipitation is longer, salts from the RNA later solution could also precipitate. (Note: We have also let the sample stand at −80 ° C for 3 h, and this works as well.)
      6. Centrifuge the sample at 4 ° C for 20 min at 12,000 × g .
      7. Decant or remove supernatant with a pipette, taking care not to lose the pellet. Add 1 mL of 75% ethanol to the pellet. The pellet may be diffi cult to see. To help to see the pellet, you can add 1 μ L of GlycoBlue (Ambion) in step 5.
      8. Centrifuge at 4 ° C for 5 min at 12,000 × g . Decant the liquid carefully, taking care not to lose the pellet. Briefly centrifuge to collect the residual liquid, and remove it with a pipette.
      9. Let dry on ice for 15 min at room temperature and elute pellet in 10–30 μL of RNase-free water. Pipette the water up and down over the pellet to dissolve the RNA. If the pellet is difficult to dissolve, add more water or warm to 37 °C to facilitate the dissolution. It is important to resuspend the pellet completely to obtain an accurate measure of the concentration of your RNA. If the sample is not clean, it can be purified by the cleanup step suggested later. Although some protocols have suggested that performing an additional step of chloroform would clean the RNA samples (e.g., Accerbi et al., 2010 ), we found that an additional chloroform step decreases the RNA yield substantially.

A NanoDrop ND-1000 spectrophotometer (Thermo Scientific, Wilmington, Delaware, USA) can be used to verify the concentration and purity of the RNA obtained. To assess the presence and purity of extracted RNA, use the ratio of absorbance at 230 nm, 260 nm, and 280 nm. If the RNA is pure, we expect a 260/280 ratio around 2, although this ratio does not guarantee pure RNA (see below). If the ratio is appreciably lower, it is an indication of the presence of protein, phenol, or other contaminants that absorb strongly at or near 280 nm. The ratio 260/230 is expected to be around 2–2.2. If this value is appreciably lower, it is an indication that contaminants such as carbohydrates, EDTA, guanidine isothiocyanate, and phenol that absorb at 230 nm are present in the sample. Ratios lower than expected could indicate that additional cleaning is necessary and the optional cleanup should be followed. While a more accurate assessment of the quality will be determined with a bioanalyzer prior to sequencing, this initial NanoDrop read will provide an indication of the presence of RNA, enabling the researcher to continue.

 

Optional cleanup — If the sample is not clean, the following modified cleanup procedure will help to purify the total RNA. This protocol is adapted from that published for DNA cleanup by Rohland and Reich (2012) , using magnetic beads to capture nucleotide material and permit additional washing steps that aid in the removal of undesirable metabolites. All stock solutions and reagents must be prepared with RNase-free water.
      Preparing Sera-Mag beads solution— Begin by preparing 50 mL of SeraMag beads. Add 9 g of PEG-8000, 10 mL of 5 M NaCl, 500 μ L of 1 M Tris-HCl (pH 8.0), and 100 μ L of 0.5 M EDTA (pH 8.0) to a 50-mL Falcon tube. Add 1 mL (9 g) of the carboxyl-modified Sera-Mag Magnetic SpeedBeads (Thermo Scientific, Waltham, Massachusetts, USA; cat. no. 09-981-123) to a 1.5-mL tube. Pellet the beads for 5 min with a magnetic stand designed for 1.5–2-mL tubes. Remove the storage buffer, leaving the tubes in the magnetic stand. Wash beads 1 × with 1 mL TE or water. Remove the tube from the magnetic stand and immediately re-suspend the beads in an additional 1 mL TE or water.
      Add the bead suspension to the prepared 50-mL Falcon tube and wrap the Falcon tube with aluminium foil. Store at 4 ° C for further use. The final concentration of the bead solution is 0.1% carboxyl-modified Sera-Mag Magnetic SpeedBeads, 18% PEG-8000 (w/v), 1 M NaCl, 10 mM Tris-HCl (pH 8.0), 1 mM EDTA (pH 8.0), and 0.05% Tween 20.

RNA cleanup— Bring a measured amount of prepared Sera-Mag beads solution to room temperature at least 30 min prior to use. For maximum binding, measure out 3 × the total RNA volume of the beads solution and place into a 1.5-mL tube along with the RNA. Place tubes on a rotator at room temperature for 10 min.
      Spin the beads solution down before the beads dry permanently onto the wall of the tube. The beads must be spun down very quickly and at low speed to avoid bead precipitation; a mini benchtop centrifuge is recommended, with a spin so quick such that the lid does not need to be closed. Incubate without rotating at room temperature for an additional 10 min to maximize RNA binding. Place the 1.5-mL tubes in the magnetic stand for 5 min, then remove the buffer with a pipette and wash the beads 2 × with 500 μ L of fresh 80% ethanol. After the second wash, remove all ethanol and make sure that no ethanol is left in the samples. Remove the tubes from the magnetic stand and spin beads down from the sides of the wall before they dry. Air-dry the bead pellet for 10 min. Elute with RNase-free water using approximately the same volume as your original sample of RNA.
      Vortex beads and water just to mix, and spin down quickly at low speed as before. Place tubes on a rotator at room temperature for 2–5 min for maximum RNA elution, and spin down quickly. Place tubes in the magnetic stand. Let stand for 5 min and recover eluted RNA in a separate tube.
      A NanoDrop measure is recommended to check quality and yield of RNA.

[强大的进化树编辑软件] Powerful on-line phylogenetic tree editor

Zhang et al (2012)开发了一款很强大的进化树编辑、管理的在线服务程序,EvolView。EvolView是一个进化树可视化的软件,同时可以做各种编辑和处理,同时还支持额外增加一些数据上去,譬如把进化树和其他的表格数据关联起来等。最喜欢的另外一点,他是我目前用到的可视化编辑软件中,画出来的图形最漂亮的。EvolView支持一些列的数据格式例如,Newick, Nexus, Nhx and PhyloXML。图片可以导出高质量的PNG,JPEG,SVG等图片。

EvolView在线网站地址:http://www.evolgenius.info/evolview.htmlF1

 

EvolView, an online tool for visualizing, annotating and managing phylogenetic trees
Huangkai Zhang, Shenghan Gao, Martin J. Lercher, Songnian Hu1, and Wei-Hua Chen

EvolView is a web application for visualizing, annotating and managing phylogenetic trees. First, EvolView is a phylogenetic tree viewer and customization tool; it visualizes trees in various formats, customizes them through built-in functions that can link information from external datasets, and exports the customized results to publication-ready figures. Second, EvolView is a tree and dataset management tool: users can easily organize related trees into distinct projects, add new datasets to trees and edit and manage existing trees and datasets. To make EvolView easy to use, it is equipped with an intuitive user interface. With a free account, users can save data and manipulations on the EvolView server. EvolView is freely available at: http://www.evolgenius.info/evolview.html.

Nucleic Acids Research 40, W569-W572.

doi: 10.1093/nar/gks576

Original TexT from PLoB

AthaMap —- web-tools for genome-wide identification of microRNA targets in Arabidopsis 鉴定拟南芥基因组中miRNA作用位点

‘MicroRNA Targets’, a new AthaMap web-tool for genome-wide identification of miRNA targets in Arabidopsis thaliana


Authors: Lorenz BülowJulio C. BolívarJonas RuheYuri Brill and Reinhard Hehl

BioData Mining 2012, 5:7 doi:10.1186/1756-0381-5-7     PDF

Published: 16 July 2012

Abstract (provisional)

Background

The AthaMap database generates a genome-wide map for putative transcription factor binding sites for A. thaliana. When analyzing transcriptional regulation using AthaMap it may be important to learn which genes are also post-transcriptionally regulated by inhibitory RNAs. Therefore, a unified database for transcriptional and post-transcriptional regulation will be highly useful for the analysis of gene expression regulation.

Methods

To identify putative microRNA target sites in the genome of A. thaliana, processed mature miRNAs from 243 annotated miRNA genes were used for screening with the psRNATarget web server. Positional information, target genes and the psRNATarget score for each target site were annotated to the AthaMap database. Furthermore, putative target sites for small RNAs from seven small RNA transcriptome datasets were used to determine small RNA target sites within the A. thaliana genome.

Results

Putative 41,965 genome wide miRNA target sites and 10,442 miRNA target genes were identified in the A. thaliana genome. Taken together with genes targeted by small RNAs from small RNA transcriptome datasets, a total of 16,600 A. thaliana genes are putatively regulated by inhibitory RNAs. A novel web-tool, ‘MicroRNA Targets’, was integrated into AthaMap which permits the identification of genes predicted to be regulated by selected miRNAs. The predicted target genes are displayed with positional information and the psRNATarget score of the target site. Furthermore, putative target sites of small RNAs from selected tissue datasets can be identified with the new ‘Small RNA Targets’ web-tool.

Conclusions

The integration of predicted miRNA and small RNA target sites with transcription factor binding sites will be useful for AthaMap-assisted gene expression analysis. URL: http://www.athamap.de/

Figure 1. The ‘MicroRNA Targets’ web-tool after performing a search for miRNA163 target genes
Figure 2. Partial screenshot of the sequence window linked to the miRNA163 target site at position 24877969 on chromosome 1

木薯转化方法Robust transformation procedure —Plant Methods

Robust transformation procedure for the production of transgenic farmer-preferred cassava cultivars

Ima Zainuddin, Kim Schlegel, Wilhelm Gruissem and Herve Vanderschuren

Plant Methods 2012, 8:24. doi: 10.1186/1746-4811-8-24 PDF

Abstract

Recent progress in cassava transformation has allowed the robust production of transgenic cassava even under suboptimal plant tissue culture conditions. The transformation protocol has so far been used mostly for the cassava model cultivar 60444 because of its good regeneration capacity of embryogenic tissues. However, for deployment and adoption of transgenic cassava in the field it is important to develop robust transformation methods for farmer- and industry-preferred landraces and cultivars. Because dynamics of multiplication and regeneration of embryogenic tissues differ between cassava genotypes, it was necessary to adapt the efficient cv. 60444 transformation protocol to genotypes that are more recalcitrant to transformation. Here we demonstrate that an improved cassava transformation protocol for cv. 60444 could be successfully modified for production of transgenic farmerpreferred cassava landraces. The modified transformation method reports on procedures for optimization and is likely transferable to other cassava genotypes reportedly recalcitrant to transformation provided production of high quality friable embryogenic callus (FEC). Because the three farmer-preferred cassava landraces selected in this study have been identified as resistant or tolerant to cassava mosaic disease (CMD), the adapted protocol will be essential to mobilize improved traits into cassava genotypes suitable for regions where CMD limits production.

image

Figure 1 Primary somatic embryos of cassava genotypes: A. cv. 60444, B. 2ndAgric, C. Oko-iyawo, D. Abbey-ife

image

Figure 2 Proliferating FEC from cassava genotypes: (A) cv. 60444, (B) 2ndAgric, (C) Oko-iyawo, (D) Abbey-ife

image

Figure 5 GUS staining of transformed cassava landraces: (A) cv. 60444, (B) 2ndAgric, (C) Oko-iyawo, (D) Abbey-ife

RPKM(Reads Per Kilobase of exon model per Million mapped reads)简介

Definition of RPKM

RPKM, Reads Per Kilobase of exon model per Million mapped reads, is defined in this way [Mortazavi et al., 2008]: $ \emph{RPKM} = \frac{\emph{total exon reads}}{\emph{mapped reads(millions)} \times \emph{exon length (KB)}}$ .

Total exon reads
This is the number in the column with header Total exon readsin the row for the gene. This is the number of reads that have been mapped to a region in which an exon is annotated for the gene or across the boundaries of two exons or an intron and an exon for an annotated transcript of the gene. For eukaryotes, exons and their internal relationships are defined by annotations of type mRNA.
Exon length
This is the number in the column with the header Exon lengthin the row for the gene, divided by 1000. This is calculated as the sum of the lengths of all exons annotated for the gene. Each exon is included only once in this sum, even if it is present in more annotated transcripts for the gene. Partly overlapping exons will count with their full length, even though they share the same region.
Mapped reads
The sum of all the numbers in the column with header Total gene reads. The Total gene reads for a gene is the total number of reads that after mapping have been mapped to the region of the gene. Thus this includes all the reads uniquely mapped to the region of the gene as well as those of the reads which match in more places (below the limit set in the dialog in figure 18.127) that have been allocated to this gene’s region. A gene’s region is that comprised of the flanking regions (if it was specified in figure 18.127), the exons, the introns and across exon-exon boundaries of all transcripts annotated for the gene. Thus, the sum of the total gene reads numbers is the number of mapped reads for the sample. This number can be found in the RNA-seq report’s table 3.1, in the ‘Total’ entry of the row ‘Counted fragments’. (The term ‘fragment’ is used in place of the term ‘read’, because if you analyze paired reads and have chosen the ‘Default counting scheme’ it is ‘fragments’ that is counted, rather than reads (two reads in a pair will be counted as one fragment).
from CLCBIO

————————————————————————————————————————————————————-

RNA-seq是透过次世代定序的技术来侦测基因表现量的方法,在衡量基因表现量时,若是单纯以map到的read数来计算基因的表现量,在统计上是一件相当不合理事,因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表现量较高,而错估基因真正的表现量,所以Ali Mortazavi等人在2008年提出以RPKM在估计基因的表现量。

RPKM是将map到基因的read数除以map到genome的所有read数(以million为单位)与RNA的长度(以KB为单位)。

其公式为:

其中,total exon reads / mapped reads (millions) 可以视为所有read 数中有百分之多少是map 到这个基因,然后再除以基因长度,就可以某基因得到单位长度有百分之多少的total mapped read 有表现。

以下就用一个简化的例子来说明RPKM的运用方式与概念:

假设一基因体只有两个基因,一个9 KB,一个1 KB,如今有一sample,其map 到9 KB 的read 有18 million 个,map 到1 KB 的有2 million 个,如下图所示。

对于9 KB 的基因而言,

Total exon reads=18 million

Mapped reads=18+2=20 million

Exon length=9 KB

RPKM =18/(20*9)=0.1

对于1 KB 的基因而言,

Total exon reads=2 million

Mapped reads=18+2=20 million

Exon length=1 KB

RPKM =2/(20*1)=0.1

由此我们可以知道这两个基因表现量没有差别。

假设此时我们有另一个sample,其表现如下图所示:

我们可以发现此sample中9 KB基因的read数明显比上一个sample少,如果我们计算RPKM可以得到RPKM = 9/((9+1)*9)=0.1,却与上一个sample相同,这可能是因为cDNA浓度较低或是其他sample备制过程的问题,造成整体read变少,但是对9 KB基因而言,其read数占所有read数的比例并没有发生改变,所以其表现量会和上一个sample相同。

from Public Library of Bioinformatics

高通量测序技术相关的名词解释

高通量测序技术是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在有些文献中称其为下一代测序技术(next generation sequencing)足见其划时代的改变,同时高通量测序使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,所以又被称为深度测序(deep sequencing)。

de novo测序

de novo测序也称为从头测序:其不需要任何现有的序列资料就可以对某个物种进行测序,利用生物信息学分析手段对序列进行拼接,组装,从而获得该物种的基因组图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。随着新一代测序技术的飞速发展,基因组测序所需的成本和时间较传统技术都大大降低,大规模基因组测序渐入佳境,基因组学研究也迎来新的发展契机和革命性突破。利用新一代高通量、高效率测序技术以及强大的生物信息分析能力,可以高效、低成本地测定并分析所有生物的基因组序列。

重测序

全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。通过构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

外显子测序

外显子组测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。

small RNA测序

Small RNA(micro RNAs、siRNAs和 pi RNAs)是生命活动重要的调控因子,在基因表达调控、生物个体发育、代谢及疾病的发生等生理过程中起着重要的作用。Illumina能够对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。实验时首先将18-30 nt范围的Small RNA从总RNA中分离出来,两端分别加上特定接头后体外反转录做成cDNA再做进一步处理后,利用测序仪对DNA片段进行单向末端直接测序。通过Illumina对Small RNA大规模测序分析,可以从中获得物种全基因组水平的miRNA图谱,实现包括新miRNA分子的挖掘,其作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。

chip测序

染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白、转录因子等互作的DNA区段。

ChIP-Seq的原理是:首先通过染色质免疫共沉淀技术(ChIP)特异性地富集目的蛋白结合的DNA片段,并对其进行纯化与文库构建;然后对富集得到的DNA片段进行高通量测序。研究人员通过将获得的数百万条序列标签精确定位到基因组上,从而获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

表达谱

基因表达谱(gene expression profile):指通过构建处于某一特定状态下的细胞或组织的非偏性cDNA文库,大规模cDNA测序,收集cDNA序列片段、定性、定量分析其mRNA群体组成,从而描绘该特定细胞或组织在特定状态下的基因表达种类和丰度信息,这样编制成的数据表就称为基因表达谱

miRNA测序

成熟的microRNA(miRNA)是17~24nt的单链非编码RNA分子,通过与mRNA相互作用影响目标mRNA的稳定性及翻译,最终诱导基因沉默,调控着基因表达、细胞生长、发育等生物学过程。基于第二代测序技术的microRNA测序,可以一次性获得数百万条microRNA序列,能够快速鉴定出不同组织、不同发育阶段、不同疾病状态下已知和未知的microRNA及其表达差异,为研究microRNA对细胞进程的作用及其生物学影响提供了有力工具。

mRNA测序

转录组学(transcriptomics)是在基因组学后新兴的一门学科,即研究特定细胞在某一功能状态下所能转录出来的所有RNA(包括mRNA和非编码RNA)的类型与拷贝数。Illumina提供的mRNA测序技术可在整个mRNA领域进行各种相关研究和新的发现。mRNA测序不对引物或探针进行设计,可自由提供关于转录的客观和权威信息。研究人员仅需要一次试验即可快速生成完整的poly-A尾的RNA完整序列信息,并分析基因表达、cSNP、全新的转录、全新异构体、剪接位点、等位基因特异性表达和罕见转录等最全面的转录组信息。简单的样品制备和数据分析软件支持在所有物种中的mRNA测序研究。

功能基因组学

功能基因组学(Functuional genomics)又往往被称为后基因组学(Postgenomics),它利用结构基因组所提供的信息和产物,发展和应用新的实验手段,通过在基因组或系统水平上全面分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入对基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括:生物学功能,如作为蛋白质激酶对特异蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内信号传递途径;发育上功能,如参与形态建成等。采用的手段包括经典的减法杂交,差示筛选,cDNA代表差异分析以及mRNA差异显示等,但这些技术不能对基因进行全面系统的分析,新的技术应运而生,包括基因表达的系统分析(serial analysis of gene expression,SAGE),cDNA微阵列(cDNA microarray),DNA 芯片(DNA chip)和序列标志片段显示(sequence tagged fragments display。

比较基因组学

比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性,克隆人类疾病基因,揭示基因功能和疾病分子机制,阐明物种进化关系,及基因组的内在结构。

表观遗传学

表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达了可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因组印记(genomic impriting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。

计算生物学

计算生物学是指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等。当前,生物学数据量和复杂性不断增长,每14个月基因研究产生的数据就会翻一番,单单依靠观察和实验已难以应付。因此,必须依靠大规模计算模拟技术,从海量信息中提取最有用的数据。

基因组印记

基因组印记(又称遗传印记)是指基因根据亲代的不同而有不同的表达。印记基因的存在能导致细胞中两个等位基因的一个表达而另一个不表达。基因组印记是一正常过程,此现象在一些低等动物和植物中已发现多年。印记的基因只占人类基因组中的少数,可能不超过5%,但在胎儿的生长和行为发育中起着至关重要的作用。基因组印记病主要表现为过度生长、生长迟缓、智力障碍、行为异常。目前在肿瘤的研究中认为印记缺失是引起肿瘤最常见的遗传学因素之一。

基因组学

基因组学(英文genomics),研究生物基因组和如何利用基因的一门学问。用于概括涉及基因作图、测序和整个基因组功能分析的遗传学分支。该学科提供基因组信息以及相关数据系统利用,试图解决生物,医学,和工业领域的重大问题。

DNA甲基化

DNA甲基化是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5’碳位共价键结合一个甲基基团。正常情况下,人类基因组“垃圾”序列的CpG二核苷酸相对稀少,并且总是处于甲基化状态,与之相反,人类基因组中大小为100—1000 bp左右且富含CpG二核苷酸的CpG岛则总是处于未甲基化状态,并且与56%的人类基因组编码基因相关。人类基因组序列草图分析结果表明,人类基因组CpG岛约为28890个,大部分染色体每1 Mb就有5—15个CpG岛,平均值为每Mb含10.5个CpG岛,CpG岛的数目与基因密度有良好的对应关系[9]。由于DNA甲基化与人类发育和肿瘤疾病的密切关系,特别是CpG岛甲基化所致抑癌基因转录失活问题,DNA甲基化已经成为表观遗传学和表观基因组学的重要研究内容。

基因组注释

基因组注释(Genome annotation) 是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因识别的核心是确定全基因组序列中所有基因的确切位置。

Sanger法测序

Sanger法测序利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。

五年的western blot经验总结[转载]

1.抗体的选择
对于国内的大多数实验室来讲,做western blot实验选择抗体是个头疼的问题。原因很简单,买进口抗体捉襟见肘,买国产抗体得需要大无畏的勇气,对于我所在的兰州地区的实验者而言,感触尤深。在这五年的western blot实验历程里,我先后用过进口抗体,进口抗体国内分装包装,国产抗体,质量良莠不齐。
进口抗体一般不会出现闪失:abcam品种全,质量过硬,但价高(3400元/100微升),而且说是100微升,但至多能吸出来90微升;Sigma的价最贵;比较有性价比的是CST的抗体,现在好像是2200元/100微升,我前后用过二十几种, 1:1000的稀释比下,还没有失过手,100微升通常能完成所有的免疫组化和western blot实验,还有一个优点是通常量比100微升多出来10微升,唯一的不足是CST的品种实在不多。Santa的多克隆抗体质量可以,但是选用Santa的单抗还是有风险,估计这也是业界共识了吧。
进口抗体国内分装包装我也用过不少,呵呵,毕竟是穷人(420元/100微升),大概好抗体的比例约为50%,如果能做出来,也存在一个问题,就是抗体大多只能用一次。我曾经把Santa的原装抗体和分装抗体做过比对(抗体品种,货号等完全一致),在都能做出来的前提下,原装抗体能重复使用的次数要多出许多。具体原因我已经揣测了好几年,不敢说出来,我一直在想是不是冬天西瓜切成牙和整个卖,也会有所不同。揣测归揣测,假如只为了发论文毕业走人,可以考虑选用进口分装的多克隆抗体。
国产抗体比较知名的就几家,但质量确实不敢恭维。western blot能做出来的确实不多,而且杂带多,背景不干净。我们周边的实验室大多买国产抗体做免疫组化,怎么说呢,应付硕士论文够了。
我也帮别人自制过抗体,再用抗原亲和纯化。效价非常不错,夸张的时候1:10000都能做出条带,唯一的麻烦是兔子太骚(骚臭),不知道这是不是“兔女郎”名号的来由。如果读书非常悠闲,老板又特别想拥有手工作坊的情况下,可以自己伺候折腾兔子来玩玩,刚开始的时候还是蛮有成就感的。只是单凭抗原表达和制备多抗,是不是可以写成论文毕业,估计因校而异了。
2.Western Blot设备
目前最好的垂直槽和转移槽还是Biorad(伯乐),尤其是MINI3好用,MINI4可以一次跑四块胶,但通常用不上,由此造成垂直缓冲液的浪费,而且MINI4用绿色塑料夹住玻璃板来组成内槽,容易漏液,塑料夹应该是有疲劳寿命的,估计日子一长,弹性就会改变,所以如果你们实验室刚买了MINI4,赶紧用,遭殃的肯定是某一级的师弟师妹们。
Biorad的一套系统得两万多,西部能玩得起伯乐的还真不多。好在咱中国人聪明,上海天能的外观和构造和伯乐的MINI3几乎一模一样,而且可以通用,不带电泳仪是5千多一套,挺好用的。唯一的不足是塑料寿命不如伯乐,胶架容易断裂。不过仔细算算,三套天能也就是一套伯乐的价格,值了。北京六一的垂直槽很转移槽很好用,但垂直槽配胶不方便,玻板太厚,散热不好,但能用,六一的电泳仪(电源)还是很好用的。
3. Western Blot实验条件
Western Blot实验条件我基本是按ABCAM公司经典教材做的,按以下的网址下载下来就可以了(http://www.abcam.com/ps/pdf/protocols/WB-beginner.pdf)。具体的试剂配方我是按宝生物试剂册的附录部分配制。丙烯酰胺和甲叉我是从北京华美买的德国biomol原装货,配出来的胶可以提在手里玩,弹性非常好,价格比sigma的便宜许多,1公斤好像是480多人民币,够实验室用好长时间,现在我们实验室做双向电泳都用biomol的胶,很好用。Marker我现在用fermantas 的SM1811,2微升就很清晰了,兰州的代理是上海生工。
要强调的是垂直电泳缓冲液千万不能回收用,具体愿因你只需上网查查SDS-PAGE的原理就知道了。转移电泳缓冲液可以回收再用两次。
转膜我通常是快转两百200毫安/2小时,慢转80毫安/12小时。快转是一定得做冰水浴,就是把槽子泡在冰水混合液里。
封闭我通常用BD的脱脂奶粉,不归,260元500克,也是从北京华美买的。
ECL我用pierce的,500毫升1650元,比国产的还便宜好用。
胶片是柯达的,以前用过乐凯的,不如柯达。
我很少用丽春红或考马斯染膜或染胶,总觉得是脱裤子放屁的事。
4. Western Blot实验关键
Western Blot操作步骤多,每一步的失误都会造成全盘失败,综合而言,抗体仍然是决定成败的关键,如果抗体很滥,就是神仙也没招。其中内参抗体很重要,因为内参抗体的选择关系到全盘实验的考评。Actin,Tubulin,GAPDH我都用过,Actin,Tubulin的缺点是有时候会出现复带,比较稳定的还是GAPDH。如果用心看看cell,nature,science上的文章,大多用GAPDH做内参。进口的,国内分装的,国产的,我都用过。进口的最强的1:10000都能做出条带(Upstate,现在被Minipore招安了),国内分装的也好用,但就是不好回收重复使用,国产的一般只能用一次。我要特别强调的是,实验室里最贵的抗体实际上是内参抗体,因为只要Western Blot开工,每次都得用内参抗体,而一般目的蛋白的抗体也就用几次,重复三次就了事。但内参抗体是不折不扣的耗材,严格意义上将,每跑一次胶,就得杂一次内参,使用频率最高决定了内参是最花钱的抗体。我也自己制备过内参抗体,但好像因为种属同源性太高,背景总是不干净。进口的好,太贵;国产的只能使用一次,年终算账,不比进口的便宜。我自己的体会是多抗制备并不是技术含量极高的事,为什么国内企业高的早不了,低的造不好呢?现在我用的是杭州贤至的GAPDH兔多抗,200微升420元钱,我在蛋白上样量12微升/孔的情况下,按1:2000稀释比,条带非常清晰,没有杂带,是我目前用过的最好的国产抗体,我估计按1:4000照样能做出来,因为按按1:2000稀释做,在暗室里点上ECL后肉眼清楚地看到荧光条带。抗体我在不加叠氮化钠的情况下4度过夜杂交,可回收重复使用5到6次。最早我是2008年在丁香通上看到了杭州贤至(当时名叫杭州松华)发布的广告,我就怂恿实验室主管买了2支,很好用,现在实验室都没有用完 ;2009年我的一个朋友做western,我推荐他又买了1支,做出来的效果确实好,2009年底我到了新的实验室,western的全套我在新实验室重新建立,啥都采购齐了,可就是买不到杭州松华的内参抗体,我上网再也找不到这个公司的网页了,没办法,只好一直噌朋友的内参抗体用。我有个陋习,就是实验中用顺了用稳定了试剂轻易不愿意更换品牌。还好,今年7月份我终于找到了当年的通讯记录,一联系才知道他们改名叫杭州贤至生物科技有限公司了,呵呵,改了个名,害我找了大半年。第三次买到的GAPDH内参抗体,还是好用,1:2000,条带清晰,回收重复用,照样work,截止目前,我的新导师对我采购的一堆试剂还没有不满意的,嘿嘿!草根出生,我也照样有我穷人的劳斯莱斯。
5.关于奶粉,膜的选择和显影定影
奶粉看似简单,其实很重要,如果要凑合,可以到超市买光明的脱脂奶粉。奶粉质量不好,会最终导致显影要么漆黑一片,要么啥都没。fluka的很好,可惜因为疯牛病的原因,现在海关禁止进口美国牛制品。我现在用的bd的,很好很稳定,如果回收使用,500可以用很长时间。细菌达到一定极限后,会导致tbst里的奶粉变质,表现为发绿发臭,一种肉眼可察觉的淡淡的绿,一种鼻子凑过去能嗅出的臭,这时候就得扔了。
nc膜,pvdf膜我都用过,现在我已经固定下来用密理博的0.45微米的pvdf膜。pvdf膜的好处是蛋白载量大,韧性好。唯一的麻烦是事先得用甲醇泡几分钟,目的好像是为了增强膜的正电荷。甲醇泡完后,得在转移缓冲液里泡一两分钟。国内用nc膜的人多一些,主要是因为nc膜有分装的小片,忽悠老板买一张膜就100元钱,老板肯定乐意,若是说膜得花上千元,老板就有可能长时间的思考,然后过些日子再答复你。所以大多数人会采取前一种方式,当然得告诉老板好几次,膜就100元钱。我第一次用到pvdf膜是和好几个实验室合资买了一卷,我出了475元,类似于打的拼车的方式。现在pvdf膜国内大概是1600元到1700元一卷,33厘米*375厘米,够好几个人用好长时间了,膜假货不多,至少我没有见过。我们几个拼车的穷弟兄拿着尺子分赃的时候才发现本地供货商给我们送的货少了80厘米,嘿嘿,穷鬼撵着杀叫鬼,我们花钱容易吗!所以交涉,再交涉,直到他把我们的血汗膜返还才罢休。现在我基本是从北京的欣津科和华美买,大概1700元一卷,完完整整。
0.45微米的pvdf膜我用5%的脱脂奶粉(溶于tbst中)室温封闭1小时,0.22微米的用8%的脱脂奶粉。bsa我很少用,主要是bsa会出现封闭不均匀的情况。我也很少用0.22微米的膜,原因是背景不干净,再者无论是封闭时间还是洗膜时间都得延长。标准教程上推荐20kd以下的分子用0.22微米的膜,我杂过最小的分子是cleaved-caspase3,12ka,按我在一楼的转膜条件,在0.45微米的膜上清清楚楚。我在上海的师弟他们转7ka的分子也用0.45微米的,没出过事。废话一句,我师弟的实验室可是国家重点,那个富呀,让我闭上眼想想吧,那可是屎壳郎掉到了化粪池的感觉。
一抗我一般4度摇床过夜,洗膜3此,每次5分钟。要注意的是,如果一抗里添加了叠氮化钠,务必洗膜5次,每次10分钟,因为叠氮化钠会灭活二抗偶联的辣根过氧化物酶(hrp)活性。二抗我用的是中杉金桥分装的,120元一支,通常1:5000,室温1小时,然后洗膜三次,每次5分钟。
奶粉,一抗,二抗,我都回收,从开始到现在,一直如此。因为我不敢忘记自己贼的出身。我的一抗是国外的一位老师送给实验室的,刚开始的半年我啥都做不出来,以至于导师在平安夜领我到教堂祈祷。上海的师弟知道后,每次裁膜的时候给我一小片一小片日积月累了一些,二抗只拿到了10微升,我怕实验室的人发现,一直是熬夜做western。可最终还是因为我自己嘴不牢靠,导致东窗事发,师弟险些被开除,事情败露的那天,师弟在长途电话的那边哭,我在这边哭,写着写着,我的眼泪又一次的盈眶而出,说不出的辛酸与悲凉,师弟说他承担一切责任,让我装作不知道,那天晚上,我给他的导师写了一封长信,只求能保住师弟。老天保佑,他导师让师弟写检查认错。那以后,我再也没有让师弟为我偷过东西,我不能再为自己的理想让朋友付出代价。虽然现在实验室的老板比较大方,我依然坚持着回收试剂的习惯,我始终不能忘记自己western blot的开始。
一般8.3*4.3厘米的膜,大概要400微升的ecl混合液。加ecl我一般就在灯光下,或者白天把窗帘拉上。加好ecl,覆上保鲜膜后,我才端着暗盒进暗室,暗室里我的暗室红灯始终开着,没有那么可怕。在暗室里,我一般是剪4张同样尺寸的胶片,叠在一起,压在膜上方,暗盒一扣,就干别的事情去了。5个小时或过夜,我再把胶片显影,显影我起初很注意技巧,但现在基本上是在显影液里放10分钟,捞出来放到水盘里涮一涮,然后在定影液里放十分钟。我一般总能找到一张理想的胶片,因为胶片叠加到一起后,层层屏蔽,从而逐渐递减荧光强度,我试过多次,即便是荧光强度最强的内参,也至多能达到最上面的第四层胶片。所以显定影后,肯定有曝光过度的胶片,但也肯定有趋势,背景,强度恰到好处的一张,嘿嘿,傻瓜做法。
傻瓜做法看似呆笨,实则不然。我在很长的一段时间里,都是读秒,或三分钟,或15分钟,或半小时,或1小时取出胶片显影,眼睛紧紧盯着,一看到条带就捞出来定影。如果不理想,再压胶片,再等,再取再投再捞,活脱脱是个“猴埋儿”。西北人传说小猴夭折了,母猴把小猴埋到土里面,一会又挖出来,再埋进去,又挖出来…反复无止。显定影时如果采取猴埋儿式的技巧,是最费胶片,最费时间,最费心力的做法。所以我是傻瓜就用傻瓜的办法。
我用过好几个品牌的国产ecl,和进口的ecl也做过对照。国产的一半是a液b液总共50毫升180元钱,单价3.6元/毫升,一般肉眼可见的荧光强度可持续1个小时,pierce和milipore的可以持续3小时。milipore的麻烦之处在于由a液b液c液三组成分组成,费枪头,费脑子。现在我固定使用pierce的super ecl,1650元500毫升,折算下来是3.3元/毫升。上海吉泰是代理。好像分子克隆上写出了ecl的配方,技术含量并不高,
胶片我用过医院放射科的,乐凯的,柯达的,柯达现在小胶片(小暗盒尺寸)好像是130元/50张,乐凯的是其价格的一半。乐凯的缺点在于胶片容易出现划痕,有莫名奇妙的背景,虽然瑕不掩瑜,但还是让人不爽,再就是感光不如柯达的灵敏。这些我都比对过。如果细心地把二者胶片厚度比比,也可看出差距。我就此请教过甘肃的乐凯总代理,他说根源出在牛身上。
显影液定影液我一直用乐凯的,便宜,量又足,谁用谁说好。进口的从未染指,连想都没想过,呵呵,我内心里还是极其渴望支持国货的,爱之深,恨之切啊!
6.总结
从2005年第一次见到抗体到现在,我已经做western blot实验整整五年了。五年里,太多的磨难,太多的惊喜,太多的感触,太多的代价。现在我做博士后,我指导的学生也能一次就上手,虽然他们也会出错,但我很少责备他们,因为我知道自己的路途也并不顺利,如果过度的责难他们,会让他们失去信心,而且更严重的是会导致他们遮遮掩掩,我从来不怕实验做不出来结果,就怕查不出失败的原因。
我喜欢western blot技术,甚至偏爱或痴迷。最夸张的时候是一天连跑带转了八张膜,实验最不顺利的那两个月我天天就睡在实验室里,有时候三天三夜不睡觉。我不知道自己借了多少钱从丁香园的二手资源版淘过别人用剩的抗体,至今我穿的最贵的裤子也就80元钱,但花1000元买抗体我从来没有觉得破费。好在我的家人和朋友们理解我,支持我,让我能逐步实现自己的愿望。五年里,从器具,试剂,仪器,甚至如何用滤纸,我都形成了自己独有的体系和诀窍,我的一切东东都有品牌,这些品牌组合起来就是穷人的劳斯莱斯。
回想过去,内心仍然会浸没到悲凉与辛酸中。最难受的时候是做p21抗体,整整半年,从丁香园淘了五个品牌的抗体,都做不出来。最后逼着导师买cst的抗体,还是不出,那时候正好是2008年雪灾,抗体在公路上走了半个月,我收到抗体是大年初二,兴奋地上样,转膜,还是没有,当时我感觉自己就好像浸没在冰窖里。宿舍里暖气不好,第二天我起床时,房子里的洗脸水都已结冰,和我的心绪一模一样。好在上海吉泰是一级代理,让我投诉,cst美国总部发回来他们的蛋白阳性对照品,再试,p21出来了,技术支持是个印度人,一眼就看出来我没有用超声波裂解。我们实验室没有这个东东,我怎么就想不到问题就出在这呢!从投诉到解决问题又是两个月。因为western,造成我博士延期一年半,害得师弟差点被开除,这也是我主动和导师关系疏远的开始。
但我还是痴迷western,在我心里,western blot技术本身就是穷人的劳斯莱斯。跑一次胶,我一次可以在两张膜上裁切出13种分子,我想不出还有哪项技术能一次实现如此之多的指标。Western稳定,直观,看着胶片上那粗细浓淡变化的条带,就好像自己置身细胞内部,看着那些分子组合跳舞。我内心里一直非常感激当年馈赠抗体的那位老师,是他让我踏上了信号转导的道路,也是因为western,我一度和他几乎决裂。在做western之前,我看文献几乎只看review,因为我看不懂实验性论文的图片,也正是做western,我才开始真正的踏上科研道路。我逐渐能看懂IP,CO-IP,EMSA,CHIP,我有了更多的梦想与愿望。五年中,我最得意的是陪着western blto的发明人乔治斯塔克(George R. Stark)院士去敦煌玩,老头年过70,动过心脏手术不久,仍然坚持赤脚爬上陡峭的鸣沙山。我们登顶歇气时,老头一声不吭地又从山顶一步步走下去,从半山腰挖什么东西,等他再上来,我们才看清楚,他手里拿着两个游客随地扔弃的矿泉水瓶子。老头一直把那两个国货拎到了山下的垃圾箱里。这是老头给我最深刻的记忆,境当谋高远,一个人的精神境界决定了他专业道路的高远。
从western实验我总结出,实验上根本省不下来钱,一个环节的烂货就会导致全盘失败。对于实验设计而言,也是如此,一个步骤的bug会导致整个实验立题和评估的逻辑混乱。如果要追求性价比,也就是如何发挥穷人的劳斯莱斯的最大收益,那从一开始就要按秋后算账的原则选择试剂,要算总账;如果要让实验顺顺利利,那就得注意每一个环节,步步为营,细节决定成败。到现在,只要抗体work,几乎没有我做不出来的分子,western给了我无穷的自信。

P-values, False Discovery Rate (FDR) and q-values

What are p-values?

The object of differential 2D expression analysis is to find those spots which show expression difference between groups, thereby signifying that they may be involved in some biological process of interest to the researcher. Due to chance, there will always be some difference in expression between groups. However, it is the size of this difference in comparison to the variance (i.e. the range over which expression values fall) that will tell us if this expression difference is significant or not. Thus, if the difference is large but the variance is also large, then the difference may not be significant. On the other hand, a small difference coupled with a very small variance could be significant. We use the one way Anova test (equivalent t-test for two groups) to formalise this calculation. The tests return a p-value that takes into account the mean difference and the variance and also the sample size. The p-value is a measure of how likely you are to get this spot data if no real difference existed. Therefore, a small p-value indicates that there is a small chance of getting this data if no real difference existed and therefore you decide that the difference in group expression data is significant. By small we usually mean 0.05.

 

What are q-values, and why are they important?

False positives

A positive is a significant result, i.e. the p-value is less than your cut off value, normally 0.05. A false positive is when you get a significant difference when, in reality, none exists. As I mentioned above, the p-value is the chance that this data could occur given no difference actually exists. So, choosing a cut off of 0.05 means there is a 5% chance that we make the wrong decision.

The multiple testing problem

When we set a p-value threshold of, for example, 0.05, we are saying that there is a 5% chance that the result is a false positive. In other words, although we have found a statistically significant result, in reality, there is no difference in the group means. While 5% is acceptable for one test, if we do lots of tests on the data, then this 5% can result in a large number of false positives. For example, if there are 200 spots on a gel and we apply an ANOVA or t-test to each, then we would expect to get 10 false positives by chance alone. This is known as the multiple testing problem.

Multiple testing and the False Discovery Rate

While there are a number of approaches to overcoming the problems due to multiple testing, they all attempt to assign an adjusted p-value to each test, or similarly, reduce the p-value threshold. Many traditional techniques such as the Bonferroni correction are too conservative in the sense that while they reduce the number of false positives, they also reduce the number of true discoveries. The False Discovery Rate approach is a more recent development. This approach also determines adjusted p-values for each test. However, it controls the number of false discoveries in those tests that result in a discovery (i.e. a significant result). Because of this, it is less conservative that the Bonferroni approach and has greater ability (i.e. power) to find truly significant results.

Another way to look at the difference is that a p-value of 0.05 implies that 5% of all tests will result in false positives. An FDR adjusted p-value (or q-value) of 0.05 implies that 5% of significant tests will result in false positives. The latter is clearly a far smaller quantity.

q-values

q-values are the name given to the adjusted p-values found using an optimised FDR approach. The FDR approach is optimised by using characteristics of the p-value distribution to produce a list of q-values. In what follows I will tie up some ideas and hopefully this will help clarify some of the ideas about p and q values.

It is usual to test many hundreds or thousands of spot variables in a proteomics experiment. Each of these tests will produce a p-value. The p-values take on a value between 0 and 1 and we can create a histogram to get an idea of how the p-values are distributed between 0 and 1. Some typical p-value distributions are shown below. On the x-axis we have histogram bars representing p-values. Each has a width of 0.05 and so in the first bar (red or green) we have those p-values that are between 0 and 0.05. Similarly, the last bar represents those p-values between 0.95 and 1.0, and so on. The height of each bar gives an indication of how many values are in the bar. This is called a density distribution because the area of all the bars always adds up to 1. Although the two distributions appear quite different, you will notice that they flatten off towards the right of the histogram. The red (or green) bar represents the significant values, if you set a p-value threshold of 0.05.

pvaluegraph

If there are no significant changes in the experiment, you will expect to see a distribution more like that on the left above while an experiment with significant changes will look more like that on the right. So, even if there are no significant changes in the experiment, we still expect, by chance, to get p-values < 0.05. These are false positives, and shown in red. Even in an experiment with significant changes (in green), we are still unsure if a p-value < 0.05 represents a true discovery or a false positive. Now, the q-value approach tries to find the height where the p-value distribution flattens out and incorporates this height value into the calculation of FDR adjusted p-values. We can see this in the histogram below. This approach helps to establish just how many of the significant values are actually false positives (the red portion of the green bar).

pvaluegraph2

Now, the q-values are simply a set of values that will lie between 0 and 1. Also, if you order the p-values used to calculate the q-values, then the q-values will also be ordered. This can be seen in the following screen shot from Progenesis SameSpots. Notice that q-values can be repeated.

stats-table

To interpret the q-values, you need to look at the ordered list of q-values. There are 839 spots in this experiment. If we take spot 52 as an example, we see that it has a p-value of 0.01 and a q-value of 0.0141. Recall that a p-value of 0.01 implies a 1% chance of false positives, and so with 839 spots, we expect between 8 or 9 false positives, on average, i.e. 839*0.01 = 8.39. In this experiment, there are 52 spots with a value of 0.01 or less, and so 8 or 9 of these will be false positives. On the other hand, the q-value is a little greater at 0.0141, which means we should expect 1.41% of all the spots with q-value less than this to be false positives. This is a much better situation. We know that 52 spots have a q-value less than 0.0141 and so we should expect 52*0.0141 = 0.7332 false positives, i.e. less than one false positive. Just to reiterate, false positives according to p-values take all 839 values into account when determining how many false positives we should expect to see while q-values take into account only those tests with q-values less the threshold we choose. Of course, it is not always the case that q-values will result in less false positives, but what we can say is that they give a far more accurate indication of the level of false positives for a given cut-off value.

When doing lots of tests, as in a proteomics experiment, it is more intuitive to interpret p and q values by looking at the entire list of values in this way rather that looking at each one independently. In this way, a threshold of 0.05 has meaning across the entire experiment. When deciding on a cut-off or threshold value, you should do this from the point of view of how many false positives will this result in, rather than just randomly picking a p- or q-value of 0.05 and saying that everything with a value less than this is significant.

Original Link

定量PCR仪新应用

本帖引用网址:http://bbs.bbioo.com/thread-50919-1-1.html

定量PCR仪新应用:SNP和基因突变检测
定量PCR仪最主要的功能是测定样品中DNA或RNA的浓度,但是也不仅仅局限于此。如果定量PCR仪的硬件和软件设计精良,具备多色检测能力,运用的又是分子生物学中应用广泛的基本原理,如TaqMan探针,就为用户灵活运用、开拓新的研究和 应用留下了很大余地,可以开展单核苷酸多态性(Single Nucleotide Polymorphism,SNP)研究、等位基因鉴定、基因突变检测、正/负检测等许多项目。因为TaqMan探针杂交本质上就是分子杂交,凡是用到分 子杂交的研究,都可以通过定量PCR来完成。
1  TaqMan探针技术原理
探针是与目标核酸序列专一性结合的核酸片段,用于探测、确认和定量样品中的目标序列。由于结合是特异的,检测出来的只能是目标序列,而不是其同源片段。当然这需要在设计探针时进行全基因组的同源性扫描(如BLAST)来保证。
如果希望检测基因中的点突变或SNP位点,要用到两条不同的探针:一条针对正常或主要的序列,一条针对突变或少数的序列。TaqMan探针杂交检测的原理 与Southern和Northern杂交一样。为了探测探针的存在,需要在探针上作一些标记,常用的如放射性核素、地高辛、生物素、荧光基团等。荧光标 记由于既安全又灵敏,是当前的标记主流。
为了区别,需要在不同的探针上标记不同颜色的荧光基团。为了只检测杂交成功的探针所产生的荧光信号,需要在探针上再加一个淬灭基团:探针完整时,报告基团 发射的能量被淬灭基团吸收,仪器检测不到信号;探针断裂后,两种基团相距遥远,无法淬灭,仪器才能检测到信号。这样的探针就是TaqMan探针。为了在探 针断裂与探针杂交之间建立联系,同时放大信号强度,需要利用PCR过程:一方面利用Taq酶的5’→3’链延伸活性,完成PCR,放大DNA;另一方面利 用其3’→5’核酸外切酶活性,在链延伸过程中同时切断探针,产生荧光信号。将探针置于两条引物之间,则Taq酶切断的探针都是与模板DNA杂交结合的; 而且,每生成一条PCR产物,切断一条探针,产生一个单位的荧光信号,所以信号强度与PCR产物数量同步增长。
SNP分析、基因突变检测、等位基因鉴定、正/负检测等应用虽然相去甚远,但共同点都是检测样品中的两种不同片段:不同的SNP多态、正常和突变的基因、 不同的等位基因等等,所以都可以应用TaqMan探针技术。作定量PCR,需要1对PCR引物和1条探针;作等位基因鉴定则需要1对引物和2条探针。定量 PCR是实时动态检测,确定CT值;等位基因鉴定只需要在PCR完成后检测总的荧光信号。这是它们之间的区别。
TaqMan探针的淬灭基团有两种:普通的TaqMan探针淬灭基团是TAMRA,它也发射荧光,构成本底的一部分;MGB探针则采用非荧光淬灭基团 (Non-Fluorescent Quencher,NFQ),本身不发荧光,所以信噪比更高,探测更灵敏。MGB探针上另外还有一个MGB (Minor Groove Binder)基团, 它可以在不增加长度的情况下将探针的Tm值提高10°C左右,因此MGB探针可以设计得更短。这一方面降低了探针合成的成本,一方面也大大增加了探针设计 成功的机会。另外,实验证明,MGB探针对于富含A/T的模板可以区分得更为理想。
2   SNP分析
2.1  定义和分类
单核苷酸多态性(single nucleotide polymorphism,SNP)是指在基因组水平上由单个核苷酸变异引起的DNA序列多态性,即基因组内特定位置上存在两种不同的碱基,其中少一种在群体中的频率不小于1%。
单个碱基的改变在人群中的发生频率(等位基因频率)只能在0%到50%之间。如果等位基因频率<1%,一般称为基因突变,而不是多态性;等于50%,称为杂合子;二者之间的才是多态性。绝大多数SNP是二态性的,只有2种等位基因。
SNP是人类可遗传变异中最常见的一种,占所有已知多态性的90%以上。人基因组平均每1000个碱基中就有1个SNP,至2002年6月,总数400多万个。
SNP主要根据它们在基因组中所处的位置和生物学效应分类,见表1。
表1  SNP分类
位  置        对基因功能的影响        类 型        生物学效应
编码区        沉默,如UUG CUG,都编码Leu。        sSNP        通常不改变表型。
编码区        导致氨基酸改变,如UUC UUA导致Phe Leu。这种SNP不多见但是最有价值,可能被专利保护。        cSNP        改变表型。由于氨基酸置换的类型和部位不同,作用微妙。
编码区        导致终止密码,如UCA UGA导致Ser Stop。        cSNP        改变表型。
调控区        提高或降低转录速率。        rSNP        可能改变表型。
其  他        最常见,对基因产物没有影响(?),作为多基因遗传病的遗传标记。有人称之为Anonymous SNP。              
如果cSNP或rSNP导致蛋白质的功能或表达发生变化,也称为pSNP。在人类基因组中,cSNP或pSNP约占全部SNP的2%,也就是大约8万个。
2.2  研究意义
   SNP的应用范围较微卫星标记更加宽广,对群体遗传学、制药业、法医学、癌症及遗传性疾病甚至进化的研究都将产生不可估量的影响。人们希望通过研究SNP图谱,更深刻地认识癌症、糖尿病、血管性疾病和某些精神性疾病等发病率高的多基因疾病的发生机制。
(1)  遗传病致病基因的连锁定位
    SNP作为遗传标记,可以用来进行单基因和多基因遗传病的连锁分析(linkage analysis)或关联分析(association analysis)。在疾病易感基因的定位方面,SNP的定位精度比微卫星标记精细得多,可以直接用于指导易感基因克隆。
    人类的遗传连锁图谱至今已发展到了第三代。第一代是限制性片段长度多态性(RFLP)图谱,第二代是微卫星图谱,第三代是SNP图谱。SNP的优点在于: (1) SNP是二态性的,在任何人群中其等位基因频率都可估计出来;(2) SNP在基因组中的分布比微卫星标记更广泛;(3) SNP是相对稳定的,而STR的高突变率容易导致在人群遗传分析时出现困难;(4)部分SNP会直接影响到蛋白质结构或基因表达水平,本身可能就是疾病遗传机制的候选改变位点。
(2)  SNP与药物遗传学和药物基因组学
个体化用药。同一种药物,对不同的病人治疗效果有时差异显著。造成这种差异的原因是由于药物在不同的个体内活化、代谢和清除等方面的基因差异所决定的,这 种差异主要是SNP。研究SNP与药物的个体敏感性或耐受性之间的关联,可以阐明与药物疗效以及毒副作用相关的SNP基因型,从而为针对性地使用药物提供 依据。这就是所谓的“药物百家姓”。
为寻找新药提供依据。药物基因组学研究遗传因素对药物作用的影响和不同基因型个体对药物反应的差异,从而为根据不同基因型群体对药物的反应来改进药物设计 提供理论依据。这是当前制药行业对SNP表现出空前兴趣的原因。目前FDA在批审的新药中至少有15种新药要求进行病人的基因分型。
2.3  SNP基因分型的研究方法
SNP研究分为3个阶段:发现,常用重复测序和in silico分析技术;确认并测算其等位基因频率,常用单碱基延伸技术;筛查,也就是开展与SNP有关的研究项目,一般采用5’核酸酶试验和MGB探针技术。
    SNP基因分型研究方法的选择应该从以下几个方面进行评估:准确性、操作自动化程度、通量高低和每一个样本的分析成本。考虑这些因素,荧光定量PCR是临 床基因分型研究的首选技术平台。准确:TaqMan MGB探针的长度只需13-18个碱基,一个碱基的不同可以使两种探针的Tm值相差18度,检测SNP的准确性极高。方便:操作与PCR一样,是所有分型 方法中最简便的,而且是目前唯一的一步扩增即可完成的SNP基因分型方法。试剂盒商品化:如ABI公司提供20万个位点的SNP基因分型试剂盒,构成一个 以功能基因为中心的、高分辨率的定位标记图谱,是疾病研究、侯选药物筛选和药物疗效关联研究的有力工具。
2.4  TaqMan探针技术在SNP研究中的应用
在SNP基因分型的PCR反应体系中包括1对引物和2条探针。这2条探针分别针对SNP的两种等位基因,并分别被标记上不同颜色的荧光基团。如果使用 ABI公司的Assays-on-Demand试剂盒,实验操作非常简单:加入基因组DNA,PCR 预混液和Assays-on-Demand试剂盒(内含所需的引物和探针),即可在7000或7900上按标准的反应循环条件作PCR。在PCR完成后, 仪器根据检测到的荧光信号的颜色来自动判断样品中存在哪种等位基因,给出结果。结果总共有3种可能:两种等位基因各自的纯合子和杂合子。只有一种信号出现 是纯合子,如果两种信号同时出现,就是杂合子。典型的SNP筛查结果见图3(略)。
3  基因突变检测、等位基因鉴定和+/-检测
这些应用在技术原理上和PCR操作上与SNP研究几乎一样,其PCR反应体系中也包括1对引物和2条探针,其区别仅仅是生物学意义上的,也就是研究的目的 和对实验数据的解释不同。基因突变检测是分析样本中的某个基因是正常的还是带有已知的点突变;等位基因鉴定是分析样本中存在哪种等位基因;+/-检测则分 析样本中某个特定基因或核酸片段的有无——都是通过分别针对两种等位基因探针及其荧光标记颜色来实现的。一般地说,包括SNP研究在内,所有这些应用都可 以统称为等位基因鉴定。
所有的等位基因鉴定实验,包括SNP分析和点突变测定,都要求定量PCR仪具备多色检测能力,能够在同一个反应管中同时检测多个荧光信号,具体地说就是, 至少2种报告荧光信号,外加1种淬灭荧光信号和1种参比校正荧光信号,总共4种。否则的话,如果仪器只有单色检测能力,即使能够将同一个样本分成两份,进 行两次检测,还少了校正信号,无法消除取样量等偶然误差,既增加了费用,又降低了等位基因判定的可信度。
4  荧光信号的归一化
等位基因鉴定也要注意实验数据的归一化,特别是荧光信号强度的校正,以保证结果的严格可靠。
加样操作误差、离心管盖透光性能差异、不同反应管之间荧光激发效率差异等偶然因素实际上不可避免,仪器收集到的原始信号必然有波动,只有在归一化之后,才 可以相互比较并保证重现性。这种校正是通过在反应缓冲液中添加校正荧光(通常是ROX)来实现的。ROX在缓冲液中的浓度是固定的,因此其信号强度与反应 体积和荧光激发效率等各种因素的总和正相关。仪器同时收集反应信号和校正荧光信号,然后反应信号除以校正信号,消除上述误差的影响,极大地提高了等位基因 判定的准确度。
无论忽视ROX校正的重要性,还是由于所使用的定量PCR仪没有多色检测能力而不做ROX校正,都是不严格的。

博士生传给硕士生的经验

   1. 先看综述,后看论著.看综述搞清概念,看论著掌握方法。
   2. 早动手在师兄师姐离开之前学会关键技术。
   3. 多数文章看摘要,少数文章看全文.掌握了一点查全文的技巧,往往会以搞到全文为乐,以至于没有时间看文章的内容,更不屑于看摘要。真正有用的全文并不多,过分追求全文是浪费,不可走极端。当然只看摘要也是不对的。
   4. 集中时间看文献.看过总会遗忘。看文献的时间越分散,浪费时间越多。集中时间看更容易联系起来,形成整体印象。
   5. 做好记录和标记复印或打印的文献,直接用笔标记或批注。pdf 或html 格式的文献,可以用编辑器标亮或改变文字颜色。这是避免时间浪费的又一重要手段。否则等于没看。
   6. 准备引用的文章要亲自看过。转引造成的以讹传讹不胜枚举。
   7. 注意文章的参考价值。刊物的影响因子、文章的被引次数能反映文章的参考价值。但要注意引用这篇文章的其它文章是如何评价这篇文章的:支持还是反对,补充还是纠错。
   8. 交流是最好的老师。做实验遇到困难是家常便饭。你的第一反应是什么?反复尝试?放弃?看书?这些做法都有道理,但首先应该想到的是交流。对有身份的人,私 下的请教体现你对他的尊重;对同年资的人,公开的讨论可以使大家畅所欲言,而且出言谨慎。千万不能闭门造车。一个实验折腾半年,后来别人告诉你那是死路, 岂不冤大头?
   9. 最高层次的能力是表达能力。再好的工作最终都要靠别人认可。表达能力,体现为写和说的能力,是需要长期培养的素质。比如发现一个罕见病例,写好了发一篇论 著;写不好只能发一个病例报道。比如做一个课题,写好了发一篇或数篇论著;写不好只能发一个论著摘要或被枪毙。一张图,一张表,无不是表达能力的体现。寥 寥几百上千字的标书,可以赢得大笔基金;虽然关系很重要,但写得太差也不行。有人说,我不学PCR,不学spss,只要学会 ppt(powerpoint)就可以了。此话有一点道理,实验室的boss 们表面上就是靠一串串ppt 行走江湖的。经常有研究生因思维敏捷条例清楚而令人肃然起敬。也经常有研究生不理解”为什么我做了大部分工作而老板却让另一个没怎么干活的人写了文章?让他去大会发言?”你没有看到人家有张口就来的本事吗?
   10. 学好英语,不学二外。如今不论去日本还是欧洲,学术交流早已是英语的天下。你不必为看不懂一篇法语的文章而遗憾,写那篇文章的人正在为没学好英语而犯愁。如果英文尚未精通,暂且不要去学二外。
英文文章写作
   1. 阅读10 篇文献,总结100 个常用句型和常用短语。经常复习。注意,文献作者必须是以英文为母语者,文献内容要与你的专业有关。这属于平时看文献的副产品。
   2. 找3-5 篇技术路线和统计方法与你的课题接近的文章,精读。写出论文的草稿。要按照标题、作者、摘要、背景、目的、材料、方法、结果、讨论、致谢、参考文献、图例、图、表、照片和说明的统一格式来写。这样做的好处是从它可以方便地改成任何杂志的格式。
   3. 针对论文的每一部分,尤其是某种具体方法、要讨论的某一具体方面,各找5-8 篇文献阅读,充实完善。这里讨论的只涉及英文表达,也只推荐给缺乏英文写作经验的人。
   4. 找到你想投的杂志的稿约,再找2-3 篇该杂志的article,按它的格式改写。注意,每次改写都要先另存为不同的文件名,以免出了问题不能恢复。
   5. 找英文高手改。找不到合适的人,就去找提供英语论文编辑服务(English correction and improvement,not translation)的公司,在此向有钱没时间的人强烈推荐。
文献管理
   1. 下载电子版文献时(caj,pdf,html),把文章题目粘贴为文件名。注意,文件名不能有特殊符号,要把 \ / : * ? < > | 以及 换行符删掉。 每次按照同样的习惯设置文件名,可以防止重复下载。
   2. 不同主题存入不同文件夹。文件夹的题目要简短,如:PD,LTP,PKC,NO。
   3. 看过的文献归入子文件夹,最起码要把有用的和没用的分开。
   4. 重要文献根据重要程度在文件名前加001,002,003 编号,然后按名称排列图标,最重要的文献就排在最前了。
   5. 复印或打印的文献,用打孔器(¥10-15)打孔,装入硬质文件夹(¥10-20/个)。
我们经常会在参考文献的引用上耍一些小聪明,殊不知这些都会降低论文质量。
   1. 知而不引明明借鉴了同行的类似工作,却故意不引用同行的类似工作,使自己工作看上去”新颖””领先”。实际上审稿的可能就是同行。
   2. 断章取义故意截取作者试图否定的部分来烘托自己的观点。
   3. 引而不确没有认真看原文,引文错漏。
   4. 来源不实某些字句来源不可靠(比如非正式的或非学术的出版物),且不注明来源。常见于一些统计数字。
   5. 盲目自引不是为了说明自己的工作与前期工作之间的关系,而是单纯为提高自己文章被引用次数而自引。
国内文章水平不高的几个原因:
   1. 审稿人知识陈旧年纪大的审稿人查文献和和上网的能力相当有限,无法核实该研究是否有意义,创新点在那里,方法是否可靠,结果是否可信。但匪夷所思的是他们经常提的审稿意见是”参考文献不够新”。
   2. 选错审稿人虽然一般指定两名审稿人,但编辑部经常让不懂分子生物学的人审分子生物学的文章,让不懂统计的人审统计处理比较复杂的文章。出于爱面子,很少有人提出”我不适合审这篇文章”。
   3. 关系文章有了关系,什么都简单了。
   4. 不承认阴性结果。诚实的阴性结果被认为无意义。怪不得有人大声疾呼”我要办一本阴性杂志”。
   5. 造假。任何人都不愿意成为制度的牺牲品。出不来预期结果就没法交差。为生存计,为按期毕业计,造吧。
动态的科学
   1. 科研靠积累。象伦琴发现X 射线那样凭借一次简单观察就得诺贝尔奖的机会越来越少。更多的科研成果来自于实验室长期积累。最终实至名归。 做科研不要指望一步登天。设计课题不要好高骛远。基金评审也是这样。没有前期积累,获得资助的可能性小。选导师要想好:你是要白手起家,还是要为人作嫁?
   2. 文献要追踪。开题时通过查文献了解的情况,到结题的时候可能有很大不同。实验过程中要注意追踪。运气好,你可以得到更多的线索;运气不好,发现别人抢先了。据此修正你的实验。写论文之前一定要重新查一遍文献。
   3. 记录要复习。前面的实验记录要经常复习。随着经验的增加和认识的提高,你会发现最初的判断未必正确。
我曾经向一些比我有经验的人请教”什么是科研”,他们没有正面回答我,只是给我打了五个比方。
   1. 科研是流行歌曲。什么流行用什么,什么流行做什么。张口生物芯片,闭口纳米技术。老板是追星一族,流行的就是最好的。
   2. 科研是移花接木。设计课题?课题怎么是设计出来的呢?是拼出来的。A 的材料,B 的方法,C 的指标,D 的意义。
   3. 科研是傻瓜相机。原理搞不懂?恕我老朽,没时间看原理了。我能折腾,多折腾几次就出来了。为什么要做这一步?老板心里明白就行了!他每周安排的活儿我还干不完呢。
   4. 科研是照葫芦画瓢。综述不会写?抄啊。论文不会写?套啊。反正不会有人追究。无知者无畏!
   5. 科研是垃圾。实验完成了,论文发表了,答辩通过了。老板语重心长地说:”你们走后,这些都是垃圾”。晕!倒!挣扎!再倒!他们没有骗我,实用主义自有它的道理。但我从此不再随便批判国内的科研水平了,因为在某些时候我也重复着同样的故事。
写毕业论文
   1.先列提纲不列提纲,上来就写,是坏习惯。几百字没问题,几千字勉强,几万字就难了。必须列出写作提纲,再充实完善,以保证思路的连贯和字数的均衡。
   2. 平时多写及时总结阶段性的工作,多写文章多投稿。到最后阶段,把这些文字有机地组合起来,就是一篇很好的毕业论文。
   3. 不要罗列所有数据为了保证毕业论文的分量,研究生往往会观测较多的指标。但毕业论文并非数据越多越好。一定要舍弃那些与主旨关系不大的数据。否则,要么显得累赘松散,要么成为破绽。
   4. 打印修改在电脑上直接修改,会遗漏很多错误。要尽可能地减少任何错误,一定要打印出来修改。
   5. 让别人指出错误自己修改,仍然受个人习惯的局限。错误摆在那里,却熟视无睹。让别人给你指出错误吧,不管他与你是不是同一专业。
怎样读文献
   1. 目标:漫无目的则毫无效率,抓不住重点才效率低下。选题之前可能会有一段时间处于迷茫状态,不知从哪入手。胡乱看了大量文献,却不知所以然。在导师的指导下,在同行的启发下,有些人可以迅速明确目标,有的放矢,入门就从这里开始。即使导师不导,没有定题,自己也要先设定一个具体的问题看文献。不管你将来做不做这些东西,总比没有目标好得多,保证有收获。科研的一般法则是共通的。
   2. 层次:对于一个具体的课题来说,相关文献分属于三个层次:研究方向、研究领域、研究课题。例如有人研究干细胞定 向分化治疗帕金森病,对他来说,研究方向就是帕金森病,研究领域是帕金森病的干细胞治疗,研究课题是某种物质诱导干细胞定向分化为分泌多巴胺的神经细胞。 看文献时要分清手上的文献是属于那个层次,这决定你对它要掌握到什么程度。研究方向层次的文献:一般涉及,基础知识,学科水准,了解当前重大进展与趋势,达到专业人员水平;研究领域层次的文献:了解焦点与热点,已/正/将进行的课题,达到专家水平;研究课题层次的文献:要全面,了解历史、现状、展望、主要方法、手段,达到No1专家水平。正确分辨文章的层次,才能把精力用到点子上。
   3. 形式:广义的文献包括可以阅读的所有出版形式。教科书、专著、会议摘要汇编、期刊、网页、甚至ppt文件。比如要了解免疫应答的基本形式,最好是看教科书;要参考大鼠脑立体定位图谱,最好是看专著;要知道最新进展,最好是查阅期刊;要了解别人的研究动向,最好是参会或看会议论文汇编。不要找错信息源。
   4. 程度:对文献的熟悉程度不同,阅读文献的方式大不相同。新手学习式阅读,逐字逐句,搞清细节,掌握最基本的知识点。最初的十几、几十篇要精读,精华的几篇 甚至要背诵。老手搜索式阅读,已熟悉各种研究的常见模式和一般套路,能够迅速提取关键信息,把握思路,经常不按常规顺序阅读。有人看图说话,有人辨数识 字。高手批判式阅读,一针见血,直指问题所在。实际上没有一篇论文是无懈可击的。新手要稳,老手要准,高手要狠。新手、老手、高手的代表人物分别是研究 生、导师和审稿人,但认真钻研的研究生完全可以在3年中实现从新手到高手的嬗变。对自己有清醒的定位,才能选择正确的阅读方式。
   5. 矛盾:文献读的多了,脑子里塞满了信息。公说公有理,婆说婆有理,反而无所适从?为了解决这个问题,循证医学划 分临床试验证据的等级;同理,我们看文献也要重视实验证据的强度。发现矛盾,是第一步;找出异同,是第二步;思考解决,是第三步。从相互矛盾的结论推导中 发现矛盾的根源,此时如能跳出圈外,不走思维定势,从原始的科学问题出发,”无招胜有招”,真正是到达另外一种境界了。何必翻译外国人的综述谎称自己的综 述?何必重复别人做过的实验谎称自己的思路