系統推定

27 Oct 2018. Jun Inoue

総説

Shen X-X, Hittinger CT, Rokas A. 2017.
Contentious relationships in phylogenomic studies can be driven by a handful of genes. Nature Ecology & Evolution. 2017;1:0126.

植物,動物,菌類の系統関係で,17 の曖昧な分岐と 6 の確立された分岐を用いて,系統情報を遺伝子/サイト別に探索.非常に少ないサイトが曖昧な分岐の関係を左右すると指摘.系統情報の分布を把握することが,分岐解像度の理解の根幹と主張.この考えに基づき,クシクラゲが後生動物根幹から分岐する関係を支持.

Guang, A., Zapata, F., Howison, M., Lawrence, C. E. & Dunn, C. W. (2016).
An integrated perspective on phylogenetic workflows. Trends in Ecology & Evolution, 31, 116–126.

総説.

Dunn CW & Munro C (2016)
Comparative genomics and the diversity of life. Zool. Scr. 45:5-13.

総説.進化ゲノム解析を行うには,strict ortholog (Single copy のオーソログ; P8右中下) に注目しすぎず,遺伝子系統樹内部のノードが種分化か遺伝子重複かを判定することが重要と指摘 (P10左上).
 近年行われている多数の種を含む比較ゲノム解析ではオーソロジー,パラロジーの意味は崩壊し始めているため,オーソログ判定は枝の末端ではなく内部枝に注目すべきと主張 (P8右中).ゲノム系統解析でよく用いられる strict ortholog は,single であるために進化速度が加速しているとみなし,系統解析マーカーとして問題視 (P9左下).(種の系統関係以外に) 様々なイベントを推定できるという意味でも,むしろ遺伝子族として存在する遺伝子の利用を推奨 (P9右上).
 種分化・遺伝子重複イベントの推定には配列類似と遺伝子系統樹に基づく方法がある (P10左).

Edwards SV. 2016.
Phylogenomic subsampling: a brief review. Zoologica Scripta 45: 63-74.

Hejnol A, Dunn CW (2016)
Animal evolution: Are phyla real? Curr Biol 26:R424–R426.

総説.砂時計モデル.

Dunn CW & Ryan JF (2015)
The evolution of animal genomes. Curr. Opin. Genet. Dev. 35:25-32.

Fontaine, M. C. et al. 2015.
Mosquito genomics. Extensive introgression in a malaria vector species complex revealed by phylogenomics. Science 347, 1258524.

Introgression.

Szollosi, G. J., Tannier, E., Daubin, V. & Boussau, B. 2015.
The inference of gene trees with species trees. Syst. Biol. 64, e42–e62 (2015).

総説.遺伝子と種の系統樹を比較する方法.よい遺伝子系統樹が推定されれば,祖先の染色体や配列推定の基盤となる (Abstract).
 遺伝子配列のアライメントに加えて種系統樹を利用すると,遺伝子配列のアライメントだけを用いるよりも良い遺伝子系統樹が得られる (e55右上). 再構築された遺伝子系統樹は,ゲノム重複由来のパラログ検出にも使われる.
 遺伝子系統樹は,菌類における代謝の進化にも利用される (e55右下).Eastwood et al. (2011) や Floundas et al. (2012) は,木を消化する酵素のセットに注目し,遺伝子と種の系統樹を比較し,遺伝子の異なる部位を消化する 2 種類の菌類のどちらが祖先的か推定した.

Martin, K.J., Holland, W.H. 2014
Enigmatic Orthology Relationships between Hox Clusters of the African Butterfly Fish and Other Teleosts Following Ancient Whole-Genome Duplication. MBE.

アロワナ類 vs カライワシ類分岐順序問題に関して,ミトコンドリア遺伝子は問題ないが,核遺伝子データを系統解析する場合は完全に 1:1 の関係にあるオーソログだけ精査して用いるべき,と強調 (P2605 右中段).

Afrasiabi C, Samad B, Dineen D, Meacham C, Sjo¨lander K. 2013.
The PhyloFacts FAT-CAT web server: ortholog identification and function prediction using fast approximate tree classification. Nucleic Acids Res. 41:W242–W248.

オーソログ判定と遺伝子機能推定を行う web server, FAT-CAT.PhyloFacts データベースに保持されている遺伝子系統樹を利用.オーソログ判定は Kerf, PHOG を利用し,オーソログデータの取得は OMA と OrthoMCL データベースを利用.
 論文にあるリンクは利用できず,現在は公開されていない可能性がある.

Anisimova, M., Liberles, D. A., Philippe, H., Provan, J., Pupko, T. & von Haeseler, A. 2013.
State-of the art methodologies dictate new standards for phylogenetic analysis. BMC Evol. Biol. 13, 161.


Lemmon EM, Lemmon AR. 2013.
High-Throughput Genomic Data in Systematics and Phylogenetics. Annual Review of Ecology, Evolution, and Systematics, Vol 44 44:99-+.

次世代シーケンサを用いて解読する系統解析マーカーを総説.

Wray GA (2013)
Genomics and the evolution of phenotypic traits. Annu Rev Ecol Evol Syst 44:51–72.

Telford MJ, Copley RR 2011.
Improving animal phylogenies with genomic data. Trends in Genetics 27: 186-195.

総説.様々な種類のゲノムデータを用いた系統解析を,動物主要系統の解析に沿って紹介. microRNA やイントロンなど presence/absence データ (RGC マーカ) を利用した解析の利点と問題点を記述.Taxon sampling の効能を適格に述べており,RGC マーカ解析でも重要と指摘.ND5 遺伝子・アミノ酸配列の系統特異的 (constant but different) な変化の利用 (Papillon et al. 2005) を将来的なマーカとして示唆.

Kumar S, Filipski A, Battistuzzi F, Pond S, Tamura K. 2012.
Statistics and truth in phylogenomics.Mol Biol Evol. 29(2): 457–472.

総説.Phylogenomics.

Chen WJ & Mayden RL (2010)
A Phylogenomic Perspective on the New Era of Ichthyology. Bioscience 60(6):421–432.

Thomson RC, Wang IJ, Johnson JR 2010.
Genome-enabled development of DNA markers for ecology, evolution and conservation. Molecular Ecology 19: 2184-2195.

大系統解析から集団解析まで非実験生物の解析に用いられてきた分子マーカ (核タンパク質遺伝子配列やイントロンなど) を,データ解読 (PCR を前提) と相同性査定などの面から解説.系統解析マーカにパラログを入れるべきではない,と明記 (P 2191 左下).これまで BLAST ベースで行われていたマーカ選択を総説.厳しい BLAST をやるしかない,と指摘 (P2191 左下).NGS に期待としているが,具体的なマーカ探索方法については書いていない.

Shubin, N., Tabin, C. & Carroll, S. 2009.
Deep homology and the origins of evolutionary novelty. Nature 457, 818–823.

Degnan, J. H., and N. A. Rosenberg, 2009
Gene tree discordance, phylogenetic inference and the multispecies coalescent. Trends
Ecol. Evol. 24: 332–340.

Rodriguez-Ezpeleta N, Brinkmann H, Roure B, Lartillot N, Lang BF, Philippe H. 2007.
Detecting and overcoming systematic errors in genome-scale phylogenies. Syst Biol. 56:389-399.

Wapinski I, Pfeffer A, Friedman N, Regev A. 2007.
Automatic genomewide reconstruction of phylogenetic gene trees. Bioinformatics 2007;23:i549–58.

Ciccarelli,F.D., Doerks,T., von Mering,C., Creevey,C.J., Snel,B. and Bork,P. (2006)
Toward automatic reconstruction of a highly resolved tree of life. Science, 311, 1283–1287.

Jeffroy O, Brinkmann H, Delsuc F, Philippe H. 2006.
Phylogenomics: the beginning of incongruence? Trends Genet. 22:225-231.

Krishnamurthy,N., Brown,D.P., Kirshner,D. and Sjo¨ lander,K. (2006)
PhyloFacts: an online structural phylogenomic encyclopedia for protein functional and structural classification. Genome Biol., 7, R83.

アライメント,系統樹,HMMs などのデータベース PhyloFacts

Pollard, D. A., Iyer, V. N., Moses, A. M. & Eisen, M. B. 2006.
Widespread discordance of gene trees with species tree in Drosophila: evidence for incomplete lineage sorting.
PLoS Genet. 2, e173.

Lineage sorting.

Rokas,A. and Carroll,S.B. (2006)
Bushes in the tree of life. PLoS Biol., 4, 1899–1904.

Simon C, Buckley TR, Frati F, et al. 2006.
Incorporating molecular evolution into phylogenetic analysis, and a new compilation of conserved polymerase chain reaction primers for animal mitochondrial DNA
ANNUAL REVIEW OF ECOLOGY EVOLUTION AND SYSTEMATICS 37: 545-579

Delsuc F, Brinkmann H, Philippe H 2005.
Phylogenomics and the reconstruction of the tree of life. Nature Reviews Genetics 6: 361-375.

総説.ゲノムデータを系統解析に使う場合の問題点を指摘.

Hurst LD, Pál C, Lercher MJ. 2004.
The evolutionary dynamics of eukaryotic gene order. Nature reviews Genetics 2004, 5(4):299-310.

染色体上で近い遺伝子が,より協調的に発現する可能性がある (< Pereira et al. 14).

Phillips MJ, Delsuc F, Penny D. 2004.
Genome-scale phylogeny and the detection of systematic biases. Mol Biol Evol. 21:1455-1458.

Balanced base composition.

Baldauf,S.L. (2003)
Phylogeny for the faint of heart: a tutorial. Trends Genet., 19, 345–351.

Gee H (2003)
Evolution: ending incongruence. Nature 425: 782.

Brinkman,F.S., Wan,I., Hancock,R.E., Rose,A.M. and Jones,S.J. (2001)
PhyloBLAST: facilitating phylogenetic analysis of BLAST results. Bioinformatics, 17, 385–387.

PhyloBLAST.

Nichols, R., 2001
Gene trees and species trees are not the same. Trends Ecol. Evol. 16: 358–364.

Huynen M, Snel B, Lathe W, Bork P. 2000.
Exploitation of gene context. Current opinion in structural biology 2000, 10(3):366-70.

染色体上で近い遺伝子が,より関連している可能性がある (< Pereira et al. 14).

Rokas A & Holland PWH (2000)
Rare genomic changes as a tool for phylogenetics. Trends Ecol Evol. 15:454–459.

配列マーカ以外にも,Classical Rare Genomic Changes (レトロポゾン,インデル,signature sequence, mtDNA および nucDNA 遺伝コード変異,mtGenome の遺伝子配置,遺伝子重複,染色体構造変異) が系統解析に有用なことを指摘.

Pereira SL. 2000.
Mitochondrial genome organization and vertebrate phylogenetics. Genetics and Molecular Biology, 23: 745-752.

Curole JP, Kocher TD 1999. Mitogenomics: digging deeper with complete mitochondrial genomes. Trends in Ecology & Evolution 14: 394-398.

ミトコンドリア全長配列解析の有効性と問題点を解説.

Shubin, N., Tabin, C. & Carroll, S. 1997.
Fossils, genes, and the evolution of animal limbs. Nature 388, 639–648 (1997).

Maddison WP (1997)
Gene trees in species trees. Syst. Biol. 46(3):523-536.

種の系統樹と遺伝子系統樹の違いについて.

Moritz C, Hillis DM. 1996.
Molecular systematics: context and controversies. In: Hillis DM, Moritz C, Mable BK, editors. Molecular systematics. Sunderland, Mass.: Sinauer Associates; 1996. p. 1–13.

総説.有名な本の第1章.Homology と Similarity に関して記述.オーソロガスな配列だけが種の系統解析に利用可能 (P7右中) と明言.


オーソログ

Altenhoff AM, et al. (2018)
The OMA orthology database in 2018: retrieving evolutionary relationships among all domains of life through richer web and programmatic interfaces. Nucleic Acids Res. 46(D1):D477-D485.

OMA のバージョン報告. オーソログの重要性は,遠く離れた種間でも機能が同じであるうえに,系統マーカーや種間での染色体領域比較に使える点,などにある (P477右上).

Dunn CW, Zapata F, Munro C, Siebert S, & Hejnol A (2018)
Pairwise comparisons across species are problematic when analyzing functional genomic data. Proc Natl Acad Sci U S A 115(3):E409-E417.

種の歴史を考慮せず,ペアワイズ比較によって遺伝子の機能を比較すると誤った結果を招きやすい.系統解析を用いた比較を推奨.ペアワイズ解析による発現遺伝子の類似性に迫った Kryuchkova-Mostacci and Robinson-Rechavi (2016) (脊椎動物主要系統間では ortholog conjecture をサポート) と Levin et al. (2016) (動物門の間で比較すると,発生中間段階で発現する遺伝子が多様化) を再解析し,ペアワイズ解析の危険性を指摘.
 ペアワイズで発現パターンを比較した Kryuchkova-Mostacci and Robinson-Rechavi (2016) のデータを,Ensembl の提供する遺伝子系統樹を用いて再解析.Levin et al. (2016) のデータは枝長などを推定し直す.

Thanki AS, Soranzo N, Haerty W, Davey RP. 2018.
GeneSeqToFamily: a Galaxy workflow to find gene families based on the Ensembl Compara GeneTrees pipeline. Gigascience. 2018;7:1-10.

Ensembl GeneTrees piplien を取り込んだシステム,GeneSeqToFamily を開発し,Galaxy に加える.

Dunne MP, Kelly S. 2017.
OrthoFiller: utilising data from multiple species to improve the completeness of genome annotations. BMC Genomics. 2017;18:390.Dunne MP, Kelly S. 2017.

Emms DM, Kelly S. 2017.
STRIDE: Species Tree Root Inference from Gene Duplication Events. Mol Biol Evol. 2017;34:3267-78.

種系統樹の情報を使わずに,遺伝子系統樹でルート (と遺伝子重複イベント) を推定する方法,STRIDE, を開発.Python のスクリプトを配布.

Forslund,K., et al. (2017)
Gearing up to handle the mosaic nature of life in the quest for orthologs. Bioinformatics.

Quest for Orthologs (QfO) のミーティング報告. QfO の主要な役割は,ゲノムデータという巨大データからオーソログを選出するのに,様々な研究グループで開発された方法とサービスの benchmark (基準評価),データセットとデータ形式の標準化,である.

Huerta-Cepas J, et al. (2017)
Fast Genome-Wide Functional Annotation through Orthology Assignment by eggNOG-Mapper. Mol Biol Evol 34(8):2115-2122.

巨大な配列データセットの機能アノテーションを行う eggNOG-Mapper の報告.スタンドアローンとオンライン・サービスがある.eggNOG データベースで,すでに推定されているオーソログクラスターと系統樹を用いることで,高速化.

Jahangiri-Tazehkand S, Wong L, & Eslahchi C (2017)
OrthoGNC: A Software for Accurate Identification of Orthologs Based on Gene Neighborhood Conservation. Genomics Proteomics Bioinformatics 15(6):361-370.

配列類似性とローカルシンテニー情報を用いたオーソログ判定.OrthoGNC.イントロが参考になる. ローカルシンテニーが保存されている近縁種を対象とするため, 標準オーソログベンチマーク (Altenhoff et al. 16) を利用できず.バクテリアの属内で種間のゲノム比較.

Kaduk M, Riegler C, Lemp O, & Sonnhammer EL (2017)
HieranoiDB: a database of orthologs inferred by Hieranoid. Nucleic Acids Res. 45(D1):D687-D690.

Hieranoid 法によるオーソログデータベース HieranoiDB の紹介.Hieranoid によるオーソログの hierarchical group を探す web-based tool.Hieranoid 法はInParanoid 法を発展させたもの.

Rane RV, Oakeshott JG, Nguyen T, Hoffmann AA, & Lee SF (2017)
Orthonome - a new pipeline for predicting high quality orthologue gene sets applicable to complete and draft genomes. BMC Genomics 18(1):673.

シンテニーを比較した後で配列比較を行うオーソログ判定. Orthonome.Drosophila 12/20 種の genome data のみ対応.

Train CM, Glover NM, Gonnet GH, Altenhoff AM, & Dessimoz C (2017)
Orthologous Matrix (OMA) algorithm 2.0: more robust to asymmetric evolutionary rates and more scalable hierarchical orthologous group inference. Bioinformatics 33(14):i75-i82.

OMA データベースで用いられているオーソログ予測を,進化速度の異なるパラログに対応させる.

Zdobnov EM, et al. 2017.
OrthoDB v9.1: cataloging evolutionary and functional annotations for animal, fungal, plant, archaeal, bacterial and viral orthologs. Nucleic Acids Res 45:D744-D749.

Altenhoff, A.M. et al. 2016.
Standardized benchmarking in the quest for orthologs. Nat. Methods 13, 425-30 (2016).

Quest for Orthologs (QfO) コミュニティーによる論文.20 の評価基準で確立された 15 のオーソログ判定法を評価. 参照データセットと オーソログ判定の web-based サービス, Orthology Benchmarking, を提供.この情報源のアップデートを続ける意思を表示.オーソログ判定方法の作者は,彼らの提供するデータを解析した結果を提出することで,その精度を評価できる.

Ballesteros JA & Hormiga G (2016)
A New Orthology Assessment Method for Phylogenomic Data: Unrooted Phylogenetic Orthology. Mol Biol Evol 33(8):2117-2134.

種系統解析にに向けた,オーソログ判定スクリプト UPhO を開発.無系統樹を推定してオーソログを判定する.脊椎動物ヘモグロビンデータで有用性を検証し,クモ類の種系統解析に適用.パイプラインの python スクリプトを公開 (GitHub).
 オーソログ判定の好例として脊椎動物ヘモグロビンの系統樹を表示 (Fig.2). 一つの遺伝子から派生するトランスクリプト問題にも言及 (P2127左下).Trinity のような de novo とランスクリプトームアッセンブラーは,パラログ,アイソフォーム,アレル多型 を考慮しない.一方で, real paralogs は残るためオーソロジーを検証する必要がある (P2127右中).
 UPhO を PTP (PhyloTreePruner, Kocot et al. 2013) と比較.

Huerta-Cepas J, Szklarczyk D, Forslund K, Cook H, Heller D, Walter MC, Rattei T, MendeDR, Sunagawa S, KuhnM, et al. 2016.
eggNOG4.5: a hierarchical orthology framework with improved functional annotations
for eukaryotic, prokaryotic and viral sequences. Nucleic Acids Res. 44:D286–D293.

オーソロガス・グループのデータベース,EggNOG,の報告.オーソログ予測が graph-based 法であった前のバージョンにアミノ酸配列に基づく (P288右下) tree-based 法を取り入れた.

Kryuchkova-Mostacci N, Robinson-Rechavi M (2016)
Tissue-specificity of gene expression diverges slowly between orthologs, and rapidly between paralogs. PLOS Comput Biol 12:e1005274–13.

ペアワイズ解析により,ortholog conjecture を支持.Dunn et al. (2018) で再解析.

Levin M, et al. (2016)
The mid-developmental transition and the evolution of animal body plans. Nature 531:637–641.

Dunn et al. (2018) で再解析.

Smith, S. A. & Pease, J. B. (2016).
Heterogeneous molecular processes among the causes of how sequence similarity scores can fail to recapitulate phylogeny. Briefings in Bioinformatics, 2016, 1–7.

配列類似性のペアワイズ比較では,単純な場合でもオーソログ判定の精度が低い.ゲノム系統解析のオーソログ判定は配列類似性だけでなく,より正確な系統に基づく方法を用いるべきと主張.著者らはオーソログ判定スクリプトを Yang and Smith (2016) で公開.

Stenger BL, et al. (2015)
Highly divergent 18S rRNA gene paralogs in a Cryptosporidium genotype from eastern chipmunks (Tamias striatus). Infect Genet Evol 32:113-123.

クリプトスポリジウム (Cryptosporidium: 微生物.下痢などを引き起こす) のゲノム内部に,配列が大きく異なる 18S rRNA 遺伝子パラログの存在を確認.各ゲノム内に複数のコピーがある 18S rRNA が分子系統解析によく用いられる裏には,パラログ間の遺伝子配列の違いが協調進化によって打ち消される,という暗黙の了解に,警鐘を鳴らす.るクリプトスポリジウムはシマリス (chipmunk) に寄生し,ヒトに下痢などを引き起こす.

Altenhoff, A. M. et al. 2015.
The OMA orthology database in 2015: function predictions, better plant support, synteny view and other improvements. Nucleic Acids Res. 43, D240–D249 (2015).

OMA データベース 2015 バージョン.Graph-based オーソログ予測.

Boeckmann,B. et al. (2015)
Quest for orthologs entails quest for tree of life: in search of the gene stream. Genome Biol. Evol., 7, 1988–1999.

オーソログ判定に必要な種の系統関係をまとめる. Quest for orthologs の 147 reference organisms. SwissTree の Downloads からアップデートされた種系統樹をダウンロードできる.

Cunningham,F., Amode,M.R., Barrell,D., Beal,K., Billis,K., Brent,S., Carvalho-Silva,D., Clapham,P., Coates,G., Fitzgerald,S. et al. (2015)
Ensembl 2015. Nucleic Acids Res., 43, D662–D669.

Tree-based オーソログ予測.

Emms, D.M. & Kelly, S. 2015.
OrthoFinder: solving fundamental biases in whole genome comparisons dramatically improves orthogroup inference accuracy. Genome Biol. 16, 157.

OrthoFinder: All-versus-all Blast hits を用いたオーソログ予測.Blast 検索は,クエリ配列が短いと配列が集まりにくく,長いと余計な配列を集める傾向にある (P2左下).この Blast 検索の弱点を改善するために,2 種間の all-versus-all BLAST search から得た blast bit scores を用いた新たな値を導入 (P3左中).
 マニュアルに orthogroup などの説明がある.Web.日本語解説1,2,3. GitHub.

Kachroo,A.H., Laurent,J.M., Yellman,C.M., Meyer,A.G., Wilke,C.O. and Marcotte,E.M. (2015)
Evolution. Systematic humanization of yeast genes reveals conserved functions and genetic modularity. Science, 348, 921–925.

類縁関係の遠い種間であってもオーソログは同じ機能を持つ.

Kriventseva, E. V., Tegenfeldt, F., Petty, T. J., Waterhouse, R. M., Simao, F. A., Pozdnyakov, I. A., Ioannidis, P. & Zdobnov, E. M. 2015.
OrthoDB v8: update of the hierarchical catalog of orthologs and the underlying free software. Nucleic Acids Res. 43(Database issue), D250–D256.

Graph-based オーソログ予測.

Linard,B., Allot,A., Schneider,R., Morel,C., Ripp,R., Bigler,M.,
Thompson,J.D., Poch,O. and Lecompte,O. (2015)
OrthoInspector 2.0: software and database updates. Bioinformatics, 31, 447–448.

Graph-based オーソログ予測.

Simao,F.A. et al. (2015)
BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics, 31, 3210–3212.

Sonnhammer,E.L.L. and Ostlund,G. (2015)
InParanoid 8: orthology analysis between 273 proteomes, mostly eukaryotic. Nucleic Acids
Res., 43, D234–D239.

Graph-based オーソログ予測.

Ullah I, Sjo¨strand J, Andersson P, Sennblad B, Lagergren J. 2015.
Integrating sequence evolution into probabilistic orthology analysis. Syst Biol. 64(6): syv044.

Ekseth OK, Kuiper M, Mironov V. 2014.
orthAgogue: an agile tool for the rapid prediction of orthology relations. Bioinformatics 30:734-736.

OrthoMCL 解析を発展.

Gorecki, P. & Eulenstein, O. (2014).
DrML: probabilistic modeling of gene duplications. Journal of Computational Biology: A Journal of Computational Molecular Cell Biology, 21, 89–98.

種の系統樹と比較して遺伝子系統樹上で種分化と遺伝子重複を判定.

Huerta-Cepas,J., Capella-Gutierrez,S., Pryszcz,L.P., Marcet-Houben,M. and Gabaldon, T. (2014)
PhylomeDB v4: zooming into the plurality of evolutionary histories of a genome. Nucleic Acids Res., 42, 897–902.

Tree-based オーソログ予測.

Lechner M, Hernandez-Rosales M, Doerr D, Wieseke N, The´venin A, Stoye J, et al. 2014.
Orthology detection combining clustering and synteny for very large datasets. PLoS One 2014;9: e105015.

PoFF: クラスタリング,配列類似性,シンテニーによるオーソログ探索.

Martins, L. D. O., Mallo, D. & Posada, D. (2014).
A Bayesian Supertree Model for Genome-Wide Species Tree Reconstruction. Systematic Biology, 65, 397–416. syu082.

種の系統樹,遺伝子系統樹,種分化と遺伝子重複判定を同時に行う (< Dunn & Munro 16).

Pereira C, Denise A, & Lespinet O (2014)
A meta-approach for improving the prediction and the functional annotation of ortholog groups. BMC Genomics 15 Suppl 6:S16.

様々な方法の結果を統合してオーソログを推定する meta-approach を作成し,二つの benchmarks を用いて検証.イントロが参考になる.

Powell,S., Forslund,K., Szklarczyk,D., Trachana,K., Roth,A., Huerta-Cepas,J., Gabald´on,T., Rattei,T., Creevey,C., Kuhn,M. et al. (2014)
EggNOG v4.0: nested orthology inference across 3686 organisms. Nucleic Acids Res., 42, D231–D239.

Graph-based オーソログ予測.

Rogozin IB, Managadze D, Shabalina SA, Koonin EV. 2014.
Gene family level comparative analysis of gene expression in mammals validates the ortholog conjecture. Genome Biology and Evolution 2014, 6(4):754-762.

Ortholog Conjecture.

Schreiber F, Patricio M, Muffato M, Pignatelli M, Bateman A. 2014.
TreeFam v9: a new website, more species and orthology-on-the-fly. Nucleic Acids Res 42:D922-925.

TreeFam. OMA と類似の方法.

Sonnhammer, E.L.L. et al. 2014.
Big data and other challenges in the quest for orthologs. Bioinformatics 30, 2993–2998.

総説.Quest for Orthologs ミーティングのレポート.オーソログ・パラログの判定は,遺伝子の機能だけでなく系統関係に基づくべき.

Trachana,K., Forslund,K., Larsson,T., Powell,S., Doerks,T., Mering,C. and von Bork,P. (2014)
A phylogeny-based benchmarking test for orthology inference reveals the limitations of function-based validation. PLoS One, 9, e111122.

Wittwer,L.D. et al. (2014)
Speeding up all-against-all protein comparisons
while maintaining sensitivity by considering subsequence-level homology.
PeerJ., 2, e607.

Hieranoid: Tree-base と graph-based 法のハイブリッドによるオーソログ予測 (< Kaduk and Sonnhammer 17).

Yang, Y. & Smith, S. A. (2014).
Orthology inference in non-model organisms using transcriptomes and low-coverage genomes: improving accuracy and matrix occupancy for phylogenomics. Molecular Biology and Evolution, 31, 245–3092.

オーソログ判定スクリプト.オーソログ判定に系統解析を用いる方法を開発しスクリプトを公開.ゲノムと遺伝子重複を判定.100-400 Mya の分岐を含むブドウ,Hymenoptera, ヤスデ類のゲノム系統解析で試す.

Altenhoff,A.M. et al. (2013)
Inferring hierarchical orthologous groups from orthologous gene pairs. PLoS One, 8, e53786.

Graph-based オーソログ予測を改良.

Bazinet A, CummingsM, Mitter K, Mitter C. 2013.
Can RNA-Seq resolve the rapid radiation of advanced moths and butterflies (Hexapoda: Lepidoptera: Apoditrysia)? An exploratory study. PLoS One 8(12): e82615.

Boussau, B., Szollosi, G. J., Duret, L., Gouy, M., Tannier, E. & Daubin, V. (2013).
Genome-scale coestimation of species and gene trees. Genome Research, 23, 323–330.

種の系統樹,遺伝子系統樹,種分化と遺伝子重複判定を同時に行う PHYLDOG を開発.
 ゲノムデータを用いて種系統樹を再構築すると,循環論に直面する (P323左下).種系統樹を再構築するには,遺伝子の重複や欠失など,遺伝子ファミリーの進化を知る必要がある.一方で,遺伝子系統樹の再構築と,遺伝子の重複と欠失の判定は,種の系統樹が必要となる.

Bradnam,K.R. et al. (2013)
Assemblathon 2: evaluating de novo methods of genome assembly in three vertebrate species. GigaScience, 2, 10.

Dalquen DA, Dessimoz C. 2013.
Bidirectional best hits miss many orthologs in duplication-rich clades such as plants and animals. Genome Biol Evol. 2013; 5(10):1800–6.

配列類似性がベスト e-value を示す配列であっても,オーソログでない場合がある.

Dalquen, D.A., Altenhoff, A.M., Gonnet, G.H. & Dessimoz, C. 2013.
The impact of gene duplication, insertion, deletion, lateral gene transfer and sequencing error on orthology inference: a simulation study. PLoS ONE 8, e56925.

シミュレーションで発生させたゲノムデータを用いてオーソログ判定法を評価.進化速度の違いや急速な遺伝子重複は,graph-based オーソログ判定を混乱させる.

Dunn, C. W., Luo, X. & Wu, Z. (2013).
Phylogenetic analysis of gene expression. Integrative and Comparative Biology, 53, 847–
856.

Dunn, C. W., Howison, M. & Zapata, F. (2013).
Agalma: an automated phylogenomics workflow. BMC Bioinformatics, 14, 330.

新たに解読したトランスクリプトームデータ (raw data, P 2左中) から系統解析に用いるデータ行列を作成するパイプライン Agalma の紹介.all-by-all tblastx で収集した配列を MCL によってクラスタリングし (P4左),RAxML によって遺伝子系統樹を推定.taxon ごとに 1 配列になるまで遺伝子系統樹を刈り込む.

Python で書かれている.

Flicek,P., et al. (2013)
Ensembl 2013. Nucleic Acids Res., 41, D48–D55.

Ensembl 2013.

Gabaldon T, Koonin EV. 2013.
Functional and evolutionary implications of gene orthology. Nat Rev Genet. 14:360–366.

総説.Ortholog Conjecture (オーソログは同じ機能を持つ) を支持 (P365中).しかし精度をあげた GO による調査が必要とする (P364右下).オーソログ・パラログ判定とそれらの性質に関する著者らの見解を Box3 にまとめる.
 種の系統は過去の種分化の道筋を示すものであるから,オーソロガス遺伝子間の関係だけが,この目的にかなったものである (Baldauf 2003) (P360左下).オーソログ/パラログ関係の判定は,Blast のような配列類似性ではなく遺伝子系統樹に基づくべきと明言 (P362 右,section "Sequence conservation") (P363左上). BLAST の bidirectional best hit が,オーソログでない場合がしばしばある (P362右).
  Orthologous group (orthogroups とも言う) は種間で遺伝子の対応関係を論じるのに便利 (P361 Box 1左下 ).
 機能的な類似はオーソログを示さない.実際,進化的に遠い生物を比較した場合,DNA 複製のような重要な役割を担う遺伝子でも,オーソログでない遺伝子で置き換わっている例が知られる (P363中).オーソロガスな転写因子は,常に特異性を共有するわけではない (P363右).

Kocot, K. M., Moroz, L., Citarella, M. & Halanych, K. (2013).
PhyloTreePruner: a Phylogenetic Tree-Based Approach for Selection of Orthologous Sequences for Phylogenomics. Evolutionary Bioinformatics, 9, 429–435.

系統推定マーカー選択に向けた,オーソログ判定スクリプト PhyloTreePruner (PTP).Tree base.配列アライメントと種系統樹をアップロードする.一つの遺伝子系統樹から一つのオーソグループを選択.そのオーソグループから自動的にパラログが削除され,最終的にはオーソグループ内部には 1 種につき 1 配列が残される.
意見:方法が conclusion に書かれているなど,論文の形式が特殊?

Nakaya, A., et al. (2013).
KEGG OC: a large-scale automatic construction of taxonomybased ortholog clusters. Nucleic Acids Research, 41 (Database issue), 353–357.

Pearson, W. R. (2013).
An introduction to sequence similarity (“homology”) searching. Current Protocols in Bioinformatics/Editorial Board, Andreas D. Baxevanis. [et Al.], 43, 3.1.1–3.1.8. Chapter
3, Unit 3.1.

総説.配列類似性を用いた相同性の判定.

Schreiber,F. and Sonnhammer,E.L.L. (2013)
Hieranoid: hierarchical orthology inference. J. Mol. Biol., 425, 2072–2081.

種の系統樹とともに,graph-based オーソログ予想である Inparanoid を用いた Hieranoid 法を開発.Tree-base と graph-based 法のハイブリッド (< Kaduk and Sonnhammer 17).

Takeda,J., Yamasaki,C., Murakami,K., Nagai,Y., Sera,M., Hara,Y., Obi,N., Habara,T., Gojobori,T. and Imanishi,T. (2013)
H-InvDB in 2013: an omics study platform for human functional gene and transcript discovery. Nucleic Acids Res., 41, D915–D919.

ヒト遺伝子データベース H-InvDB.

Altenhoff, A. M. & Dessimoz, C. 2012.
Inferring orthology and paralogy. Methods Mol. Biol. 855, 259–279.

Chen, X. & Zhang, J. 2012.
The ortholog conjecture is untestable by the current gene ontology but is supported by RNA sequencing data. PLoS Comput. Biol. 8, e1002784.

Dessimoz C, Gabaldon T, Roos DS, Sonnhammer ELL, Herrero J, Consortium QO. 2012.
Toward community standards in the quest for orthologs. Bioinformatics 28:900-904.

第二回 Quest for Orhotlogs 会議で議論のまとめ.

Wolf, Y. I. & Koonin, E. V. 2012.
A tight link between orthologs and bidirectional best hits in bacterial and archaeal genomes. Genome Biol. Evol. 1286–1294.

Reciprocal blast hit はある範囲の進化的距離にある生物間で有効 (< Gabaldon and Koonin, 13).

Zhang M, Leong HW 2012.
BBH-LS: an algorithm for computing positional homologs using sequence and gene context similarity. BMC Syst Biol 2012, 6(Suppl 1).

シンテニー情報を用いたオーソログ予測.

Boeckmann, B., Robinson-Rechavi, M., Xenarios, I. & Dessimoz, C. 2011.
Conceptual framework and pilot study to benchmark phylogenomic databases based on reference gene trees. Brief. Bioinform. 12, 423–435.

Benchmark study.

Dewey CN. 2011.
Positional orthology: putting genomic evolutionary relationships into context. Brief Bioinform. 2011;12(5):401–12.

総説.シンテニーに注目したオーソログ予測.

Dessimoz, C. 2011.
Editorial: orthology and applications. Brief. Bioinform. 12, 375–376 (2011).

Eddy SR. 2011.
Accelerated profile HMM searches. PLoS Comput Biol. 7:e1002195.

Forslund, K., Pekkari, I. & Sonnhammer, E. L. 2011.
Domain architecture conservation in orthologs. BMC Bioinformatics 12, 326 (2011).

配列の類似性が同程度の場合,ドメイン構造はパラログよりもオーソログの方がはるかに類似している (<Gabaldon & Koonin 13).

Huerta-Cepas, J., Dopazo, J., Huynen, M. A. & Gabaldón, T. 2011.
Evidence for short-time divergence and long-time conservation of tissue-specific expression
after gene duplication. Brief. Bioinform. 12, 442–448.

発現部位は,種間パラログよりもオーソログの方が類似.

Altenhoff AM, Studer Ra, Robinson-Rechavi M, Dessimoz C. 2012.
Resolving the ortholog conjecture: orthologs tend to be weakly, but significantly, more similar in function than paralogs. PLoS computational biology 2012, 8(5):e1002514.

Ortholog Conjecture.パラログよりもオーソログの方が同じ機能を持つことが多い.

Hernandez-Rosales M, Hellmuth M, Wieseke N, Huber KT, Moulton V, Stadler PF (2012)
From eventlabeled gene trees to species trees. BMC Bioinf 13(Suppl. 19):S6

Szollosi G.J., Boussau B., Abby S.S., Tannier E., Daubin V. 2012.
Phylogenetic modeling of lateral gene transfer reconstructs the pattern and relative timing of speciations. Proc.Nat.Acad. Sci. USA. 109:17513–17518.

既存の種系統樹と比較して,遺伝子系統樹を推定する方法を開発.

Thomas, P. D., Wood, V., Mungall, C. J., Lewis, S. E. & Blake, J. A. 2012.
On the use of gene ontology annotations to assess functional similarity among orthologs and
paralogs: a short report. PLoS Comput. Biol. 8, e1002386.

Altenhoff,A.M., Schneider,A., Gonnet,G.H. and Dessimoz,C. (2011)
OMA 2011: orthology inference among 1000 complete genomes. Nucleic Acids Res., 39, D289–D294.

Casci, T. Functional genomics. 2011.
Degrees of similarity. Nature Rev. Genet. 12, 522.

機能の保持には,オーソログよりも同じ生物内部の方が影響が大きい (< Gabaldon & Koonin 13).

Huerta-Cepas J, Capella-Gutierrez S, Pryszcz LP, Denisov I, Kormes D, Marcet-Houben M, Gabaldón T. 2011.
Phylomedb v3.0: an expanding repository of genome-wide collections of trees, alignments and phylogeny-based orthology and paralogy predictions. Nucleic Acids Research, 39(Database):556-60.

Tree-based オーソログ予測.

Kristensen DM, Wolf YI, Mushegian AR, Koonin EV. 2011.
Computational methods for Gene Orthology inference. Brief Bioinform. 12,379-391.

Koonin 博士のグループ.総説.遺伝子オーソロジーの判定方法を,Heuristic な配列類似性,遺伝子系統樹,synteny,による解析に大別.
 ヒト vs 魚オーソログの半分は保存シンテニー領域に属する (P386, 左 L6),とニワトリゲノム論文 (Hiller et al. 2004) を引用しているが,原著で該当の箇所が見つからない.
 オーソログは同じ機能を持つ傾向がある.パラログは時間とともい多様化し,subfunctionalization や neofunctionalization によって異なる機能をもつ傾向がある (P380左中).

Lechner, M. et al. 2011.
Proteinortho: detection of (co-)orthologs in large-scale analysis. BMC Bioinformatics 12, 124.

オーソログ判定ソフトエウェア,Proteinortho.Reciprocal blast hit による.

Marcet-Houben M, Gabaldon T. 2011.
TreeKO: a duplication-aware algorithm for the comparison of phylogenetic trees. Nucleic Acids Res. 39(10): e66.

Nehrt NL, Clark WT, Radivojac P, & Hahn MW (2011)
Testing the Ortholog Conjecture with Comparative Functional Genomic Data from Mammals. PLoS Comp. Biol. 7(6).

有名.Orthology Conjecture (パラログよりもオーソログは機能的に類似している) に疑問.機能のわかっているヒトとマウスのオーソログ・パラログ間で Orthology Conjecture を検証.種分化前に起源するパラログ間で機能が異なるのは不思議ではないので (P2左下),種分化後に生じたパラログに注目.同程度の多様性であるならば,異なる生物に存在するオーソログよりも,同じ種内に存在するパラログの方が,機能が類似すると示唆.予想に反して,コピーの多数存在するオーソログの方が, 単一コピーオーソログよりも機能が類似.パラログ間では,同じ染色体に位置するものがより機能が近い.遺伝子変換によると示唆.さらに,配列よりも生物そのものが機能推定に影響すると示唆.遺伝子機能の進化は,アミノ酸配列の類似性よりも,そのタンパク質が活動する細胞の状況によると結論.

Pryszcz,L.P., Huerta-Cepas,J. and Gabaldon,T. (2011)
MetaPhOrs: orthology and paralogy predictions from multiple phylogenetic evidence using a consistency-based confidence score. Nucleic Acids Res., 39, e32.

Tree-based オーソログ予測.

Salichos, L. & Rokas, A. 2011.
Evaluating ortholog prediction algorithms in a yeast model clade. PLoS ONE 6, e18755 (2011).

シンテニーから高い精度でオーソログ関係が推定されたとされる酵母遺伝子を例として,Blast base 法のオーソログ判定精度を比較.

Schmitt,T. et al. (2011)
Letter to the Editor: SeqXML and OrthoXML: standards for sequence and orthology information. Brief. Bioinf., 12, 485–488.

オーソロジー情報の記述フォーマットを提案.

Shi G, Peng MC, Jiang T. 2011.
MultiMSOAR 2.0: an accurate tool to identify ortholog groups among multiple genomes. PLoS One 2011, 6(6):e20892.

シンテニー情報を用いたオーソログ判定.

Trachana K, et al. 2011.
Orthology prediction methods: A quality assessment using curated protein families. Bioessays 33(10):769-780.

総説.手動で確認した 70 遺伝子ファミリー (benchmark set と呼び,論文中では RefOGs.C. elegans から Human まで 12 両側相称動物) を用いて,既存のデータベースに用いられている orthology prediction methods を比較.データベースの質も orthology prediction に大きく影響すると主張.
意見: 遺伝子系統樹を推定するには taxon sampling (phylogenetic range と言っている) をしぼるべき,と言っているところは良い.データベースの比較はすごいが,思いのほか得るものは少ないかも.

Dereeper,A., Audic,S., Claverie,J.M. and Blanc,G. (2010)
BLASTEXPLORER helps you building datasets for phylogenetic analysis. BMC Evol. Biol., 10, 8.

BLASTEXPLORER.

Mahmood K, Konagurthu AS, Song J, Buckle AM, Webb GI, Whisstock JC. 2010.
EGM: encapsulated gene-by-gene matching to identify gene orthologs and homologous segments in genomes. Bioinformatics 2010;26:2076–84.

Shi G, Zhang L, Jiang T: 2010.
MSOAR 2.0: Incorporating tandem duplications into ortholog assignment based on genome rearrangement. BMC Bioinformatics 2010, 11(1):10.

シンテニー情報を用いたオーソログ判定.

Altenhoff A, Dessimoz C. 2009.
Phylogenetic and functional assessment of orthologs inference projects and methods. PLoS Comput Biol. 5(1): e1000262.

オーソログ予測方法を比較.2014 年の時点で,37 のデータベースがオーソログ予測を提供 (< Pereira et al. 14).

Altenhoff AM, Dessimoz C (2009)
Phylogenetic and functional assessment of orthologs inference projects and methods. PLOS Comput Biol 5(1):e1000262.

Benchmark study.オーソログ推定法を比較.

Akerborg, O., Sennblad, B., Arvestad, L. & Lagergren, J. 2009.
Simultaneous Bayesian gene tree reconstruction and reconciliation analysis. Proc. Natl. Acad. Sci. USA 106, 5714–5719.

Datta RS, Meacham C, Samad B, Neyer C, Sjolander K. 2009.
Berkeley PHOG: phylofacts orthology group prediction web server. Nucleic Acids Res 2009;37:W84–9.

Ebersberger I, Strauss S, von Haeseler A. 2009.
HaMStR: Profile hidden markov model based search for orthologs in ESTs. BMC Evol Biol. 9(1):157.

Gabaldon T, et al. 2009.
Joining forces in the quest for orthologs. Genome Biol 10(9):403.

Hachiya T, Osana Y, Popendorf K, & Sakakibara Y (2009)
Accurate identification of orthologous segments among multiple genomes. Bioinformatics 25(7):853-860.

Jun J, Mandoiu II, Nelson CE. 2009.
Identification of mammalian orthologs using local synteny. BMC Genomics 2009;10:630.

ローカルシンテニーを用いた哺乳類オーソログの判定.

Parra G, Bradnam K, Ning Z, Keane T, Korf I. 2009.
Assessing the gene space in draft genomes. Nucleic Acids Res. 2009;37:289–97.

オーソログ判定スクリプト CEGMA.解析パイプライン.真核生物 6 種のゲノムデータから 458 真核生物コア遺伝子を判定.

Peterson ME, Chen F, Saven JG, Roos DS, Babbitt PC, Sali A.2009.
Evolutionary constraints on structural similarity in orthologs and paralogs. Protein Sci 2009;18:1306–15.

タンパク質の立体構造はパラログよりもオーソログで類似.

Schreiber, F., G. Worheide, et al. (2009).
OrthoSelect: a web server for selecting orthologous gene alignments from EST sequences. Nucleic Acids Res 37: W185-W188.

Schreiber, F., K. Pick, et al. (2009).
OrthoSelect: a protocol for selecting orthologous groups in phylogenomics. BMC Bioinformatics 10: 219.

Sennblad, B. & Lagergren, J. 2009.
Probabilistic orthology analysis. Syst. Biol. 58, 411–424.

Studer,R.A. and Robinson-Rechavi,M. (2009)
How confident can we be that orthologs are similar, but paralogs differ? Trends Genet., 25,
210–216.

総説.Ortholog Conjecture に疑問.

Vilella AJ, et al. 2009.
EnsemblCompara GeneTrees: Complete, duplication-aware phylogenetic trees in vertebrates. Genome Res 19: 327-335.

重要.2009 年の時点で,Ensembl のオーソロガス/パラロガス遺伝子判定方法を明示する唯一の論文か.Ensembl も当初は主に BLAST 検索によってオーソログ情報を判断していたが,最近になって遺伝子系統樹を用いるようになった,とイントロに明記.

Wolf YI, Novichkov PS, Karev GP, Koonin EV, Lipman DJ. 2009.
The universal distribution of evolutionary rates of genes and distinct characteristics of eukaryotic genes of different apparent ages. PNAS, 106(18):7273-7280.

Graph-based method は遺伝子欠失を検出できない場合がある (< Pereira et al. 14).

Gabaldon T. 2008.
Large-scale assignment of orthology: back to phylogenetics? Genome biology 9(10):235.

総説.相同遺伝子判定に関する現状と今後の課題. Pairwise sequence comparison ではなく Phylogeny-based orthology prediction によって相同性を判定するべきと主張. これまではほとんど BLAST 解析でオーソログが判定されていた.相同性,オーソログ,パラログ,の説明,および Species tree への reconciliation などを丁寧に解説.Synteny には触れず.Best bi-directional best hits (BBH) 方では one-to-one のオーソロジー関係しかカウントできない.近縁種では問題とならないが,より離れた系統間を比較する場合に問題となる.とくに比較する種のどちらかで全ゲノム重複を経験している場合は,one-to-manhy から many-to-many 関係の比較が必要になる.
 "Species-overlap" アルゴリズム (Fig. 2e) を含む,オーソログ推定法を図解. 遺伝子系統樹と種系統樹を比較する方法は tree-reconciliation phylogenetic approach (Fig. 2d).
意見:BLASTP 解析は,配列の類似度で系統樹を推定し,オーソログを判定する.配列の類似度だけで系統関係の推定は困難であることは,これまで行われてきた分子系統解析の歴史からも明らかである.
 BLAST 解析は,配列をペアワイズで比較する.このため多重アライメントではアライメント困難なため系統解析に用いられない部分もその後の解析に用いることになり,エラー要因となる.

Jensen,L.J., Julien,P., Kuhn,M., Mering,C., von Muller,J., Doerks,T. and Bork,P. (2008)
eggNOG: automated construction and annotation of orthologous groups of genes. Nucleic Acids Res., 36, D250–D254.

オーソログ・グループと機能アノテーションのデータベース eggNOG の報告.eggNOG は COG の方法を拡張した graph-based unsupervised clustering アルゴリズムを用いている (<Huerta-Cepas et al 16).

Koonin EV, Wolf YI. 2008.
Genomics of bacteria and archaea: the emerging dynamic view of the prokaryotic world. Nucleic Acids Research 2008, 36(21):6688-6719.

Graph-based method は遺伝子欠失を検出できない場合がある (<Pereira et al. 14).

Kriventseva,E.V. et al. (2008)
OrthoDB: the hierarchical catalog of eukaryotic orthologs. Nucleic Acids Res., 36, D271–D275.

OrthoDB.オーソログ予測.

Kuzniar A, van Ham RC, Pongor S, Leunissen JA. 2008.
The quest for orthologs: finding the corresponding gene across genomes. Trends Genet 24: 539–551.

総説.Quest for orthologs. ‘Gold’ standards in benchmarks (P547左).Ensembl Compara や HomoloGene, TreeFam を解説 (P543).

Lynch, V. J. & Wagner, G. P. 2008.
Resurrecting the role of transcription factor change in developmental evolution. Evolution 62, 2131–2154 (2008).

総説.転写因子タンパク質の配列変化が,表現型 (遺伝子制御) の進化に及ぼす影響は,一般的な認識 (cis-regulatory paradigm: コーディング領域より調節領域の変異が表現型進化に寄与) より大きい (P2132左中).
 オーソロガスな転写因子は,常に特異性を共有するわけではない (< Gabaldon & Koonin 13).

Roth,A.C.J. et al. (2008)
Algorithm of OMA for large-scale orthology inference. BMC Bioinformatics, 9, 518.

Ruan J, Li H, Chen Z, Coghlan A, Coin LJM, Guo Y, Hériché JK, Hu Y, Kristiansen K, Li R, et al. 2008.
Treefam: 2008 update. Nucleic Acids Research 2008, 36(Database):735-740.

Tree-based オーソログ予測.

Vilella,A.J. et al. (2008)
EnsemblCompara GeneTrees: Complete, duplicationaware phylogenetic trees in vertebrates. Genome Res., 19, 327–335.

EnsemblCompara によるオーソログ予測.

Chen, F., Mackey, A. J., Vermunt, J. K. & Roos, D. S. 2007.
Assessing performance of orthology detection strategies applied to eukaryotic genomes. PLoS ONE 2, e383 (2007).

オーソログ判定プログラムの比較.Latent Class Analysis (LCA) という手法を用いる.

Dolinski, K. & Botstein, D. 2007.
Orthology and functional conservation in eukaryotes. Annu. Rev. Genet. 41, 465–507 (2007).

総説.Ortholog Conjecture.

Fu Z, Chen X, Vacic V, Nan P, Zhong Y, Jiang T. 2007.
MSOAR: a high-throughput ortholog assignment system based on genome rearrangement. J Comput Biol. 2007;14(9):1160–75.

シンテニー情報を用いたオーソログ判定.

Gabaldon T. 2007.
Evolution of proteins and proteomes: a phylogenetics approach. Evol Bioinform Online 2007;1:51–61.

総説.

Huerta-Cepas J, Dopazo H, Dopazo J, & Gabaldon T (2007)
The human phylome. Genome biology 8(6):R109.

PhylomeDB の基幹をなす論文.ヒト全タンパク質遺伝子の遺伝子系統樹を推定.得られた結果をもとに,哺乳類内部の系統関係や系統特異的な重複について考察.論文の体裁や解析パイプラインの記述などは参考になる.

Mi,H., Guo,N., Kejariwal,A. and Thomas,P.D. (2007)
PANTHER version 6: protein sequence and function evolution data with expanded representation of biological pathways. Nucleic Acids Res., 35, D247–D252.

Tree-based オーソログ予測.

Parra G, Bradnam K, & Korf I (2007)
CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes. Bioinformatics 23(9):1061–1067.

Ranwez, V., Delsuc, F., Ranwez, S., Belkhir, K., Tilak, M.-K., Douzery, E.J., 2007.
OrthoMaM: A database of orthologous genomic markers for placental mammal phylogenetics. BMC Evol. Biol. 7, 241.

哺乳類 12 種のゲノムデータから系統解析マーカを抽出しデータベース化.オーソログ判定は Ensembl に従う (P3右中).

Van der Heijden RT, Snel B, Van Noort V, et al. 2007.
Orthology prediction at scalable resolution by phylogenetic tree analysis. BMC Bioinformatics 2007;8:83.

Chen,F., Mackey,A.J., Stoeckert,C.J. and Roos,D.S. (2006)
OrthoMCL-DB: querying a comprehensive multi-species collection of ortholog groups. Nucleic Acids Res., 34, D363–D368.

Graph-based によるオーソログ予測.

Hulsen T, Huynen MA, de Vlieg J, Groenen PM (2006)
Benchmarking ortholog identification methods using functional genomics data. Genome Biol 7: R31.

Li H, Coghlan A, Ruan J, Coin LJ, Heriche JK, Osmotherly L, et al. 2006.
TreeFam: a curated database of phylogenetic trees of animal gene families. Nucleic Acids Res. 2006;34:D572-D80. Wiki.

TreeFam.

Dessimoz,C. et al. (2005)
OMA, A comprehensive, automated project for the identification of orthologs from complete genome data: introduction and first achievements. In: McLysaght, A. and Huson, D.H. (eds.) RECOMB 2005 Workshop on ComparativeGenomics. Springer BerlinHeidelberg, pp. 61–72.

Koonin EV (2005)
Orthologs, paralogs, and evolutionary genomics. Annu. Rev. Genet. 39:309-338.

総説.オーソログとパラログの定義と選択方法.Ortholog conjecture (パラログよりもオーソログが同じ機能を持つ傾向にある) についても言及 (< Nehrt et al 11).

O’Brien,K.P. et al. (2005)
Inparanoid: a comprehensive database of eukaryotic orthologs. Nucleic Acids Res., 33, D476–D480.

Koonin, E. V. et al. 2004.
A comprehensive evolutionary classification of proteins encoded in complete eukaryotic genomes. Genome Biol. 5, R7.

Simillion C, Vandepoele K, Van de Peer Y. 2004.
Recent developments in computational approaches for uncovering genomic homology. Bioessays 2004;26:1225–35.

Baldauf, S. L. 2003.
Phylogeny for the faint of heart:a tutorial. Trends Genet. 19, 345–351 (2003).

オーソログだけが,種の系統樹の構築に用いることができる  (Gabaldon & Koonin, 13).

Li,L. et al. (2003)
OrthoMCL: identification of ortholog groups for eukaryotic genomes. Genome Res., 13, 2178–2189.

OrthoMCL によるオーソログ予測.All-vs-all BLAST, Markov Clustering, MySQL データベースの作成など,13 ステップよりなる.

Tatusov,R., Fedorova,N., Jackson,J., Jacobs,A., Kiryutin,B., Koonin,E., Krylov,D., Mazumder,R.,Mekhedov,S., Nikolskaya,A. et al. (2003)
The COG database: an updated version includes eukaryotes. BMC Bioinformatics, 4, 41

COG database. Graph-based によるオーソログ予測.

Sonnhammer, E. L. L. & Koonin, E. V. (2002).
Orthology, paralogy and proposed classification for paralog subtypes. Trends in Genetics: TIG, 18, 619–620.

総説.

Storm CEV, Sonnhammer ELL. 2002.
Automated ortholog inference from phylogenetic trees and calculation of orthology reliability. Bioinformatics (Oxford, England) 2002, 18(1):92-9.

Tree based オーソログ予測.

True, J. R. & Carroll, S. B. 2002.
Gene co-option in physiological and morphological evolution. Ann. Rev. Cell Dev. Biol. 18,
53–80.

Zmasek CM, Eddy SR. 2002.
Rio: Analyzing proteomes by automated phylogenomics using resampled inference of orthologs. BMC bioinformatics 2002, 19:1-19.

Tree based オーソログ予測.

Koski, L. B. & Golding, G. B. 2001.
The closest BLAST hit is often not the nearest neighbor. J. Mol. Evol. 52, 540–542 (2001).

もっとも近い BLAST hit が,もっとも近縁でないことがある.

Jensen,R.A. (2001)
Orthologs and paralogs - we need to get it right. Genome Biol., 2, 1002.1–1002.3.

Remm,M., Storm,C.E.V. and Sonnhammer,E.L.L. (2001)
Automatic clustering of orthologs and in-paralogs from pairwise species comparisons1. J. Mol. Biol., 314, 1041–1052.

Inparanoid によるオーソログ予測.out-, in-paralog という言葉を導入.

Chen, K., Durand, D. & Farach-Colton, M. (2000).
NOTUNG: a program for dating gene duplications and optimizing gene family trees. Journal of Computational Biology: A Journal of Computational Molecular Cell Biology, 7, 429–447.

Fitch WM (2000)
Homology: a personal view on some of the problems. Trends Genet 16: 227–231.

それぞれの遺伝子系統樹の内部枝がどれほど種の系統樹を高い値で支持したか,によって,オーソログを判断するべきと指摘 (Philippe et al. 2011, P2 右).

Koonin, E. V., Aravind, L. & Kondrashov, A. S. 2000.
The impact of comparative genomics on our understanding of evolution. Cell 101, 573–576.

Ouzounis C (1999)
Orthology: another terminology muddle. Trends Genet 15: 445.

染色体上で近い遺伝子が,より関連している可能性がある (< Pereira et al. 14).

Overbeek,R. et al. (1999)
The use of gene clusters to infer functional coupling. Proc. Natl. Acad. Sci. USA, 96, 2896–2901.

Bidirectional best hits いよるオーソログ予測法.

Huynen, M. A. & Bork, P. 1998.
Measuring genome evolution. Proc. Natl Acad. Sci. USA 95, 5849–5856 (1998).

Bidirectional best hit (BBH).

Tatusov RL, Koonin EV, Lipman DJ. 1997.
A genomic perspective on protein families. Science 278:631–637.

Ortholog Conjecture.

Mushegian, A. R. & Koonin, E. V. 1996.
A minimal gene set for cellular life derived by comparison of complete bacterial genomes. Proc. Natl Acad. Sci. USA 93, 10268–10273.

Fitch, W. M. (1970).
Distinguishing homologous from analogous proteins. Systematic Zoology, 19, 99–113.



ウェブサイト
第一号 OMA 論文 (Dessimoz et al. 2005)Trachana et al (2011) のレビューが参考になる.大きく graph-based methods (配列の類似性のみに基づく) と tree-based methods (系統樹に基づく)に分けることができる (Trachana et al. 2011).Quest for orthologs にデータベースがまとめられている.

Graph-based method-1: Pairwise species comparison

inParanoid

真核生物ゲノムを広くカバーしている (Dessimoz et al. 2005).RAG1, Homo sapiens で単語検索した結果はこちら

BHR

RoundUp

Phylomarker

Li et al. (2007) で用いられたデータが公開されているが,わかりにくい.Orti さんの共同研究者が作成.更新はされている気配はない. 真骨類 (条鰭類) に特化したデータベースは,現在ではこれだけ.

Graph based method-2: Multi-species comparison

COGs

NCBI が提供する相同性情報.BLAST 検索によって相同遺伝子を判別し,2005 年の時点ではもっとも完成度が高いと言われる (Dessimoz et al. 2005).

eggNOG

OrthoDB

フランス・ジュネーブのグループが作成.

OrthoMCL

真核生物ゲノムを広くカバー (Dessimoz et al. 2005).RAG1 の検索結果はこちら
以下の文献に使い方が詳しく解説されているらしい.
Fischer S (2011) Using OrthoMCL to assign proteins to OrthoMCL-DB groups or to cluster proteomes into new ortholog groups. Curr Protoc Bioinformatics 6:1-19.

OMA

スイスのグループが作成.1000 種の全ゲノムから相同遺伝子を判別.割と大きなプロジェクト.関連の論文がダウンロード可能.データベースへはリンク切れか.

OrthoSelect

MANTiS

Multi-species tree-based methods

TreeFam

Ensembl で用いられている遺伝子系統樹のデータベース.頻繁に更新されているらしい. RAG1 の検索結果はこちら


Ensembl

相同遺伝子を一応 ML で推定した遺伝子系統樹に基づいて行っている.また,相同遺伝子の評価は機械的に行っており,全ゲノム重複を意識したものではない.相同遺伝子の選定方法は,Vilella et al. (2009). にまとめられている.
 RAG1 を例にする. こちらのページにたどり着くと,Human に相同と判断された他の動物の遺伝子と,用いられた系統樹を得ることができる.画面左はし,Gene Tree (image),Gene Tree (txt),Orthologues などを押す.

PhylomeDB

バルセロナのグループ (Toni Gabaldon) が作成.全遺伝子についての遺伝子系統樹を phylome と読び,1000 種近くのゲノムを解析対象としている.実際にはタンパク質遺伝子を解析しており,ML 遺伝子系統樹とアミノ酸アライメントを配布.
 遺伝子系統樹の作成に力を入れていが,それ以上の解析は行っていない模様.ウェブサイトの使い方はこちら.遺伝子系統樹とアミノ酸配列が得られる,という説明をしているのみ.
  こちらに解析パイプラインの説明がある.Huerta-Cepas et al. (2007) が Human について phylome を作成したのが最初で,そこで作成したパイプラインを用いている.BLAST 検索によって配列を収集し,NJ tree を ML tree search の seed tree として用いている.Bayes tree も推定して精度を上げている模様.
 RAG1 の検索結果はこちら.推定された遺伝子系統樹とアミノ酸アライメントも表示.
 このグループは,バイオインフォマティクスに偏った論文を多数出している.


配列解析:方法

Nascimento FF, Reis Md, & Yang Z (2017)
A biologist’s guide to Bayesian phylogenetic analysis. Nature Ecology & Evolution 1(10):1446-1454.

ベイズ法による系統樹探索の総説.具体的な解析方法を解説.

Shen X-X, Hittinger CT, & Rokas A (2017)
Contentious relationships in phylogenomic studies can be driven by a handful of genes. Nature Ecology & Evolution 1:0126.

動物最古の系統を有櫛動物とする遺伝子が多く,海綿動物とする遺伝子は少ない(< Dunn et al. 17).

Mirarab S (2017)
Phylogenomics: Constrained gene tree inference. Nature Ecology & Evolution 1:0056.

Gene genealogy interrogation (CCI, Arcila et al. 2017) に言及.樹形の異なる遺伝子系統樹から種の系統樹を推定する際の問題点を考察.著者は,遺伝子系統樹から種の系統樹を推定する ASTRAL の作者.
 GGI は,疑いようのない単系統群 (複数あると良い) がまとまるという制約のもとに最尤法で遺伝子系統樹を推定し,不明な分岐関係の解明を目指す.得られた系統樹を尤度によって比較.ある仮説が多くの遺伝子系統樹間で指示されれば,種の系統関係と判定 (P1左).

Arcila D, et al. (2017)
Genome-wide interrogation advances resolution of recalcitrant groups in the tree of life. Nature Ecology & Evolution 1:0020.

ゲノムデータを用いて樹形テストを行う Gene genealogy Interrogation (GGI) 法を開発. 1051 遺伝子座,225 種のデータを解読し GGI によって作成したデータセットを用いて Otophysi の系統解析を行う.そのほか,後生動物や鳥類,哺乳類のデータで GGI を試す.Mirarab S (2017) に詳しい解説がある (上述).

Chen MY, Liang D, Zhang P. 2015.
Selecting question-specific genes to reduce incongruence in phylogenomics: a case study of jawed vertebrate backbone phylogeny. Syst Biol. 64:1104-1120.

Phylogenomics では,大量のデータではなく,対象とする問題に合わせたデータセットを用いることが重要と指摘.脊椎動物のゲノムデータ (58 種,4682 遺伝子) を concatenate と coalescent 法に基づいて解析.オーソログは Bidirectional BLASTP によって判定. 6 つの系統学的問題の解明を目指す.真骨類最古の分岐は,アロワナ類+カライワシ類からなるクレードと示唆 (P1116左中).

Doyle VP, Young RE, Naylor GJP, et al. 2015.
CanWe Identify Genes with Increased Phylogenetic Reliability? Systematic Biology 64:824–837.

ゲノムワイドデータから系統解析に有用な遺伝子 (遺伝子座) 選定するには,遺伝子座別の rate よりも,分子時計の一定性などを目安にした方が良いと指摘.酵母と羊膜類のゲノムデータを解析.

Jarvis, E.D. et al. 2014.
Whole-genome analyses resolve early branches in the tree of life of modern birds. Science 346, 1320–1331.

Capella-Gutierrez S, Kauff F, Gabaldon T. 2014.
A phylogenomics approach for selecting robust sets of phylogenetic markers. Nucleic Acids Res. 42:e54.

Reference tree を再構築できるかどうかによって,系統解析に有用な遺伝子セット (個々の遺伝子では無い) を選定 (P10 左中). Blast によって single copied gene を選択 (P2左中).この方法をシアノバクテリアと子嚢菌の phylogenomics に適用.

Betancur RR, Naylor GJ, Orti G. 2014.
Conserved genes, sampling error, and phylogenomic inference. Syst Biol 63:257-262.

Salichos and Rokas (2013) のデータを再解析して彼らの主張 (古い分岐の解明に,進化速度の遅い遺伝子は不向き,系統情報を含む遺伝子を集めるべき) が,主要なゲノム系統アプローチである target enrichment で標的遺伝子座を決める際に,実用的価値がほとんどないと指摘 (P257 右下).
 S&R は 23 酵母ゲノムを比較して 1070 オーソログを系統解析しそのパフォーマンスを比較した.S&R の結論は,進化速度の遅い遺伝子 (本論文の解析では,選択した一群に 260C と命名) の選択は,高次系統の分岐解明には不適とする.これは広く認められる見解と異なる.一方で系統的シグナル (genealogical signal: 平均 BS 値に基づく) の高い遺伝子 (131S) の選択が有効とした.しかし,本論文は,S&R の比較解析では,サンプリングエラーによって 260C 遺伝子は 131S 遺伝子よりも短かったため,260C の遺伝子はパフォーマンスが低く見積もられていたと指摘.
意見: 「進化速度の遅い遺伝子はパフォーマンスが悪い」という一般的な見解と反対の主張 (S&R) に疑問を抱いて,この論文を書いたのだろう.両者の論文はいずれも,concatenate による tree を正解として,遺伝子群のパフォーマンスを検討.しかし,正解とする樹形は,遺伝子系統樹だけでなく,あらゆる視点から広く認められた種の系統樹でなければまずいのでは? そもそもオーソログ判定はこれで良いのか [2015 年 5 月].

Breinholt JW & Kawahara AY (2013)
Phylotranscriptomics: saturated third codon positions radically influence the estimation of trees based on next-gen data. Genome Biol Evol 5(11):2082-2092.

Salichos L, Rokas A 2013.
Inferring ancient divergences requires genes with strong phylogenetic signals. Nature 497: 327-+.

ゲノムデータから得られた配列を concatenate して系統解析に用いる場合の問題点をあげる."strong genelogical singls" を含んだ遺伝子の選択が,系統解析の精度を上げると指摘 (Betancur-R et al. 2014, P257 左下).進化速度の遅い遺伝子よりブートストラップ値の高い遺伝子を集めるべきと主張 (Betancur-R et al. 2014, P257).Betancur et al. (2014) (上) により批判.
 酵母 23 種から得られた 1070 遺伝子 (シンテニーからオーソログと確認されている) を系統解析した研究では,どの遺伝子から得られた樹形も concatenate して得られた樹形とは異なっていた.とくに分岐は深いが短い内部枝では問題と指摘.後生動物や脊椎動物でも同様の傾向を確認.concatenate は本当に良いか疑問を投げかける.全配列を使うことよりも解析に有用な遺伝子配列だけを使うこと,および極端な不一致が見られた分岐を見極めること (単なるデータによるエラーなのか,実際に解明が難しいのか,を意味していると思う) が,太古の分岐を解明するには重要と指摘.
  ブートストラップ解析は単一遺伝子など少数のデータ解析でサンプリングエラーを検出するために開発されたとする.このため,genome wide なデータを concatenate した解析には不向きと指摘.たとえ極端に異なる対立仮説があっても 100% の支持確率を出しやすいとする (Perspective 最初の段落).

Li, C., Hofreiter, M., Straube, N., Corrigan, S. & Naylor, G. J. 2013.
Capturing protein-coding genes across highly divergent species. BioTechniques 54, 321–326.

Gene capture の方法を紹介した論文.

Yang ZH, Rannala B. 2012.
Molecular phylogenetics: principles and practice. Nature Reviews Genetics 13:303-314.

最節約法や距離法,最尤法など系統樹推定の方法を広く浅く紹介.ゲノム系統学 (phylogenomics) では,Supermatrix によるアプローチの注意点を指摘.Concatenate したデータの厳密なパーティション設定には批判的 (P311 右上).

Salichos L, Rokas A. 2011.
Evaluating ortholog prediction algorithms in a yeast model clade. PLoS One 6:e18755.

オーソログ判定に reciprocal blast が有効な手段の一つと指摘.

Philippe H, Brinkmann, and Lavrov et al. (2011)
Resolving Difficult Phylogenetic Questions: Why More Sequences Are Not Enough. PLoS Biol. 9(3).

動物主要系統間の 3 phylogenomic 論文 (Dunn et al., 2008; Philippe et al., 2009; Schierwater et al. 2009) 間で異なる樹形が支持された要因をそれぞれのデータを再解析しながら,主に「配列解析」をレビュー.ゲノムデータから用いる配列を継ぎ足してゆくだけでは,未解決の分岐解明にはつながらないと指摘.配列解析のエラーは (i) 誤ったオーソログ判定,(ii) アライメントエラー,(iii) サイト内での多重置換補正エラー,による (P1 右下).Phylogenomics では,オーソロガスでない遺伝子に起因するエラーは打ち消される傾向にあるが,判定の難しい分岐の解明には影響するので,データがクリーンであることは重要と指摘 (P4 右).Missing data も問題とする (Box 3 最後).ゲノムデータは巨大なため,コンピュータ解析付加を軽減するためにデータを切り詰める必要がある (Tarver et al. 2013).

Nishihara H, Okada N, & Hasegawa M (2008)
ゲノム系統学的手法の応用と課題 -真獣類の起源に関する解析を例として-. 系統数理 56(1):19–35.

ゲノム規模の配列データを解析するには,concatenate よりも separate model の方が精度が良いと指摘.Concatenate model は均質なモデルを用いるため,誤った系統関係を高い信頼性で支持されてしまう一方,separate model はそのエラーを激減させることを,真獣類のデータを用いて示す.

Rannala, B. & Yang, Z. 2008
Phylogenetic inference using whole genomes.
Annum Rev. Genome. Human Genet. 9, 217-31.

ゲノムデータを用いた系統解析の方法論をレビュー.種と遺伝子の系統樹が異なる原因 (ancestral polymorphism, lineage sorting など) を紹介.Phylogenomics の方法として,遺伝子配列の concatenation (あるいは別々に解析するのか),配列のパーティショニング,supermatrix vs supertree, などを解説.

Qiao B, Goldberg TL, Olsen GJ, Weigel RM. 2006.
A computer simulation analysis of the accuracy of partial genome sequencing and restriction fragment analysis in the reconstruction of phylogenetic relationships. Infect Genet Evol. 6:323-330.

Stemminess.

Mueller RL. 2006.
Evolutionary rates, divergence dates, and the performance of mitochondrial genes in Bayesian phylogenetic analysis
SYSTEMATIC BIOLOGY 55 (2)

Kumazawa, Y., Y. Azuma, and M. Nishida. 2004.
Tempo of mitochondrial gene evolution: can mitochondrial DNA be used to date old divergences? Endocytobiosis Cell Res. 15: 136-142.

Rokas, A., Williams, B. L., King, N. and Carroll, S. B. 2003.
Genome-scale approaches to resolving incongruence in molecular phylogenies, Nature, 425, 798–804.

酵母 8 種の 106 オーソロガス遺伝子を解析.小さーデータセットでは異なる樹形が得られるが,20 遺伝子以上だと比較可能な結果が得られると示唆.

Springer MS, DeBry RW, Douady C, et al. 2001.
Mitochondrial versus nuclear gene sequences in deep-level mammalian phylogeny reconstruction. MOLECULAR BIOLOGY AND EVOLUTION 18 (2): 132-143 FEB 2001.

Russo CAM, Takezaki N, Nei M. 1996.
Efficiencies of different genes and different tree-building methods in recovering a known vertebrate phylogeny
MOLECULAR BIOLOGY AND EVOLUTION 13 (3): 525-536.

Friedlander TP, Regier JC, Mitter C 1992.
Nuclear Gene-Sequences for Higher Level Phylogenetic Analysis - 14 Promising Candidates. Systematic Biology 41: 483-490.


遺伝子間の進化速度・進化パターン変異
Gadagkar, S. R., Rosenberg, M. S. and Kumar, S. 2005.
Inferring species phylogenies from multiple genes: Concatenated sequence tree versus consensus gene tree, Journal of Experimental Zoology Part B: Molecular and Developmental Evolution, 304, 64–74.

Seo, T.-K., Kishino, H. and Thorne, J. L. 2005.
Incorporating gene-specific variation when inferring and evaluating optimal evolutionary tree topologies from multilocus sequence data, Proceedings of the National Academy of Sciences of the United States of America, 102, 4436–4441.

 

配列解析:系統関係

動物根幹
Feuda, R., Dohrmann, M., Pett, W., Philippe, H., Rota-Stabelli, O., Lartillot, N., Wörheide, G., & Pisani, D. (2017).
Improved Modeling of Compositional Heterogeneity Supports Sponges as Sister to All Other Animals. Curr Biol. 2017;27:3864-70 e4.

脊椎動物でもっとも古くに分岐したのはカイメンと主張.従来通り,真正後生動物 (平板動物を含む) の単系統性を支持.

Dunn CW (2017)
Ctenophore trees. Nat Ecol Evol 1(11):1600-1601.

Whelan et al (2017) の解説.動物最古の系統はクシクラゲ (有櫛動物: Ctenophora) か海綿 (Porifera) か判明していない (Fig. 2).
 動物は 5 系統からなる:左右相称動物,刺胞動物 (Cnidaria),板形動物 (Placozoa),海綿動物 (Porifera), 有櫛動物 (Ctenophora).伝統的に,神経系を有する有櫛動物, 刺胞動物, 左右相称動物がクレードを形成し,神経系は単一起源とされてきた. 海綿は他の動物の姉妹群とされたが,この仮説は提出されたことがなかった (P1600左下).
 神経系を持たない海綿動物と板形動物の外側に神経系を持つ有櫛動物が分岐したので,神経系の進化は獲得と欠失を考える必要がある.

Whelan, N.V., Kocot, K.M., Moroz, T.P., Mukherjee, K., Williams, P., Paulay, G., Moroz, L.L., Halanych, K.M. (2017).
Ctenophore relationships and their placement as the sister group to all other animals. Nature Ecology & Evolution 1: 1737–1746.

動物最古の系統は有櫛動物と示唆.
 Taxon sampling の問題を解消するために,有櫛動物 27 種のトランスクリプトームデータを解読.長枝誘因の問題に対応した解析も行う.海綿動物を最古の系統とする解析結果は,taxon sampling が足りないために生じたと指摘.遺伝子別の解析も行い,遺伝子ごとに結果が異なる原因解明が次のステップと示唆 (< Dunn et al. 17).

Simion P, et al. (2017)
A Large and Consistent Phylogenomic Dataset Supports Sponges as the Sister Group to All Other Animals. Curr. Biol. 27(7):958-967.

海綿動物が動物最古の系統と示唆.有櫛動物を最古の系統とする解析は長枝誘因による artifact と指摘 (< Dunn et al. 2017).

Dunn CW, Leys SP, & Haddock SH (2015)
The hidden biology of sponges and ctenophores. Trends Ecol. Evol. 30(5):282-291.

Whelan N, Kocot K, Moroz L, Halanych K. 2015.
Error, signal, and the placement of Ctenophora sister to all other animals. Proc Natl Acad Sci U S A. 112(18): 5773–5778.

有櫛動物が動物最古の系統と示唆.

Pisani D, et al. (2015)
Genomic data do not support comb jellies as the sister group to all other animals. Proc Natl Acad Sci U S A 112(50):15402-15407.

有櫛動物を最古の系統とする解析は長枝誘因による artifact と指摘 (< Dunn et al. 2017).

Dunn, C.W., Giribet, G., Edgecombe, G.D., Hejnol, A., 2014.
Animal phylogeny and its evolutionary implications. Annual Review of Ecology, Evolution, and Systematics 45, 371–395.

総説.左右相称動物を中心とした動物・主要グループ間の系統関係.各分岐の信頼性 (Fig. 1),共有派生形質 (Table 1),形態形質 (神経や体腔, Fig. 3),化石層序 (Fig. 5) をマップ.核とミトコンドリアゲノムの進化.
  多くの新たな形質は,遺伝子の機能や遺伝子間の関係を改善することを通して得られており,祖先が持っていた遺伝子の数は,考えられていたよりも多い (P383下).

Nosenko T, Schreiber F, Adamska M, Adamski M, Eitel M, Hammel J, Maldonado M,
Muller WE, Nickel M, Schierwater B et al. 2013.
Deep metazoan phylogeny: when different genes tell different stories. Mol. Phylogeneti.
Evol. 67:223-233.

Non-bilaterian 122 遺伝子を解析.進化速度の遅い遺伝子が動物主要系統間のような深い分岐間の解析に有用.

Edgecombe GD, et al. (2011)
Higher-level metazoan relationships: recent progress and remaining questions. Organisms Diversity & Evolution 11(2):151–172.

Schierwater B, Eitel M, Jakob W, Osigus HJ, Hadrys H, Dellaporta SL, Kolokotronis SO,
Desalle R. 2009.
Concatenated analysis sheds light on early metazoan evolution and fuels a modern "urmetazoon" hypothesis. PLoS Biol. 7:e20.

Philippe H, Derelle R, Lopez P, Pick K, Borchiellini C, et al. (2009)
Phylogenomics revives traditional views on deep animal relationships.Curr Biol 19: 706–712.

Schierwater B, Eitel M, Jakob W, Osigus HJ, Hadrys H, et al. (2009)
Concatenated analysis sheds light on early metazoan evolution and fuels a modern ‘‘urmetazoon’’ hypothesis. PLoS Biol 7: e1000020.

Dunn CW, Hejnol A, Matus DQ, Pang K, Browne WE, et al. (2008)
Broad phylogenomic sampling improves resolution of the animal tree of life. Nature 452: 745–749.

有櫛動物が動物最古の系統と示唆.


Bilaterians (左右相称動物)

Osigus H-J, Eitel M, Schierwater B. 2013b.
Chasing the urmetazoon: striking a blow for quality data? Mol. Phylogenet. Evol. 66:551–57

Hejnol A, et al. (2009)
Assessing the root of bilaterian animals with scalable phylogenomic methods. P Roy Soc B-Biol Sci 276(1677):4261-4270.

Lartillot N, Philippe H. 2008.
Improvement of molecular phylogenetic inference and the phylogeny of Bilateria. Philos Trans Royal Soc B Biol Sci. 2008;363:1463–72.


Protostomes (前口動物)
Giribet G, Edgecombe GD. 2017.
Current Understanding of Ecdysozoa and its Internal Phylogenetic Relationships. Integr Comp Biol 57:455-466.

総説.脱皮動物内部の系統関係とその単系統性を指示する形態形質.

Lu TM, Kanda M, Satoh N, & Furuya H (2017)
The phylogenetic position of dicyemid mesozoans offers insights into spiralian evolution. Zoological Lett 3:6. 日本語解説.

ゲノム解析からニハイチュウがらせん動物でも派生的な系統と指摘.ニハイチュウはその体制を退化的に単純化させたことになる.
 ニハイチュウはわずか 40 個ほどの細胞からなり,循環器系など動物が共通に持つ体の構成要素を持たない.タコやイカなど頭足類の腎嚢に寄生.

Schwentner M, Combosch DJ, Pakes Nelson J, & Giribet G (2017)
A Phylogenomic Solution to the Origin of Insects by Resolving Crustacean-Hexapod Relationships. Curr. Biol. 27(12):1818-1824 e1815.

Laumer, C.E., Bekkouche, N., Kerbl, A., Goetz, F., Neves, R.C., Sørensen, M.V., Kristensen, R.M., Hejnol, A., Dunn, C.W., Giribet, G., Worsaae, K., 2015.
Spiralian phylogeny informs the evolution of microscopic lineages. Current Biology 25, 2000–2006.

Mollusca, Annelida, Brahipoda からなる Spiralians には,Platyhelminthes, Gastrotriches, Rotifera が含まれることを示す (<Satoh15, P46).

蘇 智慧.2015.
昆虫の起源と初期の進化.遺伝子の不思議な世界.大場祐一,大沢省三,編集.悠書館.

総説.昆虫の大系統.甲殻類の内部に単系統群として昆虫類が起源 (P22).多足類と昆虫類は別々に陸上に進出したことになる .昆虫類の姉妹群に当たる甲殻類はまだ判明していない (P24).
 オーソロジーを検討せずに大量の遺伝子を用いるゲノム系統解析に注意を喚起.

Tong KJ, Duchene S, Ho SY, Lo N. 2015.
INSECT PHYLOGENOMICS. Comment on "Phylogenomics resolves the timing and pattern of insect evolution". Science. 2015;349:487.

昆虫.Misof et al. (2014) に対する議論.

Kjer KM, Ware JL, Rust J, Wappler T, Lanfear R, Jermiin LS, et al. 2015.
INSECT PHYLOGENOMICS. Response to Comment on "Phylogenomics resolves the timing and pattern of insect evolution". Science. 2015;349:487.

昆虫.Misof et al. (2014) に対する議論.

Dell'Ampio E, Meusemann K, Szucsich NU, Peters RS, Meyer B, Borner J, Petersen M,
Aberer AJ, Stamatakis A, Walzl MG et al. 2014.
Decisive data sets in phylogenomics: lessons from studies on the phylogenetic relationships of primarily wingless insects. Mol Biol Evol. 31:239-249.

昆虫.

Misof B, Liu SL, Meusemann K, Peters RS, Donath A, Mayer C, et al. 2014.
Phylogenomics resolves the timing and pattern of insect evolution. Science 6210: 763-7.

昆虫.1478個の核ゲノム遺伝子を解析.

Miyazawa H, Ueda C, Yahata K, Su ZH. 2014.
Molecular phylogeny of Myriapoda provides insights into evolutionary patterns of the mode in post-embryonic development. Sci Rep 4:4127.

多足類の祖先は体節と足の数が比較的に少なく、多様化の過程で,一部の系統が体節を増やす方向へと進化したと考察.DNAとRNA合成酵素遺伝子(DPD1、RPB1とRPB2)を用いて系統解析を行い,祖先形質の推定を推定 (So 15).

Sharma PP, Kaluziak ST, Pérez-Porro AR, González VL, Hormiga G, Wheeler WC, Giribet G. 2014.
Phylogenomic interrogation of Arachnida reveals systematic conflicts in phylogenetic signal. Mol Biol Evol. 31:2963-2984.

クモ類.

Andrade S, Montenegro H, Strand M, Schwartz M, Kajihara H, Norenburg J, Turbeville J, Sundberg P, Giribet G. 2014.
A Transcriptomic approach to ribbon worm systematics (Nemertea): resolving the Pilidiophora problem. Mol Biol Evol. 31(12): 3206–3215.

Sasaki G, Ishiwata K, Machida R, Miyata T, Su ZH. 2013.
Molecular phylogenetic analyses support the monophyly of Hexapoda and suggest the paraphyly of Entognatha. BMC Evol Biol 13:236.

従来の仮説,昆虫類 (六脚類) の単系統性を示す.節足動物64種 (内顎類の3目すべてが解析に含まれる) から得られたDPD1、RPB1とRPB2という3遺伝子のアミノ酸配列を用いて最尤法とベイズ法で解析.ミトコンドリア遺伝子による解析では,甲殻亜門の鰓脚綱と軟甲綱は、昆虫類の内部に分岐していた.昆虫類の単系統性を示す支持率も比較的高い。核遺伝子を用いたこれまでの研究は、すべて昆虫類の単系統性を支持。
 3 核遺伝子,DNA合成酵素遺伝子(catalytic subunit of DNA polymerase δ: DPD1), RNA合成酵素遺伝子(largest subunit of RNA polymerase II: RPB1,second largest subunit of RNA polymerase II: RPB2は,オーソロガスな遺伝子.節足動物における進化速度のばらつきが少なく、系統解析に適す.昆虫類の全33目を含む55種、甲殻類の鰓脚綱、軟甲綱と顎脚綱3綱を含む6種、外群として多足類1種と鋏角類2種を使用。そのうちの5種はゲノム配列が公開されているので、それを使用したが残りの59種の遺伝子配列を解読 (So 15).

Rota-Stabelli O, Daley AC, Pisani D (2013)
Molecular timetrees reveal a Cambrian colonization of land and a new scenario for ecdysozoan evolution. Curr Biol 23: 392–398.

脱皮動物.

Giribet G, Edgecombe GD. 2012.
Reevaluating the arthropod tree of life. Annu. Rev. Entomol. 57:167–86

総説.節足動物.

Kocot KM, et al. (2011)
Phylogenomics reveals deep molluscan relationships. Nature 477(7365):452-456.

軟体動物・主要グループの系統関係 (Fig. 4).

Ishiwata K, Sasaki G, Ogawa J, Miyata T, Su ZH. 2011.
Phylogenetic relationships among insect orders based on three nuclear protein-coding gene sequences. Mol Phylogen Evol. 2011;58:169-80.

有翅昆虫類の系統進化.3 核タンパク遺伝子 (catalytic subunit of DNA polymerase delta (DPD1) and the two largest subunits of RNA polymeraseII (RPB1 and RPB2)) の解析から,シミ目と有翅昆虫類の近縁性を支持.有翅昆虫類の単系統性を示す統計的値は高くない.
 昆虫類の98%以上の種が有翅昆虫であり、無翅昆虫は2%にも満たない.有翅昆虫の祖先は翅を獲得し、無翅昆虫から分岐したのち爆発的に多様化したと考えられ、翅の獲得は有翅昆虫類の繁栄をもたらした大きな一因とされる.有翅昆虫の起源を知るためには、有翅昆虫の祖先は無翅昆虫のどの系統から分岐したのか、つまり,有翅昆虫類に最も近縁な無翅昆虫がなにかがわかればよい (So 15).

Regier JC, Shultz JW, Zwick A, Hussey A, Ball B, Wetzer R, et al. 2011.
Arthropod relationships revealed by phylogenomic analysis of nuclear protein-coding sequences. Nature. 2010;463:1079-83.

節足動物.昆虫と甲殻類が姉妹群と指摘.

Regier JC, Shultz JW, Zwick A, Hussey A, Ball B, Wetzer R, et al. 2010.
Arthropod relationships revealed by phylogenomic analysis of nuclear protein-coding sequences. Nature. 463:1079-83.

Savard J, Tautz D, Richards S, Weinstock GM, Gibbs RA, Werren JH, Tettelin H, Lercher MJ. 2006.
Phylogenomic analysis reveals bees and wasps (Hymenoptera) at the base of the radiation of Holometabolous insects. Genome Res 16:1334-1338.

185個の核遺伝子を用いて、ハチ目 (Hymenoptera 膜翅目) が完全変態類 (Holometabola) において最初に分かれた系統と示唆.従来考えられてきたハチ目の系統的位置とまったく異なる.完全変態類11目のうち、ハチ目、甲虫目、チョウ目、ハエ目の4目のみ用いる.
  ハチ目は幼虫の爪が対をなさないこと、下唇腺から絹糸が分泌されるなどの形態的特徴から、従来、チョウ目、トビケラ目、ハエ目、ノミ目、シリアゲムシ目などを含む長翅節と姉妹関係とされていた.
 Sasaki et al. (13) でも,ハチ目が完全変態類 の中で最初に分岐した系統であることが高い支持率で確認される.変態類の中でハチ目は最も祖先的な系統であろう (So 15).

Aguinaldo, A. M., J. M. Turbeville, et al. (1997).
Evidence for a clade of nematodes, arthropods and other moulting animals. Nature 387(6632): 489‐493.

18S rRNA 遺伝子解析により脱皮動物 (Ecdysozoa) を設立.前口動物は脱皮動物と冠輪動物 (Lophotrochozoa) に二分された.

Halanych, K.M., Bacheller, J.D., Aguinaldo, A.M.A., Liva, S.M., Hillis, D.M., Lake, J.A., 1995.
Evidence from 18s ribosomal DNA that the lophophorates are protostome animals. Science
267, 1641–1643.

18S rRNA 遺伝子配列に基づく前口動物の系統解析.



Deuterostomes (後口動物)

Nielsen C (2017)
Evolution of deuterostomy - and origin of the chordates. Biol Rev 92(1):316-325.

Gupta RS (2016)
Molecular signatures that are distinctive characteristics of the vertebrates and chordates and supporting a grouping of vertebrates with the tunicates. Mol Phylogenet Evol 94(Pt A):383-391.

Reich A, Dunn C, Akasaka K, Wessel, G. (2015)
Phylogenomic analyses of Echinodermata support the sister groups of Asterozoa and Echinozoa. PLOS ONE 10:e0119627.

Berna L & Alvarez-Valin F (2014)
Evolutionary genomics of fast evolving tunicates. Genome Biol Evol 6(7):1724-1738.

Cannon, J. T. et al. 2014.
Phylogenomic resolution of the hemichordate and echinoderm clade. Curr. Biol. 24, 2827–2832.

水腔動物.

O’Hara, T. D., Hugall, A. F., Thuy, B. & Moussalli, A. 2014.
Phylogenomic resolution of the class Ophiuroidea unlocks a global microfossil record. Curr. Biol. 24, 1874–1879.

クモヒトデ類 (Ophiuroidea).

Telford MJ et al. (2014)
Phylogenomic analysis of echinoderm class relationships supports Asterozoa. Proc R Soc. Lond B Biol Sci 281:20140479.

棘皮動物.

Bernta M, Bleidorn C, Braband A, Dambach J, Donath A, et al. 2013.
A comprehensive analysis of bilaterian mitochondrial genomes and phylogeny. Mol. Phylogenet. Evol. 69(2):352–64

左右相称動物・主要系統のミトコンドリアゲノム系統解析.

Mallatt J & Holland N (2013)
Pikaia gracilens Walcott: Stem Chordate, or Already Specialized in the Cambrian? J Exp Zool Part B 320b(4):247-271.

Osigus H-J, Eitel M, Bernt M, Donath A, Schierwater B. 2013a.
Mitogenomics at the base of Metazoa. Mol.Phylogenet. Evol. 69(2):339–51

動物・主要系統のミトコンドリアゲノム系統解析.

Perseke, M., Golombek, A., Schlegel, M., Struck, T.H., 2013.
The impact of mitochondrial genome analyses on the understanding of deuterostome phylogeny. Molecular Phylogenetics and Evolution 66, 898–905.

300 種のミトコンドリアゲノム解析.ゼノターベラは後口動物の根幹に分岐.尾索類が後口動物の根幹に分岐してしまう.長枝誘引が原因とする.水腔動物は単系統.18S rRNA と得られる結果が異なる.

Ryan, J.F., Pang, K., Schnitzler, C.E., Nguyen, A.D., Moreland, R.T., Simmons, D.K., Koch, B.J., Francis,W.R., Havlak, P., Program, N.C.S., Smith, S.A., Putnam, N.H., Haddock, S.H.D., Dunn, C.W.,Wolfsberg, T.G., Mullikin, J.C., Martindale, M.Q., Baxevanis, A.D., 2013.
The genome of the ctenophore Mnemiopsis leidyi and its implications for cell yype evolution. Science 342, 1242592.

Berna L, D'Onofrio G, & Alvarez-Valin F (2012)
Peculiar patterns of amino acid substitution and conservation in the fast evolving tunicate Oikopleura dioica. Mol Phylogenet Evol 62(2):708-717.

Stach T, Braband A, & Podsiadlowski L (2010)
Erosion of phylogenetic signal in tunicate mitochondrial genomes on different levels of analysis. Mol. Phylogen. Evol. 55(3):860-870.

ミトコンドリアゲノム解析により尾索動物と脊椎動物の姉妹群関係を支持.

Tsagkogeorga G, et al. (2009)
An updated 18S rRNA phylogeny of tunicates based on mixture and secondary structure models. BMC Evol. Biol. 9:187.

Singh TR, et al. (2009)
Tunicate mitogenomics and phylogenetics: peculiarities of the Herdmania momus mitochondrial genome and support for the new chordate phylogeny. BMC Genomics 10:534.

ミトコンドリアゲノム解析により尾索動物と脊椎動物の姉妹群関係を支持.

Tsagkogeorga G, Turon X, Galtier N, Douzery EJ, & Delsuc F (2010)
Accelerated evolutionary rate of housekeeping genes in tunicates. J. Mol. Evol. 71(2):153-167.

Berna, L., Alvarez-Valin, F. & D’Onofrio, G. 2009.
How fast is the sessile ciona? Comp. Funct. Genomics 2009, 875901.

Ciona intestinalis と C. savignyi の分岐年代を 184 Mya と推定.

Brown, F.D., Prendergast, A., Swalla, B.J., 2008.
Man is but a worm: chordate origins. Genesis 46, 605–613.

総説.

Delsuc F, Tsagkogeorga G, Lartillot N, & Philippe H (2008)
Additional Molecular Support for the New Chordate Phylogeny. Genesis 46(11):592-604.

脊索動物の分子系統解析.オタマボヤの枝長が長い.

Dunn CW, Hejnol A,Matus DQ, Pang K, BrowneWE, et al. 2008.
Broad phylogenomic sampling improves resolution of the animal tree of life. Nature 452(7188):745–49

Putnam NH, et al. 2008.
The amphioxus genome and the evolution of the chordate karyotype. Nature 453: 1064-1071. Web. Supple. JGI.

ナメクジウオゲノム解読論文.21,900 タンパク質遺伝子を推定.1090 遺伝子から得られたアミノ酸配列に基づき,(ナメクジウオ,(ホヤ,脊椎動物)); という関係を示唆.

Satoh N (2008)
An aboral-dorsalization hypothesis for chordate origin. Genesis 46(11):614-622.

総説.

Swalla, B.J., Smith, A.B., 2008.
Deciphering deuterostome phylogeny: molecular, morphological and palaeontological perspectives. Philosophical Transactions of the Royal Society B: Biological Sciences 363, 1557–1568.

Ueshima, R. 謎の動物,珍渦虫.東大理学部.web

Mallatt J, Winchell CJ. 2007.
Ribosomal RNA genes and deuterostome phylogeny revisited: More cyclostomes, elasmobranchs, reptiles, and a brittle star. Molec Phylogen Evol 43:1005–1022.

Delsuc, F., Brinkmann, H., Chourrout, D. and Philippe, H. 2006.
Tunicates and not cephalochordates are the closest living relatives of vertebrates, Nature, 439, 965–968.

ゲノムから得たアミノ酸配列データに基づき,尾索動物が脊椎動物の姉妹群と指摘.

Vienne A, Pontarotti P. 2006.
Metaphylogeny of 82 gene families sheds a new light on chordate evolution. Internl J Biolog Sci 2:32–37.

Blair JE, Hedges SB. 2005.
Molecular phylogeny and divergence times of deuterostome animals. Mol Biol Evol 22:2275–2284.

Delsuc, F., Brinkmann, H. and Philippe, H. 2005.
Phylogenomics and the reconstruction of the tree of life, Nature Reviews Genetics, 6, 361–375.

Philippe H, Lartillot N, Brinkmann H. 2005.
Multigene Analyses of Bilaterian Animals Corroborate the Monophyly of Ecdysozoa, Lophotrochozoa, and Protostomia. Mol Biol Evol 22:1246–1253.

35 種,145 遺伝子データセットに対して長枝誘引を回避する処理を行って系統解析を行い,脱皮動物,冠輪動物,前口動物の単系統性を示す (Fig. 4).これまでは,左右相称動物主要系統の分子系統解析は,taxon sampling が荒いために,rRNA 解析で提示されたこれらの単系統群を示せずにいた.
 それぞれの単系統性を支持する形態と発生の形成を考察 (P1251右):脱皮動物では,脱皮が依存するホルモントリガー経路の一部が保存.冠輪動物ではらせん卵割.前口動物では原口の運命 (例外は多い).

Furlong RF, Holland PWH. 2002.
Bayesian phylogenetic analysis supports monophyly of Ambulacraria and of cyclostomes. Zoolog Sci 19:593–599.

Giribet, G. 2002.
Current advances in the phylogenetic reconstruction of metazoan evolution. A
new paradigm for the Cambrian explosion? Mol. Phylogenet. Evol. 24, 345-357.

Oda, H., Wada, H., Tagawa, K., Akiyama-Oda, Y., Satoh, N., Humphreys, T., Zhang, S.C., Tsukita, S., 2002.
A novel amphioxus cadherin that localizes to epithelial adherens junctions has an unusual domain organization with implications for chordate phylogeny. Evolution and Development 4, 426–434.

カドヘリンの分子構造が,(頭索動物,(尾索動物, 脊椎動物)) という系統関係を支持することを示す.

Cameron CB, Garey JR, & Swalla BJ (2000)
Evolution of the chordate body plan: New insights from phylogenetic analyses of deuterostome phyla. Proc Natl Acad Sci U S A 97(9):4469–4474.

翼鰓類が,半索動物の原始的な名残りをとどめたものではなく,高度に特殊化し,腸鰓類の仲間に対して側系統になることを示す.また,半索動物と棘皮動物が互いに近縁とする.この考えは,かつては少数意見であった (<Gee 2001).
 新口動物の各分岐に,特徴的な形質をマッピング (Fig. 2).

Kobayashi M, Furuya H, Holland PW. 1999.
Dicyemids are higher animals. Nature. 401:762.

Hox 遺伝子の一つ,DoxC 遺伝子配列に基づき,寄生生物ニハイチュウが冠輪動物に含まれると示唆.このことは,体腔の欠如など単純化した特徴が,左右相称動物の祖先的なものではなく二次的にえられたことを示す.

Jefferies, R.P.S., Brown, N.A., Daley, P.E.J., 1996.
The early phylogeny of chordates and echinoderms and the origin of chordate left-right asymmetry and bilateral symmetry. Acta Zoologica (Stockholm) 77, 101–122.

尾索動物と脊索動物の近縁性 (Olfactores) を最初に提示.両者で共有される咽頭の顕著な再改変が頭索動物にはないことに基づく.

Turbeville, J.M., Schulz, J.R., Raff, R.A., 1994.
Deuterostome phylogeny and the sister group of the chordates – evidence from molecules and morphology. Molecular Biology and Evolution 11, 648–655.

18S rRNA 遺伝子配列に基づいた後口動物の系統解析.

Wada H & Satoh N (1994)
Details of the evolutionary history from invertebrates to vertebrates, as deduced from the sequences of 18S rDNA. Proc Natl Acad Sci U S A 91(5):1801–1804.


脊椎動物
Shen XX, Liang D, Feng YJ, Chen MY, & Zhang P (2013)
A versatile and highly efficient toolkit including 102 nuclear markers for vertebrate phylogenomics, tested by resolving the higher level relationships of the caudata. Mol. Biol. Evol. 30(10):2235-2248.

UCSC が公開している脊椎動物 6 種のゲノムアライメントから,Blast と NJ 法による方法 (Shen et al. 2011) を用いて,長く (>700bp) 保存的 (35-9-% similarity) なエクソンを脊椎動物高次解析用の 102 タンパク質コーディング遺伝子座マーカとして選び,PCR 用のプライマーを発表.30 遺伝子マーカを用いて Caudata (サンショウウオ目) 10 科の系統解析を行う.将来的には 100 以上のマーカ遺伝子であれば,コストや手間を考えるとsequence capture 法を使った方が良いと考察.
意見: マーカ選択の根拠は PCR がやりやすい,ヒト染色体上で位置が散らばっている,などとしているが,オーソログなどは検討していない.

Shen XX, Liang D, Wen JZ, Zhang P (2011)
Multiple Genome Alignments Facilitate Development of NPCL Markers: A Case Study of Tetrapod Phylogeny Focusing on the Position of Turtles. Mol Biol Evol 28: 3237–3252.

UCSC Genome Browser の全配列データから,BLAST と NJ 法などを用いて四足類解析用の系統推定マーカを 21 個選定.四足類数種の配列を解読し,時間軸付き系統樹を推定.


哺乳類
Lei RH, et al. (2012)
PhyloMarker-A Tool for Mining Phylogenetic Markers Through Genome Comparison: Application of the Mouse Lemur (Genus Microcebus) Phylogeny. Evol Bioinform 8:423-435.

Song S, Liu L, Edwards SV, & Wu SY (2012)
Resolving conflict in eutherian mammal phylogeny using phylogenomics and the multispecies coalescent model. P Natl Acad Sci USA 109(37):14942-14947.

Coalescent phylogenetic analysis を哺乳類の大系統で行った. 従来の concatenate method が対応しきれない gene tree topology 間の違いを coalescent method はうまく適合するため,本研究で懸案の eutherian rooting 問題,primates 姉妹群問題を解決したと主張.447 核遺伝子それぞれの gene tree を最尤法で求めて,coalescent method によって全体を統合するらしい.concatenate method と比較.447 遺伝子の選定方法についてはまったく記述がない.

Hallstrom BM & Janke A (2010)
Mammalian evolution may not be strictly bifurcating. Mol. Biol. Evol. 27(12):2804–2816.

Nishihara, H., Hasegawa, M. and Okada, N. 2006.
Pegasoferae, an unexpected mammalian clade revealed by tracking ancient retroposon insertions, Proceedings of the National Academy of Sciences of the United States of America, 103, 9929–9934.


魚類
Vialle RA, et al. 2018.
Whole Genome Sequencing of the Pirarucu (Arapaima gigas) Supports Independent Emergence of Major Teleost Clades. Genome Biol Evol 10:2366-2379.

真骨類根幹の分岐は,アロワナ類+カライワシ類からなる系統と示唆.

Meyer BS, Matschiner M, & Salzburger W (2015)
A tribal level phylogeny of Lake Tanganyika cichlid fishes based on a genomic multi-marker approach. Mol Phylogenet Evol 83:56-71.

シクリッド tribe 間の系統解析.既存の研究を参照してプライマーを作成し,PCR によって 45 種,42 遺伝子座を解読.

Betancur-R, et al. 2013.
The Tree of Life and a New Classification of Bony Fishes.

Orti さんグループの条鰭類大系統論文.1416 条鰭類から得られた 21 核遺伝子マーカ (20853 bp) を用いて,条鰭類の時間軸付き系統樹を推定.

Near TJ et al. 2013.
Phylogeny and tempo of diversification in the superradiation of spiny-rayed fishes. Proceedings of the National Academy of Sciences of the United States of America. 101:12738-21743.

Acanthoomrphs 520 種から得られた核 10 遺伝子 (Near et al. 2012 の 9 遺伝子+ ENC1) の塩基配列に基づいて,37 化石較正点を用いて時間軸付き系統樹を推定.MEDUSA による Lineage Diversification rate を解析.

Zou M, Guo B, Tao W, Arratia G, He S (2012)
Integrating multi-origin expression data improves the resolution of deep phylogeny of ray-finned fish
(Actinopterygii). Sci Rep 2.

The authors combined the transcriptome sequences and publisehd EST data (in total 274 genes based on the OrthoSelect) to examine basal divergences within euteleosts.

Near TJ, et al. (2012)
Resolution of ray-finned fish phylogeny and timing of diversification. Proc Natl Acad Sci U S A 109(34):13698-13703.

条鰭類 232 種から得られた核 9 遺伝子 (Glyt, myh6, plagl2,Ptr, rag1, SH3PX3, sreb2, tbr1, and zic1) の塩基配列 (7585bp) に基づいて時間軸付き系統樹を推定.第 3 座位も用いている様子.27 パーティテョンを設定した RAxML と BEAST による解析.ガーとアミアは 1 種づつで Holostei を形成.Elopomorpha が Teleostei 根幹で分岐.

Li CH, Riethoven JJM, & Naylor GJP (2012)
EvolMarkers: a database for mining exon and intron markers for evolution, ecology and conservation studies. Mol Ecol Resour 12(5):967-971.

Coding sequence (CDS) か Exon primed-intron-crossing (EPIC) マーカ論文.すでに公開されている動物 82 種のゲノム配列から上記マーカを探索する検索データベース EvolMatkers を発表. BLAST によって single-copy CDS を検索.

Shen XX, Liang D, & Zhang P (2012)
The development of three long universal nuclear protein-coding locus markers and their application to osteichthyan phylogenetics with nested PCR. Plos One 7(6):e39256.

Shen (2011) によって選定された四足類用 21 系統推定マーカから,配列の長い KIAA1239, SACS, TTN を Osteichthyans (硬骨魚類) の系統解析にさらに選定.数十種で配列を解読し,そのパフォーマンスを RAG1 を含めて比較.

Near TJ, et al. 2012.
Ancient climate change, antifreeze, and the evolutionary diversification of Antarctic fishes. Proceedings of the National Academy of Sciences of the United States of America 109: 3434-3439.  PDF

2 mt遺伝子と Li et al. (2007) があげた 5 核遺伝子を用いて,ノトセニアの分岐年代を推定.

Negrisolo E, et al. (2010)
Different phylogenomic approaches to resolve the evolutionary relationships among model fish species. Mol. Biol. Evol. 27(12):2757-2774.

Bargelloni グループによる Phylogenomics 論文.ヨーロピアンシーバスのゲノム配列 1.2 million base pairs を BAC ライブラリーから読んだため,何とか論文化した模様.Zebrai, Stback, Medaka, Tetraodon, Takifugu と並べてデータセットを作成し,ベイズ法 vs ML 法,データセットおよびパーティションなどの違いによるパフォーマンスを議論.データセットは遺伝子別のアライメントだけでなく,ゲノム配列をそのままアライメントしたものも試している.オーソログ判定は,染色体上の領域の比較に基づく.
意見:途中で読むのを止めてしまったが,かなり疑問を感じる論文.

Li C, Riethoven JJ, & Ma L (2010)
Exon-primed intron-crossing (EPIC) markers for non-model teleost fishes. BMC Evol. Biol. 10:90.

Li C, et al. 2007.
A practical approach to phylogenomics: the phylogeny of ray-finned fish (Actinopterygii) as a case study. BMC Evol Biol 7: 44

重要.ゼブラフィッシュとフグゲノムをBLAST 検索することで single-copy gene 収集し,条鰭類高次系統解析用の 154 遺伝子マーカを選定.3 つの選定基準に従ってパイプラインを作成: (i) オーソロガス遺伝子, (ii) Exon 領域の長いタンパク質遺伝子, (iii) 進化速度の遅い遺伝子.オーソロジーは系統樹を書いて ortholog を拾っている訳ではない.3R-WGD 後でも single-copy gene は dosage compensation のためにパートナー遺伝子をすぐに失っていると仮定 (P2 右中段).
 ここで取り上げられた 10 遺伝子は,Li や Near, Kawahara らが解析に使用.


植物
Zhang N, Zeng LP, Shan HY, & Ma H (2012)
Highly conserved low-copy nuclear genes as effective markers for phylogenetic analyses in angiosperms. New Phytol. 195(4):923-937.

Curto MA, Puppo P, Ferreira D, Nogueira M, & Meimberg H (2012)
Development of phylogenetic markers from single-copy nuclear genes for multi locus, species level analyses in the mint family (Lamiaceae). Mol. Phylogen. Evol. 63(3):758-767.

Duarte, JM, et al. 2010.
Identification of shared single copy nuclear genes in Arabidopsis, Populus, Vitis and Oryza and their phylogenetic utility across various taxonomic levels. BMC Evolutionary Biology 10.

MCL という BLAST base の方法によって,植物 4 種から 959 single copy gene を系統推定マーカーとして選定.

Wu FN, Mueller LA, Crouzillat D, Petiard V, Tanksley SD. 2006
Combining bioinformatics and phylogenetics to identify large sets of single-copy orthologous genes (COSII) for comparative, evolutionary and systematic studies: a test case in the euasterid plant clade. Genetics 174, 1407–1420. (doi:10.1534/genetics.106.062455)

Soltis, D. E. et al., 2004.
Genome-scale data, angiosperm relationships, and “ending incongruence”: A cautionary tale in phylogenetics, Trends in Plant Science, 9, 477–483.


その他の分類群
Adekambi T, et al. (2011)
Core Gene Set As the Basis of Multilocus Sequence Analysis of the Subclass Actinobacteridae. Plos One 6(3).

バクテリアの系統解析に有用な遺伝子を,全ゲノムデータから選定.

Aguileta G, et al. 2008.
Assessing the Performance of Single-Copy Genes for Recovering Robust Phylogenies. Syst Biol 57: 613-627.

菌類 30 種のトランスクリプトームデータから single-copy gene を BLAST 検索によって抽出.


配列解読方法
Li C, Hofreiter M, Straube N, Corrigan S, & Naylor GJ (2013)
Capturing protein-coding genes across highly divergent species. BioTechniques 54(6):321-326.

Gene capture 法の開発.DNA hybridization capture (gene capture) 法により硬骨魚類主要系統のように遺伝的に離れたグループから標的タンパク質遺伝子配列を網羅的に収集し NGS によって解読する技術を開発.同様の技術は Ultraconserved elements にも用いられてきたが (e.g., Faircloth et al. 2012), タンパク質遺伝子配列はより多様性が高く,hybridization の過程で工夫が必要.本研究ではこの問題を,「2 回の gene capture を行う過程で,一回目に capture された産物を鋳型として 2 回目の capture を行う」ことで回避 (P321 右下).


Coalescent theory

Gatesy J, et al. (2017)
Resolution of a concatenation/coalescence kerfuffle: partitioned coalescence support and a robust family-level tree for Mammalia. Cladistics 33(3):295-332.

論争となっている supermatirx (concatenation) method と MP-EST coalescence analysis 間で得られる異なる結果に,partitioned colaescence support によって解決策を見出したと主張. 哺乳類 169 taxa, 26 遺伝子座のデータを解析.

Xu, B. & Yang, Z. 2016.
Challenges in species tree estimation under the multispecies coalescent model. Genetics 204, 1353–1368.

総説.MSC (multiplespecies coalescent model) model による種の系統樹推定の統計的性質.
 遺伝子と種の系統樹が異なる理由は 3 つ考えられる:(i) オーソログ判定ミスと関連した遺伝子の重複と欠失,(ii) 雑種形成,遺伝子移入,種間での遺伝子水平伝搬,(iii) 不完全遺伝子系統仕分け incomplete lineage sorting (ILS).この論文では ILS にだけ注目する.

Edwards SV, et al. (2016)
Implementing and testing the multispecies coalescent model: A valuable paradigm for phylogenomics. Mol Phylogenet Evol 94(Pt A):447-462.

Sapringer and Gatesy (2016) による Multispecies coalescent model 批判への回答.

Springer, M.S., Gatesy, J., 2016.
The gene tree delusion. Mol. Phylogenet. Evol. 94, 1–33.

Liu, L., Xi, Z., Wu, S., Davis, C. C. & Edwards, S. V. 2015.
Estimating phylogenetic trees from genome-scale data. Ann. NY Acad. Sci. 1360,
36–53.

総説.

Springer, M. S. & Gatesy, J. 2014.
Land plant origins and coalescence confusion. Trends Plant Sci. 19, 267–269 (2014).

Mirarab, S. et al. 2014.
ASTRAL: genome-scale coalescent-based species tree estimation. Bioinformatics 30, i541–i548.

遺伝子ごとに求めた系統樹を一つの系統樹にまとめるソフトウェア,ASTRAL の紹介.

Shaw TI, Ruan Z, Glenn TC, Liu L. 2013.
STRAW: Species TRee Analysis Web server. Nucleic Acids Res. 41:W238-241.

Liu L, Yu L, Edwards SV. 2010b.
A maximum pseudo-likelihood approach for estimating species trees under the coalescent model. BMC Evol Biol. 10:302.


Kubatko, L., Degnan, J., 2007.
Inconsistency of phylogenetic estimates from concatenated data under coalescence. Syst. Biol. 56, 17–24.


'Constant but different' gene marker

Papillon, D. et al. (2004)
Identification of chaetognaths as protostomes is supported by the analysis of their mitochondrial genome. Mol. Biol. Evol. 21, 2122–2129

Chaetognaths (毛顎動物) の系統的位置を推定.Telford and Copley (2011) が有望とする,新しいタイプの分子共有派生形質を提示.ND5 遺伝子で,明瞭なアミノ酸変化が系統特異的に生じている.


UCE

UCE (ultra conserved element) 超高度保存領域.遺伝子間領域に存在.遺伝子コード領域を上回る保存度を示す.詳しくはこちらを参照.
 UCE 配列をアライメントして脊椎動物の高次系統解析に用いる研究が,2012 年あたりから盛んに発表されるようになった.


Gilbert PS, Chang J, Faircloth B, Alfaro ME. 2012. Genome-wide ultraconserved elements exhibit higher phylogenetic informativeness than traditional fish markers. Integrative and Comparative Biology 52:E65-E65.

Percomorphs の解析では,従来のサンガー法で収集した配列データよりも,UCE の方が phylogenetic informativeness が全体では 10-100 倍高い (遺伝子ごとではほぼ同じ) と主張.Percomorphs 8 種で,UCE 中心領域,UCE に隣接した配列,従来用いられてきた 10 核タンパク質遺伝子配列を比較.UCE データが未解決な percomorphs の解明に有効とする.真骨類得意的 WGD については触れられていない.

McCormack JE, Hird SM, Zellmer AJ, Carstens BC, Brumfield RT 2013.
Applications of next-generation sequencing to phylogeography and phylogenetics. Molecular Phylogenetics and Evolution 66: 526-538.

次世代シーケンサを使った系統解析について現状を総説. UCE を中心に,実験手順と解析マーカについて広く浅く紹介.

Ravi V, Venkatesh B. 2008.
Rapidly evolving fish genomes and teleost diversity. Curr Opin Genet Dev 2008, 18:544–550.

Venkatesh B, et al. (2006)
Ancient noncoding elements conserved in the human genome. Science 314(5807):1892-1892.


魚類
Eytan RI, Evans BR, Dornburg A, Lemmon AR, Lemmon EM, Wainwright PC, Near TJ. 2015.
Are 100 enough? Inferring acanthomorph teleost phylogeny using Anchored Hybrid Enrichment. BMC Evolutionary Biology 15.

AHE (anchored hybrid enrichment) 法でゲノムワイドに収集した保存的なコーディング領域 (100 遺伝子座? エクソン断片だと思う) が,真骨類高次系統解析に有用か検討.
核遺伝子データに基づくシクリッドと近縁種 (新設分類群 Ovanletaria) の系統関係を答えとした.AHE 解析は主要な分岐を解明できず,有用性を見いだせなかった.Paralog picker でオーソログ判定 (P17左上).ゲノムワイドなデータでのオーソログ判定は大変すぎる? とする (P15右上).
意見:オーソログ判定は非常に重要 (P2 右下) としながらも,充分な検討はなされていない.Concatenate した配列の結果,Ovalentaria が単系統になった (P11 右) ことを根拠にしている.しかし,オーソログ判定は,まずは遺伝子 (この研究でいう遺伝子座,エクソン断片?) ごとに行うもの.正確なオーソログ判定ができない以上,Enrichment 法は高次系統解析には使えないのでは.

Faircloth BC, Sorenson L, Santini F, Alfaro ME (2013)
A Phylogenomic Perspective on the Radiation of Ray-Finned Fishes Based upon Targeted Sequencing of Ultraconserved Elements (UCEs). PLoS ONE 8(6): e65923. Data.

500 UCE 配列 (149,246bp) に基づいて条鰭類 27 種の系統関係を推定.イトヨとメダカ間のゲノムアライメントから完全に同じ 80bp の UCE 領域として,ゼブラやフグ 2 種と比較することで プローブを作成.Sequence capture 法によって total DNA から UCE 領域を解読.
意見: アライメントデータでは,種ごとに欠失している領域が多数見られる.

鳥類
Prum RO, Berv JS, Dornburg A, Field DJ, Townsend JP, Lemmon EM, Lemmon AR. 2015.
A comprehensive phylogeny of birds (Aves) using targeted next-generation DNA sequencing. Nature.

McCormack J, Harvey M, Faircloth B, Crawford N, Glenn T, et al. (2013)
A phylogeny of birds based on over 1,500 loci collected by target enrichment and high-throughput sequencing. PLoS ONE 8: e54848.


哺乳類
McCormack JE, Faircloth BC, Crawford NG, Gowaty PA, Brumfield RT, Glenn TC 2012.
Ultraconserved elements are novel phylogenomic markers that resolve placental mammal phylogeny when combined with species-tree analysis. Genome Research 22: 746-754.


爬虫類
Crawford NG, Faircloth BC, McCormack JE, Brumfield RT, Winker K, Glenn TC 2012.
More than 1000 ultraconserved elements provide evidence that turtles are the sister group of archosaurs. Biology Letters 8: 783-786.


方法論
Lemmon AR, Emme SA, & Lemmon EM (2012)
Anchored hybrid enrichment for massively high-throughput phylogenomics. Syst. Biol. 61(5):727-744. Data.

ヒトやゼブラフィッシュなど脊椎動物 5 種のゲノムアライメントから,以下の条件 (P728, 右中央) にあう 500 遺伝子座をマーカとして選定: 可変的な部分に連結した保存領域,ゲノム内で特異的 (i.e., single-copy), ゲノム全般に広がっている.クオリティーの高い遺伝子座を選定し,8 四足類 (32 遺伝子座) と 6 羊膜類 (123 遺伝子座) からなる concatenated データを作成し解析,公開.UCE 解析 (Faircloth et al. 2012) と類似しているが,マーカが異なる.
意見: Faircloth et al. (2013) の条鰭類論文とは異なり,得られたデータから deletion のあるサイトは外している.充分な Ortholog / Paralog 判定は行っていない.

Faircloth B, McCormack J, Crawford N, Harvey M, Brumfield R, et al. (2012)
Ultraconserved elements anchor thousands of genetic markers for target enrichment spanning multiple evolutionary timescales. Syst Biol 61: 717–726.

UCE 領域を sequence capture 法によって収集する方法を開発.ニワトリとアノールのゲノムアライメントから UCE 領域を選定.UCE は部分的な重複やコピーが非常に少ないという Derti (2006) の主張から,パラログ問題を回避しようと画策.Missing data による悪影響は,よくわからないというスタンス.The effect of missing data in phylogenetic analysis is not well known (P724 右,中上).
意見:P717 右下に系統マーカとしての UCE の特徴を列挙しているが,やや的外れか.UCE のオーソロジー判定は,染色体上の位置関係から得ているのだろう.おそらく UCE 判定をゲノムアライメントから行っているため,比較する配列同士が染色体上の相同な位置関係にあると判断している模様.

Stephen S, Pheasant M, Makunin IV, Mattick JS 2008.
Large-scale appearance of ultraconserved elements in tetrapod genomes and slowdown of the molecular clock. Molecular Biology and Evolution 25: 402-408.

they are found in high numbers througout the genome (<= Faircloth et al. 2012).
意見: Synteny からオーソロジーを判定している模様.The initial 3-way mouse-human-rat comparisons defined the original set of UCEs as syntenically equivalent sequences (i.e. those that are located in orthologous regions) that a re identical among these species….

Derti A, Roth FP, Church GM, Wu CT 2006.
Mammalian ultraconserved elements are strongly depleted among segmental duplications and copy number variants. Nature Genetics 38: 1216-1220.

they (UCEs) do not intersect with most types of paralogous genes (<= Faircloth et al. 2012).

microRNA

系統特異的なマイクロ RNA (miRNA) の有無によってクレードの信頼性を評価.

microRNA とは:
細胞内に存在する長さ 20〜25 塩基ほどの RNA.タンパク質へは翻訳されない.他の遺伝子の発現を調節する機能をもつとされる ncRNA (ノンコーディング RNA: タンパク質へ翻訳されるに機能する RNA の総称) の一種.miRNA は,核内から細胞質に移動し成熟するまでにタンパク質と複合体を形成し,自らと部分的に相補的な mRNA に結合してこれを無能化する (特定のタンパク質が翻訳されることを阻害する) と考えられている (土井ら, 2007).


総説
Tarver JE, et al. (2013)
miRNAs: Small Genes with Big Potential in Metazoan Phylogenetics. Mol. Biol. Evol. 30(11):2369-2382.

系統解析に有用な Classical Rare Genomic Changes (RGC: ROkas and Holland, 2000) の一つとして,microRNA をレビュー.他のマーカに比べて,ノイズとなるホモプラシー,二次的ロス,収斂が少ない,などの特徴が系統解析に有利と示唆 (Conclusiotn).
 新たに microRNA を探すときは,モチーフ配列ではなく,ヘアピンを組む二次構造のみで同定.すでに知られているファミリーの配列を探すときは,配列類似性に依存 (P2371 右下).
意見: 本論文でも指摘されているように (P2380 中段),オーソロジーを配列の類似性だけで評価している点は問題.microRNA は非常に短いヘアピン構造をくむ特殊な構造を持っているが,それだけに機能的な制約が強く収斂のような状態で類似した配列をオーソログと誤って判断することは,本当にないのだろうか. また,microRNA の論文では,1) 共有派生形質となるマーカをゲノム配列から見つける,2) これまで知られている microRNA 遺伝子 (ファミリー?) の有無からデータマトリクスを作成して解析を行う,の二つの解析を別として扱っているが,実際には 1) の共有派生形質は 2) の解析を行って初めてわかるものではなかろうか.

Tarver JE, Donoghue PC, & Peterson KJ (2012)
Do miRNAs have a deep evolutionary history? Bioessays 34(10):857-866.

従来 microRNA は動物と植物で独立した起源を持っていると考えられてきたが,最近,単細胞の真核生物から microRNA が報告されている.microRNA の進化的起源を考察.

Bartel DP. 2009.
MicroRNAs: target recognition and regulatory functions. Cell 136:215–233

Berezikov E. 2011.
Evolution of microRNA diversity and regulation in animals. Nat Rev Genet. 12:846–860.


ウェブサイト
miRDeep2

解読して得られた配列から microRNA 配列を検索するするパールスクリプト集.すでに知られている配列だけでなく,新たなものも検索してくれる模様.

Friedlander MR, Mackowiak SD, Li N, Chen W, & Rajewsky N (2012)
miRDeep2 accurately identifies known and hundreds of novel microRNA genes in seven animal clades. Nucleic Acids Res. 40(1):37-52.

miRDeep 作成の論文.

Friedlander MR, et al. (2008)
Discovering microRNAs from deep sequencing data using miRDeep. Nat. Biotechnol. 26(4):407-415.

miRMiner, mirDeep-P, miRtools, MIREAP, miRExpress.


miRBase

microRNA のデータベース.これまで同定されている miRNA が種ごとにまとめられている.

Kozomara A & Griffiths-Jones S (2011)
miRBase: integrating microRNA annotation and deep-sequencing data. Nucleic Acids Res. 39:D152-D157.


円口類
Heimberg AM, Cowper-Sallari R, Semon M, Donoghue PCJ, & Peterson KJ (2010)
microRNAs reveal the interrelationships of hagfish, lampreys, and gnathostomes and the nature of the ancestral vertebrate. P Natl Acad Sci USA 107(45):19379-19383.

円口類の単系統性を microRNA 解析によって支持.共有派生形質として microRNA マーカ 4 遺伝子ファミリーを発見.形態データマトリクスを再解析し,円口類が単系統とならない従来の結果は,形質のコーディングに問題があったと指摘.

四足類
Lyson TR, et al. (2012)
MicroRNAs support a turtle plus lizard clade. Biol. Lett. 8(1):104-107.

microRNA の有無を解析し,カメ類の系統的位置を推定,トカゲ類と姉妹群となることを示唆する 4 microRNA を報告.

哺乳類
Hoeppner MP & Poole AM (2012)
Comparative genomics of eukaryotic small nucleolar RNAs reveals deep evolutionary ancestry amidst ongoing intragenomic mobility. BMC Evol. Biol. 12.

Hoeppner MP, White S, Jeffares DC, & Poole AM (2009)
Evolutionarily Stable Association of Intronic snoRNAs and microRNAs with Their Host Genes. Genome Biol Evol 1:420–428.



その他
Fromm B, Worren MM, Hahn C, Hovig E, & Bachmann L (2013)
Substantial Loss of Conserved and Gain of Novel MicroRNA Families in Flatworms. Mol. Biol. Evol. 30(12):2619-2628.

microRNA 解析によって,扁形動物内部の系統関係とその系統的位置を推定.

Peterson KJ, Su YH, Arnone MI, Swalla B, & King BL (2013)
MicroRNAs support the monophyly of enteropneust hemichordates. J Exp Zool Part B 320(6):368-374.

Pisani D, Feuda R, Peterson KJ, & Smith AB (2012)
Resolving phylogenetic signal from noise when divergence is rapid: A new look at the old problem of echinoderm class relationships. Mol. Phylogen. Evol. 62(1):27-34.

棘皮動物 (echinoderms) の系統関係を核 rRNAやハウスキーピング遺伝子,microRNA データに基づいて解析.対象とする分岐が短期間に集中していたため,microRNA データからは系統解析に有用なデータは見受けられなかったとする.

Helm C, Bernhart SH, Siederdissen CHZ, Nickel B, & Bleidorn C (2012)
Deep sequencing of small RNAs confirms an annelid affinity of Myzostomida. Mol. Phylogen. Evol. 64(1):198-203.

吸口虫類の系統的位置を microRNA データによって推定.

Campbell LI, et al. (2011)
MicroRNAs and phylogenomics resolve the relationships of Tardigrada and suggest that velvet worms are the sister group of Arthropoda. P Natl Acad Sci USA 108(38):15920-15924.

EST と microRNA データに基づいて,節足類の姉妹群を推定.

Rota-Stabelli O, et al. (2011)
A congruent solution to arthropod phylogeny: phylogenomics, microRNAs and morphology support monophyletic Mandibulata. P Roy Soc B-Biol Sci 278(1703):298-306.

198 核タンパク質遺伝子と microRNA データに基づいて節足動物の主要系統の類縁関係を推定.

Wiegmann BM, et al. (2011)
Episodic radiations in the fly tree of life. P Natl Acad Sci USA 108(14):5690-5695.

ミトコンドリアおよび核遺伝子配列,microRNA データに基づいて,双翅目 (Diptera) の系統解析を行い,Drosophila の姉妹群を推定.

Wheeler BM, Heimberg AM, Moy VN, Sperling EA, Holstein TW, Heber S, Peterson KJ. 2009.
The deep evolution of metazoan microRNAs. Evol Dev. 11:50–68.

Li SC, et al. (2010)
Identification of homologous microRNAs in 56 animal genomes. Genomics 96(1):1-9.

Prochnik SE, Rokhsar D, Aboobaker AA. 2007.
Evidence for a microRNA expansion in the bilaterian ancestor. Dev Genes Evol. 217:73–77.

Sempere LF, Cole CN, McPeek MA, Peterson KJ. 2006.
The phylogenetic distribution of metazoan microRNAs: insights into evolutionary
complexity and constraint. J Exp Zool B Mol Dev Evol. 306B:575–588.

Hertel J, Lendemeyer M, Missal K, Fried C, Tanzer A, Flamm C, Hofacker IL, Stadler PF. 2006.
The expansion of the metazoan microRNA repertoire. BMC Genomics 7:25.


RAD sequence data

Takahashi T, Nagata N, Sota T. 2014.
Application of RAD-based phylogenetics to complex relationships among variously related taxa in a species flock. Molecular Phylogenetics and Evolution 80:137-144.

Wagner CE, Keller I, Wittwer S, Selz OM, Mwaiko S, Greuter L, et al. 2013.
Genome-wide RAD sequence data provide unprecedented resolution of species boundaries and relationships in the Lake Victoria cichlid adaptive radiation. Mol Ecol. 2013;22(3):787–98.

Wagner et al showed a striking exmple of the power of large datasets (Etan et al. 2015, P14 right middle).

Cariou M, Duret L, Charlat S. 2013.
Is RAD-seq suitable for phylogenetic inference? An in silico assessment and optimization. Ecology and Evolution 3:846-852.

12 Drosophila genome (分岐年代は 5-63 Mya)を用いて RAD-seq がどの程度系統解析に有用か検証.BLAST や SiLiX など配列類似性に基づく方法でオーソロジー判定が可能とする.

Rubin BER, Ree RH, Moreau CS. 2012.
Inferring Phylogenies from RAD Sequence Data. Plos One 7.

Drosophila, 哺乳類,酵母それぞれ内部の主要系統間の系統解析に,RAD-seq 法が有用か know phylogeny を用いて検証.分岐の浅い Drosophila 内部 (60 Mya) では良かったが,100-300 Mya にわたる哺乳類や酵母の系統解析は成功しなかったと報告.十分な両のオーソログが保持される程度の若い分岐の解明に RAD-sequence は有用と指摘.

Hohenlohe PA, et al. 2010.
Population Genomics of Parallel Adaptation in Threespine Stickleback using Sequenced RAD Tags. PLoS Genetics 6.

系統解析ではないが,エコゲノミクスでも紹介されている有名な論文.淡水と海水のイトヨ 5 集団 100 個体から RAD 法によって 45,000 以上の SNP を収集.平行的な淡水適応に関与した候補遺伝子を複数同定.



レトロポゾン

総説
Shedlock, A. M. and Okada, N. 2000.
SINE insertions: Powerful tools for molecular systematics, Bioessays, 22, 148–160.

Hillis, D.M. (1999)
SINEs of the perfect character. Proc. Natl. Acad. Sci. U.S.A. 96, 9979–9981


真獣類
Murphy, W. J., Pringle, T. H., Crider, T. A., Springer, M. S. and Miller, W. 2007.
Using genomic data to unravel the root of the placental mammal phylogeny, Genome Research, 17, 413–421.

Kriegs, J. O., Churakov, G., Kiefmann, M., Jordan, U., Brosius, J. and Schmitz, J. 2006.
Retroposed elements as archives for the evolutionary history of placental mammals, PLoS Biology, 4, e91.

Nishihara, H., Hasegawa, M. and Okada, N. 2006.
Pegasoferae, an unexpected mammalian clade revealed by tracking ancient retroposon insertions, Proceedings of the National Academy of Sciences of the United States of America, 103, 9929–9934.

Sasaki, T., et al. 2006.
Extensive morphological convergence and rapid radiation in the evolutionary history of the family Geoemydidae(old world pond turtles)revealed by SINE insertion analysis, Systematic Biology,
55, 912–927.

Nishihara, H., Satta, Y., Nikaido, M., Thewissen, J. G., Stanhope, M. J. and Okada, N. 2005.
A retroposon analysis of Afrotherian phylogeny, Molecular Biology and Evolution, 22, 1823-1833.

Nikaido, M., et al. 2001.
Retroposon analysis of major cetacean lineages: The monophyly of toothed whales and the paraphyly of river dolphins, Proceedings of the National Academy of Sciences of the United States of America, 98, 7384–7389.

Nikaido, M., Rooney, A. P. and Okada, N. 1999.
Phylogenetic relationships among cetartiodactyls based on insertions of short and long interpersed elements: Hippopotamuses are the closest extant relatives of whales, Proceedings of the National Academy of Sciences of the United States of America, 96, 10261–10266 PDF.



系統解析の手法

Taxon sampling
Philippe H, Brinkmann H, Lavrov DV, Littlewood DTJ, Manuel M, Wörheide G, et al. 2011.
Resolving difficult phylogenetic questions: why more sequences are not enough. PLoS Biol. 9(3):e1000602.

Townsend JP, Lopez-Giraldez F. 2010.
Optimal selection of gene and ingroup taxon sampling for resolving phylogenetic relationships. Syst Biol. 59(4):446–57.

Heath TA, Hedtke SM, Hillis DM 2008.
Taxon sampling and the accuracy of phylogenetic analyses. Journal of Systematics and Evolution 46: 239-257.

Taxon sampling が系統樹推定や年代推定に及ぼす影響を総説.概して密な taxon sampling が良い結果を招くとする.

Zwickl DJ, Hillis DM. 2002.
Increased taxon sampling greatly reduces phylogenetic error. Syst Biol. 2002;51(4):588–98.

Graybeal A. 1998.
Is it better to add taxa or characters to a difficult phylogenetic problem? Syst Biol. 47(1):9–17.

Hillis DM. Inferring complex phylogenies. 1996.
Nature. 383(6596):130–1.


パーティション
Angelis K, Álvarez-Carretero S, Dos Reis M, & Yang Z (2017)
An Evaluation of Different Partitioning Strategies for Bayesian Estimation of Species Divergence Times. Syst. Biol.

Duchêne S., Molak M., Ho S.Y.W. 2014.
ClockstaR: choosing the number of relaxed-clock models in molecular phylogenetic analysis.
Bioinformatics 30:1017–1019.

Lanfear R, Calcott B, Kainer D, Mayer C, & Stamatakis A (2014)
Selecting optimal partitioning schemes for phylogenomic datasets. BMC Evol. Biol. 14:82.

Lanfear R, Calcott B, Ho SYW, & Guindon S (2012)
PartitionFinder: Combined Selection of Partitioning Schemes and Substitution Models for Phylogenetic Analyses. Mol. Biol. Evol. 29(6):1695-1701.

Li C, Lu G, Orti G. 2008.
Optimal data partitioning and a test case for ray-finned fishes (actinopterygii) based on ten nuclear loci. Syst Biol. 57:519-539.

Hashimoto T (2008)
複数遺伝子の結合データに基づく分子系統樹の推測. 統計数理 56(1):145–164.



Phylogenetic informativeness

PhyDesign

Dornburg A, Townsend JP, Friedman M, & Near TJ (2014)
Phylogenetic informativeness reconciles ray-finned fish molecular divergence times. BMC Evol. Biol. 14.

条鰭類の分岐年代推定.核とミトコンドリア遺伝子の PI を比較.

Lopez-Giraldez F, Moeller AH, Townsend JP. 2013.
Evaluating phylogenetic informativeness as a predictor of phylogenetic signal for metazoan, fungal, and mammalian phylogenomic data sets. Biomed Res Int. 2013:621604.

Fong JJ, Fujita MK. 2011.
Evaluating phylogenetic informativeness and data-type usage for new protein-coding genes across Vertebrata. Mol Phylogenet Evol. 61:300-307.

Schoch CL, et al. (2009)
The Ascomycota Tree of Life: A Phylum-wide Phylogeny Clarifies the Origin and Evolution of Fundamental Reproductive and Ecological Traits. Syst. Biol. 58(2):224-239.

Townsend JP, Lopez-Giraldez F, Friedman R 2008.
The Phylogenetic Informativeness of Nucleotide and Amino Acid Sequences for Reconstructing the Vertebrate Tree. Journal of Molecular Evolution 67: 437-447.

Townsend TM, Alegre RE, Kelley ST, Wiens JJ, Reeder TW 2008.
Rapid development of multiple nuclear loci for phylogenetic analysis using genomic resources: An example from squamate reptiles. Molecular Phylogenetics and Evolution 47: 129-142.

Squamate reptiles を例として,核ゲノムデータから系統解析に有用な 26 single-copy protein-coding loci (NPCL) を選定.BLAST を多用.選定方法は 3 phases よりなる (P131, 2.1): Phase 1. Human と Fugu ゲノムからオーソロガスな 26 NPCL を選定.>700bp 以上のみ選択.Phase 2. Chicken ゲノムに homolog を持っていて,primer 作成可能な遺伝子に絞り込む.Phase 3. データベースから利用可能な羊膜類の該当配列をダウンロード & アライメントし,プライマー設計.
意見:プライマーや 85 exon alignments をこちらから提供しているが,使いにくい.イントロは多少参考になる.

Townsend JP (2007)
Profiling phylogenetic informativeness. Syst. Biol. 56(2):222-231.

系統解析の解像度を定量的に示す指標について.


Supermatrix vs Supertree
Lang JM, Darling AE, Eisen JA. 2013.
Phylogeny of bacterial and archaeal genomes using conserved genes: supertrees and supermatrices. PLoS One 8:e62510.

Kupczok A, Schmidt HA, von Haeseler A (2010)
Accuracy of phylogeny reconstruction methods combining overlapping gene data sets. Algorithms
Mol Biol 5: 37.

Supermatrix の方が優れていると指摘 (Philippe et al. 2011).


欠失データ
Streicher JW, Schulte JA, Wiens JJ. 2016.
How should genes and taxa be sampled for phylogenomic analyses with missing data? An empirical study in iguanian lizards. Syst Biol. 65: 128-145.

Roure B, Baurain D, & Philippe H (2013)
Impact of Missing Data on Phylogenies Inferred from Empirical Phylogenomic Data Sets. Mol. Biol. Evol. 30(1):197-214.
 
古代 DNA

Dabney J, et al. (2013)
Complete mitochondrial genome sequence of a Middle Pleistocene cave bear reconstructed from ultrashort DNA fragments. P Natl Acad Sci USA 110(39):15758-15763.

中期更新世のホラアナグマから古代 DNA を抽出しミトコンドリアゲノム全長配列を解読.後期更新世のホラアナグマ約 25 種のデータと合わせて系統解析.

 

分岐年代推定

Method
Smith S, Brown JW, & Walker JF (2017)
So many genes, so little time: comments on divergence-time estimation in the genomic era. bioRxiv.

Warnock RCM, Yang Z, & Donoghue PCJ (2017)
Testing the molecular clock using mechanistic models of fossil preservation and molecular evolution. Proc Biol Sci 284(1857).

Tamura K, Tao Q, & Kumar S (2017)
Theoretical foundation of the RelTime method for estimating divergence times from variable evolutionary rates. MBE.

RelTime 法の根幹をなすメカニズム,RRF (relative rate framework) を解説.ベイズ年代推定と RRF の大きく異なる点は,RRF は枝から枝への速度変化にモデルを仮定しない点である (Discussion, Relationship of RRF with othe approaches).

Lozano-Fernandez J, Dos Reis M, Donoghue PCJ, & Pisani D (2017)
RelTime Rates Collapse to a Strict Clock When Estimating the Timeline of Animal Diversification. Genome Biol Evol 9(5):1320-1328.

RelTime 法は本質的に strict clock を仮定するため clock を relax させることができず,年代推定に用いるのは危険と示唆.RelTime 法によって動物主要系統間の年代推定を行った Battistuzzi et al. (2015) のデータをベイズ法で解析し,両者を比較.

Angelis K, Álvarez-Carretero S, Dos Reis M, & Yang Z (2017)
An Evaluation of Different Partitioning Strategies for Bayesian Estimation of Species Divergence Times. Syst. Biol.

Partitioning について.シミュレーション解析では,既存の partitioning ソフトウェアは,遺伝子はコドンなど単純な partitiong を上回る効果が観察されなかった (P14右下).

Mello B, Tao Q, Tamura K, & Kumar S (2017)
Fast and Accurate Estimates of Divergence Times from Big Data. Mol. Biol. Evol. 34(1):45-50.

ベイズ法によらない分岐年代推定 RelTime は,解析速度が速いが,MCMCTREE や BEAST と同じ結果が得られることを示す.ミトコンドリアゲノムは核ゲノムデータなど 8 つの大規模データを使用.

Barba-Montoya J, Dos Reis M, & Yang Z (2017)
Comparison of different strategies for using fossil calibrations to generate the time prior in Bayesian molecular clock dating. Mol Phylogenet Evol 114:386-400.

To TH, Jung M, Lycett S, & Gascuel O (2016)
Fast Dating Using Least-Squares Criteria and Algorithms. Syst. Biol. 65(1):82-97.

Donoghue PC & Yang Z (2016)
The evolution of methods for establishing evolutionary timescales. Philos Trans R Soc Lond B Biol Sci 371(1699).

総説.

dos Reis M, Donoghue PCJ, & Yang ZH (2016)
Bayesian molecular clock dating of species divergences in the genomics era. Nat. Rev. Genet. 17(2):71–80.

総説.

Kumar S, Stecher G, & Tamura K (2016)
MEGA7: Molecular Evolutionary Genetics Analysis Version 7.0 for Bigger Datasets. Mol. Biol. Evol. 33(7):1870-1874.

MEGA7.遺伝子重複の系統的位置を推定するオプションを解説.

Warnock RC, Parham JF, Joyce WG, Lyson TR, Donoghue PC. 2015.
Calibration uncertainty in molecular dating analyses: there is no substitute for the prior evaluation of time priors. Proc. R. Soc. B 282:20141013.

dos Reis M, et al. 2015.
Uncertainty in the timing of origin of animals and the limits of precision in molecular timescales. Curr Biol. 25:2939–2950.

Ho SYW & Duchene S (2014)
Molecular-clock methods for estimating evolutionary rates and timescales. Mol. Ecol. 23(24):5947–5965.

総説.

dos Reis, M. Zhu, T. and Yang, Z. 2014.
The impact of the rate prior on bayesian estimation of
divergence times with multiple loci. Systematic biology, 63:555–565, 2014.

複数の遺伝子座 (partition) を用いて年代推定を行う場合に,partition ごとの速度変化の事前分布はディリクレ分布を改定すべきとシミュレーション解析から示唆.多くのソフトウェアが用いる  i.i.d. (independent and identically distributed,独立同分布) では,ゲノムデータなど partition が多い場合に,速度事前分布を誤ると,信頼区間の非常に狭いおかしな推定年代が得られる.

Tamura K, Stecher G, Peterson D, Filipski A, Kumar S. 2013.
MEGA6: molecular evolutionary genetics analysis version 6.0. Mol Biol Evol. 30:2725–2729.

MEGA6 に RelTime 法による分岐年代推定のオプションを追加.

Tamura K, et al. (2012)
Estimating divergence times in large molecular phylogenies. Proc Natl Acad Sci U S A 109(47):19333-19338.

RelTime.

Warnock RC, Yang Z, Donoghue PC. 2012.
Exploring uncertainty in the calibration of the molecular clock. Biol. Lett. 8:156–159.

Erwin DH, et al. 2011.
The Cambrian conundrum: early divergence and later ecological success in the early history of animals. Science 334:1091–1097.

Zheng YC, Peng R, Kuro-O M, & Zeng XM (2011)
Exploring patterns and extent of bias in estimating divergence time from mitochondrial DNA sequence data in a particular lineage: a case study of salamanders (Order Caudata). Mol. Biol. Evol. 28(9):2521-2535.

ミトコンドリア遺伝子は進化速度が速すぎるので,数億年を超える分岐の年代を過大評価する,と指摘.

Yang, Z. 2006.
Computational Molecular Evolution. Oxford University Press, Oxford.

Hug, L. A., and A. J. Roger. 2007.
The Impact of Fossils and Taxon Sampling on Ancient Molecular Dating Analyses. Mol Biol Evol.

Benton, M. J., and P. C. J. Donoghue. 2007.
Paleontological evidence to date the tree of life. Mol. Biol. Evol. 24: 26-53.

Yang ZH, Rannala B. 2006.
Bayesian estimation of species divergence times under a molecular clock using multiple fossil calibrations with soft bounds. MOLECULAR BIOLOGY AND EVOLUTION 23 (1): 212-226.

Drummond AJ, Ho SYW, Phillips MJ, et al. 2006.
Relaxed phylogenetics and dating with confidence. PLOS BIOLOGY 4 (5): 699-710.

Rutschmann F. 2006.
Molecular dating of phylogenetic trees: A brief review of current methods that estimate divergence times. DIVERSITY AND DISTRIBUTIONS 12 (1): 35-48.

Thorne JL and Kishino K. 2005.
Estimation of divergence times from molecular sequence data. In: Statistics for Biology and Health. Nielsen R. (Ed). Springer, NY.

Renner SS. 2005.
Relaxed molecular clocks for dating historical plant dispersal events. TRENDS IN PLANT SCIENCE 10 (11): 550-558.

Linder HP, Hardy CR, Rutschmann F. 2005.
Taxon sampling effects in molecular clock dating: An example from the African Restionaceae
MOLECULAR PHYLOGENETICS AND EVOLUTION 35 (3): 569-582.

Magallon, S. A. 2004.
Dating lineages: Molecular and paleontological approaches to the temporal framework of clades. International Journal of Plant Sciences 165: S7-S21.

Hedges SB, Kumar S. 2004.
Precision of molecular time estimates. TRENDS IN GENETICS 20 (5): 242-247.

Graur D, Martin W. 2003.
Reading the entrails of chickens: molecular timescales of evolution and the illusion of precision. TRENDS IN GENETICS 20 (2): 80-86.

Bromham L, Penny D. 2003.
The modern molecular clock. NATURE REVIEWS GENETICS 4 (3): 216-224.

Hedges SB, Kumar S. 2003.
Genomic clocks and evolutionary timescales. TRENDS IN GENETICS 19 (4): 200-206.


Fossil records
The Fossil Record
http://www.fossilrecord.net/fossilrecord/index.html

Origin and Phylogenetic Interrelationships of Teleosts
http://www.amazon.co.jp/Origin-Phylogenetic-Interrelationships-Teleosts-Joseph/dp/3899371070

Benton, MJ, PCJ Donoghue, RJ Asher. 2009.
Calibrating and constraining molecular clocks. In: SB Hedges, S Kumar, editors. Timetree of Life: Oxford University Press. p. 35-86.

Benton, M. J., and P. C. J. Donoghue. 2007.
Paleontological evidence to date the tree of life.
Mol. Biol. Evol. 24: 26-53.

Benton, M. J. 2004.
Vertebrate Palaeontology, third ed.
Backwell, Malden. [Amazon]

Gradstein, F. M., J. G. Ogg, A. G. Smith, F. P. Agterberg, W. Bleeker, R. A. Cooper, V. Davydov, P. Gibbard, L. A. Hinnov, M. R. House, L. Lourens, H. P. Luterbacher, J. McArthur, M. J. Melchin, L. J. Robb, J. Shergold, M. Villeneuve, B. R. Wardlaw, J. Ali, H. Brinkhuis, F. J. Hilgen, J. Hooker, R. J. Howarth, A. H. Knoll, J. Laskar, S. Monechi, K. A. Plumb, J. Powell, I. Raffi, U. Ro¨hl, P. Sadler, A. Sanfilippo, B. Schmitz, N. J. Shackleton, G. A. Shields, H. Strauss, J. Van Dam, T. van Kolfschoten, J. Veizer, and D. Wilson. 2005.
A Geologic Time Scale 2004.
Cambridge University Press, Cambridge. [Website]

Benton, M. J., 1993.
The Fossil Record, vol. 2.
Chapman & Hall, London. [Amazon]

小沢智生 [in Japanese]
貝類食者の捕食活動と貝類の適応・進化.I.貝類食者の分化と貝類 の適応・進化.
海洋と生物(Aquabiology), 6(1), 2-8.(1984)

小沢智生 [in Japanese]
貝類食者の捕食活動と貝類の適応・進化.II.
海洋における貝類食 者と貝類の共進化.
海洋と生物(Aquabiology),6(3), 162-167. (1984)
http://research.kahaku.go.jp/u-tokyo/kase-ken/

G. J. Vermeij.
The Mesozoic marine revolution; evidence from snails, predators and grazers.
Paleobiology; July 1977; v. 3; no. 3; p. 245-258


全ゲノム重複

こちらです.